Автор Тема: Посоветуйте инструмент для поиска одноимённых файлов  (Прочитано 18045 раз)

0 Пользователей и 2 Гостей просматривают эту тему.

Оффлайн wwmax

  • Постоялец
  • ***
  • Сообщений: 177
Суть проблемы вот в чём: познакомился с одним коллекционером - коллекция фильмов ~10 000 общим объёмом более 18 терабайт(!!! и это только на винтах, на болванках вообще не поддаётся учёту).
Человек немного странненький и мягко говоря далёкий от дружбы с компьютерной техникой, умеет только запустить комп и включить фильм на воспроизведение, на винтах бардак страшенный - естественно очень много дублей фильмов, и не просто дублей: например фильмов "Сокровище нации" у него 5 штук, от экранки до БДрипа).

Вопрос:
С помощью чего можно найти все дублирующиеся фильмы, если имена у этих файлов иногда разные? например одна из копий у него называется Сокровише_нации, фильм K-PAX в 2-х вариантах КА-ПЭКС и Планета К-Пэкс много названий с разным написанием букв е и ё, ну и т.д.). И ещё: он так же любитель послушать музыку через свой домашний кинотеатр - и потому фильмы у него вперемешку с музыкой - так что видимо нужен поиск по расширениям avi; mkv; vob; mpeg; wmv; flv; iso исключив остальные (flac; ape; mp3; ogg; wma)
Вобщем посоветуйте пожалуйста инструмент поиска файлов с разным содержимым(отличающихся по размеру) - но с одинаковыми или похожими именами, желательно чтобы можно было так же распознать для сравнения имена на кирилице и транслитные имена (если это вообще возможно без какого-нибуть скрипта).

Хочу воспользоваться случаем пополнить свою коллекцию из россыпей этого доброго человека, но при этом выбрать самые качественные копии.

Спасибо :)
« Последнее редактирование: 12 Марта 2009, 23:01:41 от wwmax »
PVD v.0.9.9.29
*************
2x Intel(R) Core(TM)2 Duo CPU E6550 @ 2.33GHz
Windows XP Service Pack 2 build 2600

Оффлайн djek-ural

  • Модератор
  • *****
  • Сообщений: 1223
  • Фильмов много не бывает.
Суть проблемы вот в чём: познакомился с одним коллекционером - коллекция фильмов ~10 000 общим объёмом более 18 терабайт(!!! и это только на винтах, на болванках вообще не поддаётся учёту).
Человек немного странненький и мягко говоря далёкий от дружбы с компьютерной техникой, умеет только запустить комп и включить фильм на воспроизведение, на винтах бардак страшенный - естественно очень много дублей фильмов, и не просто дублей: например фильмов "Сокровище нации" у него 5 штук, от экранки до БДрипа).

Вопрос:
С помощью чего можно найти все дублирующиеся фильмы, если имена у этих файлов иногда разные? например одна из копий у него называется Сокровише_нации, фильм K-PAX в 2-х вариантах КА-ПЭКС и Планета К-Пэкс много названий с разным написанием букв е и ё, ну и т.д.). И ещё: он так же любитель послушать музыку через свой домашний кинотеатр - и потому фильмы у него вперемешку с музыкой - так что видимо нужен поиск по расширениям avi; mkv; vob; mpeg; wmv; flv; iso исключив остальные (flac; ape; mp3; ogg; wma)
Вобщем посоветуйте пожалуйста инструмент поиска файлов с разным содержимым(отличающихся по размеру) - но с одинаковыми или похожими именами, желательно чтобы можно было так же распознать для сравнения имена на кирилице и транслитные имена (если это вообще возможно без какого-нибуть скрипта).

Хочу воспользоваться случаем пополнить свою коллекцию из россыпей этого доброго человека, но при этом выбрать самые качественные копии.

Спасибо :)


Здесь в принципе пойдет любая программа для поиска , только надо уметь ей пользоваться , в параметрах поиска есть специальные символы которые работаю как маска , я например помню ? - любой символ , * - целое слово.
А для начала просто попробуй заменить в именах буквы на нормальные.
Или вот еще , мне когда то попалась программа которой скармливаеш папку с фильмами , а она в соответсвие с настройками формирует имя файлов , в которое включается качесто , кодеки ...

Оффлайн djek-ural

  • Модератор
  • *****
  • Сообщений: 1223
  • Фильмов много не бывает.
Посмотри программу ACD See любая версия , там хорошая функция есть для переименования файлов.

Оффлайн wwmax

  • Постоялец
  • ***
  • Сообщений: 177
Уважаемый djek-ural, спасибо, но проблема не в том чтобы переименовать все имена по единому стандарту (да и хозяин коллекции мне это не позволит - он то привык к своим именам фильмов) - проблема в том чтобы найти все копии одного фильма с именами которые иногда отличаются написанием, вплоть до того что одна копия названа на кирилице Кошмар на улице вязов (размером 680 мб), а другая копия по типу Koshmar_na_ulice_vyzov (размером 1400 мб) - вот мне бы хотелось себе забрать именно второй вариант. Ну это я конечно утрированный пример привёл, истинное положение немного попроще, но тем не менее вопрос "как такие дубли найти" остаётся (просматривать всё это глазами просто не реально)...
PVD v.0.9.9.29
*************
2x Intel(R) Core(TM)2 Duo CPU E6550 @ 2.33GHz
Windows XP Service Pack 2 build 2600

Оффлайн BSB

  • Постоялец
  • ***
  • Сообщений: 96
  • Таких не бывает!
    • http://realbsb.ru
Имхо, гиблая затея искать такую прогу. Посудите сами, кроме упомянутой разницы в наименовании, будет разница в качестве. При чем качество здесь упоминается художественное, а не техническое. Например, для подобной программы будет лучшим выбором оставить дергающуюся экранку, сжатую с разрешением 1024х768 (я к примеру, не помню стандарты), чем какой-нибудь качественный DVDRip с разрешением 800х600.

Я бы посоветовал использовать ДЛЯ КАЖДОГО фильма отдельный поиск по ряду ключевых слов. Подобной программе нет смысла быть, потому как с этим справится даже стандартный поиск файлов в XP

Оффлайн wwmax

  • Постоялец
  • ***
  • Сообщений: 177
...Я бы посоветовал использовать ДЛЯ КАЖДОГО фильма отдельный поиск по ряду ключевых слов...

Спасибо, я сейчас так и делаю... Эх и нудный же это прцесс))
PVD v.0.9.9.29
*************
2x Intel(R) Core(TM)2 Duo CPU E6550 @ 2.33GHz
Windows XP Service Pack 2 build 2600

Оффлайн Arg123

  • Гуру
  • ****
  • Сообщений: 407
wwmax
Могу посоветовать Total Commander (TC) ? в принципе там неплохо реализована возможность поиска в том числе и дубляжей файлов - как по размеру, так и по названию, так и по содержимому, но плюс лучше к ней прикрутить еще тогда плагины для этих целей ...

Довольно подробный обзор (правда не очень свежий -2007 год) программ для поиска дубликатов файлов - с названием программ и описанием можно посмотреть здесь - http://www.3dnews.ru/software/duplicate/ , ну а дальше уже решать самому что наиболее подходит вам из этого списка.

На данный момент одна из самых мощных программ для поиска дубликатов это NoClone
Я русский - я горжусь !!!

БОРИС Миронов - Народный Президент русского народа и других коренных народов России!
http://borismironov.livejournal.com/

Сбор подписей в поддержку кандидата Бориса Миронова:
http://borismironov.livejournal.com/659.html

Оффлайн wwmax

  • Постоялец
  • ***
  • Сообщений: 177
Arg123, большое спасибо, ТС пользую ещё с прошлого века ( :D), дело в том что основная задача стаяла какраз найти разные варианты одинаковых фильмов, т.е. заведомо с разным написанием названий и ессно отличающиеся по размеру файла (а следовательно и по содержимому)...
Ну да уже проехали. Но тем не менее NoClone обязательно попробую, спасибо за ссылку на статью)
PVD v.0.9.9.29
*************
2x Intel(R) Core(TM)2 Duo CPU E6550 @ 2.33GHz
Windows XP Service Pack 2 build 2600

Оффлайн Arg123

  • Гуру
  • ****
  • Сообщений: 407
Arg123, большое спасибо, ТС пользую ещё с прошлого века ( :D), дело в том что основная задача стаяла какраз найти разные варианты одинаковых фильмов, т.е. заведомо с разным написанием названий и ессно отличающиеся по размеру файла (а следовательно и по содержимому)...
Ну да уже проехали. Но тем не менее NoClone обязательно попробую, спасибо за ссылку на статью)

Это как раз я понял ,  задача конечно усложняется, но нет ничего невозможного. Просто поиск придётся провдить в несколько этапов:

Сначал поиск по расширению, желательно по одному , затем сортировка результатов поиска по убыванию размера - как правило DVD-Rip и например VHS имеют различные размеры, ну а затем просмотр списка вручную и выискивание схожих названии и дубликатов , наверное пока только так, другого способа наверное нет, если в TC можно искать по содержимому архивного файла или текстового , то для видеофайлов увы это пока не применимо, хотя было бы весьма здорово ...

И совет на будующеё после поиска дубликатов и их удаления сделать названия удобоваримым , у меня  это сделано например так:

Экспресс Ужаса (Horror Express).1973.DVD-Rip.[torrents.ru].avi
или
Монстры Против Пришельцев.(Monsters vs Aliens).2009.HD-Rip.(Dub by Killer).[forum.cyber.yaroslavl.ru].avi
Сразу видно название - русское и английское (в случае русского можно сделать транслитерацию на английский - благо программок для этого много), год выпуска , качество фильма и источник откуда скачанно или взято , и иногда если бывает написано - релиз группа или кто делал дубляж.

Очень удобно для поиска - только главное задать стандартизованные названия для качества рипов и для источников откуда скачанно , зато - найти например все DVD-Rip или VHS-Rip, или всё скачанное например с torrents.ru?  потом - даже с помощью обычного поиска в Windows-дело одной двух минут.

Аналогично у меня именованы и сериалы - правда еще добавляется какая серия и какой сезон ...

   
Я русский - я горжусь !!!

БОРИС Миронов - Народный Президент русского народа и других коренных народов России!
http://borismironov.livejournal.com/

Сбор подписей в поддержку кандидата Бориса Миронова:
http://borismironov.livejournal.com/659.html

Оффлайн wwmax

  • Постоялец
  • ***
  • Сообщений: 177
Arg123, ещё раз большое спасибо, но:
Суть проблемы вот в чём: познакомился с одним коллекционером - коллекция фильмов ~10 000 общим объёмом более 18 терабайт(!!! и это только на винтах, на болванках вообще не поддаётся учёту).
Человек немного странненький и мягко говоря далёкий от дружбы с компьютерной техникой, умеет только запустить комп и включить фильм на воспроизведение, на винтах бардак страшенный - естественно очень много дублей фильмов, и не просто дублей: например фильмов "Сокровище нации" у него 5 штук, от экранки до БДрипа)...
т.е. это не у меня проблема с путанницей в дублях, а у человека с которого я хотел тогда пополнить свои закрома, что в общем-то уже и сделал с великим трудом: ставил на поиск все имена одельно на каждую букву русского и латинского алфавита - и глазками просеивал найденное.
У меня то с этим проблем вообще не возникает - скачивая фильм с любого трекера я сразу же сохраняю их с именами вот по такому шаблону: год оригинальное название (переведённое название)(тип исходника). Получается вот так:
Цитировать
2003 The Reckoning (День расплаты)(DVDRip).avi   1,3 Гб    (1 468 196 864 байт)
2009 Pandorum (Пандорум)(DVDRip).avi   1,3 Гб    (1 467 453 440 байт)
2007 Atonement (Искупление)(DVDRip).avi   1,7 Гб    (1 831 124 992 байт)
2006 The Hoax (Мистификация)(HD Re Rip).mkv   1,8 Гб    (1 997 724 318 байт)
2009 Dark Country (Темная страна)(DVDRip).avi   694,1 Мб    (727 824 384 байт)
1979 Kramer vs. Kramer (Крамер против Крамера)(HD Re Rip).mkv   1,7 Гб    (1 876 045 211 байт)
1964 Гамлет (Russia)(DVDRip).avi   2,0 Гб    (2 201 483 264 байт)
2009 The Skeptic (Скептик)(DVDRip).avi   697,8 Мб    (731 725 824 байт)
2009 Frequently Asked Questions About Time Travel (Часто задаваемые вопросы о путешествиях во времени)(DVDRip).avi   734,8 Мб    (770 568 192 байт)
1993 Needful Things (Нужные вещи [по Стивену Кингу])(DVDRip).mkv   1,4 Гб    (1 544 544 703 байт)
1987 Angel Heart (Сердце Ангела)(HD Re Rip).mkv   1,8 Гб    (2 004 273 039 байт)
1998 Pi (Число Пи)(DVDRip).mkv   564,5 Мб    (592 024 464 байт)
1969 Mackenna's Gold (Золото Маккенны)(DVDRip).avi   1,4 Гб    (1 606 651 904 байт)

В общем надеюсь что больше никогда не придётся заниматься подобным поиско-отсевом, потому что эффективнее оптического метода фильтрования (т.е. глазами ;D) видимо ничего и нет - а это жутко утомительно.
PVD v.0.9.9.29
*************
2x Intel(R) Core(TM)2 Duo CPU E6550 @ 2.33GHz
Windows XP Service Pack 2 build 2600

Оффлайн Arg123

  • Гуру
  • ****
  • Сообщений: 407
Arg123, ещё раз большое спасибо, но:
Суть проблемы вот в чём: познакомился с одним коллекционером - коллекция фильмов ~10 000 общим объёмом более 18 терабайт(!!! и это только на винтах, на болванках вообще не поддаётся учёту).
Человек немного странненький и мягко говоря далёкий от дружбы с компьютерной техникой, умеет только запустить комп и включить фильм на воспроизведение, на винтах бардак страшенный - естественно очень много дублей фильмов, и не просто дублей: например фильмов "Сокровище нации" у него 5 штук, от экранки до БДрипа)...
т.е. это не у меня проблема с путанницей в дублях, а у человека с которого я хотел тогда пополнить свои закрома, что в общем-то уже и сделал с великим трудом: ставил на поиск все имена одельно на каждую букву русского и латинского алфавита - и глазками просеивал найденное.
У меня то с этим проблем вообще не возникает - скачивая фильм с любого трекера я сразу же сохраняю их с именами вот по такому шаблону: год оригинальное название (переведённое название)(тип исходника). Получается вот так:
Цитировать
2003 The Reckoning (День расплаты)(DVDRip).avi   1,3 Гб    (1 468 196 864 байт)
2009 Pandorum (Пандорум)(DVDRip).avi   1,3 Гб    (1 467 453 440 байт)
2007 Atonement (Искупление)(DVDRip).avi   1,7 Гб    (1 831 124 992 байт)
2006 The Hoax (Мистификация)(HD Re Rip).mkv   1,8 Гб    (1 997 724 318 байт)
2009 Dark Country (Темная страна)(DVDRip).avi   694,1 Мб    (727 824 384 байт)
1979 Kramer vs. Kramer (Крамер против Крамера)(HD Re Rip).mkv   1,7 Гб    (1 876 045 211 байт)
1964 Гамлет (Russia)(DVDRip).avi   2,0 Гб    (2 201 483 264 байт)
2009 The Skeptic (Скептик)(DVDRip).avi   697,8 Мб    (731 725 824 байт)
2009 Frequently Asked Questions About Time Travel (Часто задаваемые вопросы о путешествиях во времени)(DVDRip).avi   734,8 Мб    (770 568 192 байт)
1993 Needful Things (Нужные вещи [по Стивену Кингу])(DVDRip).mkv   1,4 Гб    (1 544 544 703 байт)
1987 Angel Heart (Сердце Ангела)(HD Re Rip).mkv   1,8 Гб    (2 004 273 039 байт)
1998 Pi (Число Пи)(DVDRip).mkv   564,5 Мб    (592 024 464 байт)
1969 Mackenna's Gold (Золото Маккенны)(DVDRip).avi   1,4 Гб    (1 606 651 904 байт)

В общем надеюсь что больше никогда не придётся заниматься подобным поиско-отсевом, потому что эффективнее оптического метода фильтрования (т.е. глазами ;D) видимо ничего и нет - а это жутко утомительно.

Да нет я понял что это не у вас такой бардак, а слова насчёт шаблона названии были адресованы вашему знакомому, не вам :) ...

У вас в принципе схожий с мои смысл наименования фильмов, с некоторыми отличиями ...
Я русский - я горжусь !!!

БОРИС Миронов - Народный Президент русского народа и других коренных народов России!
http://borismironov.livejournal.com/

Сбор подписей в поддержку кандидата Бориса Миронова:
http://borismironov.livejournal.com/659.html

Оффлайн wwmax

  • Постоялец
  • ***
  • Сообщений: 177
Да нет я понял что это не у вас такой бардак, а слова насчёт шаблона названии были адресованы вашему знакомому, не вам :) ...
>>
...Человек немного странненький и мягко говоря далёкий от дружбы с компьютерной техникой...

К сожалению, этому уважаемому чудаку я не могу посоветовать своё представление о ведении учёта его богатства...  ;)
PVD v.0.9.9.29
*************
2x Intel(R) Core(TM)2 Duo CPU E6550 @ 2.33GHz
Windows XP Service Pack 2 build 2600