интернет


Поиск по FTP: блиц-руководство

Сетевые ресурсы не ограничиваются одними веб-документами. Иногда требуется найти и скачать конкретные файлы. Один из давно известных источников такого контента — FTP-серверы. Данная статья представляет собой краткое руководство по использованию FTP-поисковиков. Поиск необходимых файлов через FTP-поисковики обычно кажется проще поиска документов в сети, однако он имеет свои особенности, о которых и пойдет речь далее. При этом основное внимание будет уделено не обзору конкретных поисковых машин, а общим для всех таких ресурсов инструментам и приемам работы.

Немного теории


Протокол FTP (File Transfer Protocol) предназначен для передачи файлов между компьютерами. По компьютерным меркам эта технология имеет весьма почтенный возраст. Сильные стороны этого протокола — простота и надежность. Они позволяют ветерану FTP и в настоящее время уверенно держаться на сцене, несмотря на появление молодых конкурентов. С точки зрения пользователя FTP-сервер — это большой архив полезных файлов самого различного плана: от программ до музыки и видео. Правда, не стоит забывать, что значительная часть FTP-серверов имеют ограниченный доступ и, строго говоря, относятся к так называемой «невидимой сети». В то же время существует большое количество публичных, свободных FTP-серверов, доступ к которым открыт для всех желающих. Именно такие ресурсы интересны в первую очередь. С хорошими и проверенными FTP-архивами можно работать напрямую, без помощи посторонних сервисов, однако при общем поиске файлов намного эффективней будет использовать одну из специализированных поисковых машин. Мы не будем сейчас заниматься подробным разбором характеристик существующих FTP-поисковиков — это не является целью данной статьи. При желании вы сможете найти достаточный выбор таких машин, пробежавшись по соответствующим разделам крупных веб-каталогов. Упомянем только наиболее известные рунетовские FTP-поисковики: FileSearch.ru (www.filesearch.ru) и Rambler-FTP (ftpsearch.rambler.ru). Оба ресурса располагают достаточным количеством инструментов поиска. FileSearch отличается действительно хорошим охватом ресурсов — в его базе данных десятки миллионов файлов, находящихся как на российских, так и на некоторых зарубежных серверах. База обновляется каждые пять дней. Если какой-либо включенный в базу FTP-сервер перестает откликаться на запросы робота-индексатора, по прошествии трех недель он исключается из базы данных, что сокращает количество «мертвых» ссылок в результатах поиска. Данный поисковик обладает всеми необходимыми для успешного поиска инструментами. Отдельно стоит отметить специализированный поиск драйверов. Кроме прочих поисковых признаков, такие файлы можно искать и по названию производителя оборудования. Веб-мастера могут также поставить на своем сайте форму поиска по FileSearch, код которой можно взять прямо на сайте системы. Rambler-FTP также представляет собой весьма достойный ресурс. Искать можно в таких категориях, как «Файлы и каталоги», «Картинки», «Аудио» и «Видео». Кроме обычной двухуровневой сортировки результатов, список можно свернуть по именам файлов или каталогов.

Поскольку FTP-поисковики отличаются собранными индексными базами, результаты поиска на них могут быть разными. Так что даже если вы уже определились с «любимым» поисковиком, время от времени заглядывайте к его конкурентам — жизнь на месте не стоит, и вас вполне могут ожидать приятные сюрпризы. Это открывает заманчивые возможности для метапоиска по нескольким ресурсам. Данная технология давно применяется для поиска документов в сети. FTP-метапоиск, если говорить о нем в двух словах, — это одновременный поиск файла по нескольким источникам — в данном случае — FTP-поисковикам. В этой связи отдельного упоминания заслуживает проект Metabot (www.metabot.ru). Это метапоисковая машина, которая, кроме поиска документов в вебе, может работать и по FTP-поисковикам. В разделе «Ftp поиск» вы можете одновременно поискать и по упомянутым FileSearch и Rambler-FTP. Найденные ссылки выдаются общим списком. Рядом с каждой ссылкой указывается нашедший ее FTP-поисковик, причем первыми идут ссылки, найденные сразу несколькими машинами. В качестве дополнительной информации указывается размер файла и дата его создания. В результате при поиске файлов через Metabot можно получить лучший охват источников, однако здесь вы не найдете инструментов расширенного поиска, а также сортировки результатов по указанному вами признаку. Получением списка ссылок на серверы, которые располагают подходящими файлами, поиск не заканчивается. Во-первых, надо еще убедиться, что найден именно нужный файл, поэтому, например, неплохо было бы сравнить размер найденного файла с имеющимися сведениями. Во-вторых, потребуется отсечь серверы с ограничениями на доступ. В-третьих — убедиться, что ссылка на файл рабочая. «Мертвые» ссылки в базе поисковика могут появиться, если владельцы FTP-сервера их удалили или закрыли к ним доступ, кроме того, сам сервер может быть временно недоступен. В идеале, проведя поиск, вы должны получить рабочую ссылку на нужный файл, находящийся на максимально быстром сервере, с которого его можно скачать бесплатно и без лишнего беспокойства. Это создает экологическую нишу для специализированных прикладных программ, назначение которых — всячески облегчать и улучшать поиск по FTP, однако это уже отдельная тема.

Синтаксис запросов

Отдельные файлы — это не веб-документы — поисковых признаков у них меньше. По большому счету они сводятся к банальному имени файла или каталога. При этом содержимое файла совершенно не учитывается. В результате основной упор идет на использование в запросе спецсимволов и подстановок. С одной стороны, это упрощает составление запроса, с другой — повышает требования к его корректности. Как правило, работать с FTP-поисковиком можно в нескольких режимах. Самый простой — поиск на включение. Вы просто набираете в поле поиска кусок имени нужного файла или каталога, а машина ищет такие ссылки, в которых встречается ваше ключевое слово. Второй способ — поиск по маске. Это очень похоже на поиск файлов по дискам локального компьютера. Подставляя спецсимволы «*» и «?», вы соответственно допускаете подстановку в свой запрос нескольких любых символов или одного символа, опять же, не уточняя, какого именно. Третий способ — поиск с использованием регулярных выражений — позволяет самым подробным образом расписать свои требования к имени файла или каталога. Среди языка запросов FTP-поисковиков не наблюдается такого разнообразия, как в языках универсальных интернет-поисковиков, что несколько облегчает жизнь пользователя. В качестве примера можно привести синтаксис одного из самых популярных в наших краях FTP-поисковика FileSearch.ru. Его регулярные выражения сведены в приведенную ниже таблицу. Составляя прямой запрос, не стоит слишком увлекаться — обычно чем он проще, тем надежнее результаты поиска. Длинные и сложные запросы лучше приберечь для особых случаев, когда ничто другое не помогает либо когда вы очень хорошо представляете, что хотите найти.

Если вам как-то не улыбается ломать голову, составляя прямые запросы, есть и другой вариант. Многие FTP-поисковики предлагают веб-интерфейс для «Расширенного» поиска. Как и следует ожидать от инструмента с таким названием, это конструктор запросов, управлять которым можно просто расставляя галочки в чекбоксах и оперируя выпадающими меню. Опции на таких поисковых страницах, можно сказать, типовые, поэтому, один раз хорошенько разобравшись со всей этой нехитрой механикой, можно смело работать практически с любым FTP-поисковиком, даже если вы попали на него в первый раз. В качестве примера посмотрите на скриншоты FTP-поисковиков с интерфейсами на английском (Freewareweb.com) и польском (Onet.pl) языках. Как видите, сходство налицо, и, если вы умеете работать с тем же FileSearch.ru, языковой барьер для вас уже не будет существенной проблемой. К повторяющимся элементам, как правило, относятся опции «Тип поиска» (Search Type), в котором можно выбрать поиск по конкретным тематическим разделам базы данных — файлы и каталоги, программы, музыка, видео, драйверы и т.д., «Сортировка» (Sort by) и количество показываемых результатов на одной странице. Обычной также является опция показа либо сокрытия файлов для *nix-систем. Это не дискриминация, а просто способ отсечь из результатов поиска архивы дистрибутивов, в которых могут быть многие тысячи файлов, не очень-то полезных, если вы ищете что-нибудь для Windows. На большинстве приличных FTP-поисковиков можно также вывести на страницу результатов минимальный и максимальный размеры файла, а также выставить другие настройки внешнего вида списка найденных файлов. Весьма полезной и распространенной является возможность поиска по конкретному домену или каталогу.

Таблица регулярных выражений для FTP-поиска


ОперацияСпецсимволПримерПримечание
Поиск с начала строки^^fileаналогичный результат даст file*
Поиск в конце строки$ exe$действие оператора похоже на запрос *exe
Поиск определенного набора символов[ ] [0-9] [abc] [0-9a-z] [a^b]набор можно задавать перечислением всех элементов (например, [abc]) либо указанием диапазона (например, [a-c]); исключить перечень или диапазон значений можно с помощью символа, который обязательно ставится перед этими значениями (например, [^ab]), иначе вы просто включите спецсимвол в свой запрос
Любой символ. abc.3означает обязательную подстановку любого одного символа
Любые символы* linux-2.*.tar.gzприменяйте, если на этом месте могут быть любые символы или вообще ни одного символа; если поставить «*» с обеих сторон запроса, то результат будет аналогичен простому поиску на включение
Как минимум один символ+ [a-z]+означает подстановку не менее одного символа, в данном примере — буквы
Один символ?[0-9]?означает подстановку одного любого символа либо его отсутствие
Ровно n вхождений{n}[a-z]{5}как и другие операторы, задающие число совпадений («вхождений»), часто применяется совместно с указанием диапазона возможных значений — в данном случае будет идти поиск любых пяти букв
Как минимум n вхождений{n,} [a-z]{5}найдет не менее пяти букв
Не менее n, но не более m вхождений{n,m} [a-z]{5,7}найдет не менее пяти и не более семи букв
Логическое ИЛИ|ab|cdчасто используется в комплексных выражениях
Комплексное выражение( )(zip|rar)позволяет сгруппировать несколько условий
Поиск спецсимвола\\^включение спецсимволов в строку поиска




Алексей Кутовенко, alteridem@tut.by

© компьютерная газета