...
...

Инструктаж для интернетовских реинджеров

Инструктаж для интернетовских реинджеров

Обратился как-то ко мне один знакомый с вопросом - сколько стоит Интернет и как с ним (!) работать? Ну, с точки зрения стоимости, раскрыть вопрос труда не составляло, а вот "как с ним работать" - объяснить оказалось посложнее.

Чуть позже решил я провести негласный эксперимент над своими знакомыми, в той или иной степени знакомыми с вычислительной техникой. Откровенно говоря, результаты меня малость обескуражили. Те, кто хотя бы изредка прогуливаются по Сети, в вопросе "как искать то, что нужно" худо-бедно ориентируются, а вот люди, использующие Интернет достаточно редко, практически вообще плавать в киберпространстве не умеют. Нет, если дать им готовый адресок, то они сумеют его набрать и попасть на указанную страницу. Но стоит сформулировать вопрос иначе, например, - сходи на сервер Microsoft и там найдешь - можете быть уверены, что ничего не получится. Что самое интересное, многие, кому Паутина нужна как воздух, избегают Интернет как раз по причине - там трудно найти что-нибудь полезное, - хотя эти же люди толком-то и не представляют, как пользоваться поисковыми службами и даже, что это такое вообще. Посему, чувствую надо бы малость рассказать на эту тему, ибо по Сети бродить мне приходится часто и жизнь заставила изучить вопрос.

Этот абзац те, кто знают, могут пропустить, а для новичков расскажу несколько прописных истин. Вы уж потерпите. Известно, что Интернет представляет собой гигантскую постоянно действующую компьютерную сеть. Но не всем известно, что в этой сети каждый компьютер (имеется в виду официально зарегистрированный узел, не путать с клиентским рабочим местом) имеет свой, абсолютно уникальный адрес. Вы наверняка уже видели надписи типа www.ibm.com или www.infoart.ru, это и есть адрес. Правда, официально он называется, в переводе с английского, "универсальный локатор ресурсов" (ULR). Кстати, отсюда пошло компьютерное сленговое слово "урл". Правда, в отличие от привычной почты, в Интернет параллельно применяется две различные системы адресации: буквенная и IP. На самом деле, адресом компьютера является комбинация "номер IP:номер порта" и никакого другого адреса Сеть не понимает. Только IP - вещь малоудобная для нормального человека, ибо это группа из четырех трехзначных чисел, например, 122.234.454.813. Значительно легче запоминать буквенные имена, тем более, что самые известные конторы стремятся получить себе адрес, совпадающий с официальным наименованием или распространенным сокращением. Для увязывания этого противоречия служит, так называемый, DNS-сервер. Это общедоступная постоянно включенная в Сеть машина, хранящая в памяти длинную таблицу из двух столбцов. В одном хранятся буквенные имена, а в другом - IP. Компьютер провайдера, через который вы работаете, обращается к одному из DNS-серверов и, получив адрес IP, опрашивает все доступные серверы - "А не слыхал ли кто про узел с таким именем?". Те, в свою очередь, так же теребят соседей и по сети бежит расширяющаяся волна. И бежит она до тех пор пока не достигнет абсолютно всех узлов, благо скорости высокие. Узел, волну вызвавший, либо ждет заранее установленное время и отменяет вызов, заявив, что такого адреса в Сети нет, либо получает некоторое количество вариантов ответа и, отсортировав лучший, передает его вашему браузеру для дальнейшей работы.

Таким образом, видно, что даже перебирая все возможные варианты IP, можно только установить факт наличия или присутствия конкретного адреса в Интернет или его отсутствия. Конечно, если запрашиваемый узел существует, то скорее всего вы попадете на титульную страницу, где сможете составить некоторое представление о его содержании, впрочем, далеко не всегда. Подобным способом что-нибудь путное найти можно, только если вы патологический везунчик и во всех лотереях всегда вытаскиваете исключительно выигрышный билетик. Ну, а так как таких меньшинство, то в Интернет здравствуют и процветают всяческие поисковые службы, которые для того и предназначены, чтобы, во-первых, экономить ваше время, а во-вторых, обеспечивать нахождение необходимой информации даже по небольшому ее фрагменту. Сами по себе поисковые сервера этой информации не имеют, зато они точно знают, где конкретно она лежит и готовы подсказать адресок. Бесплатно.

Начать имеет смысл с самой известной поисковой службы Yahoo! (www.yahoo.com). Историю ее возникновения "КГ" уже недавно публиковала на своих страницах. Объединившись с поисковиком AltaVista (altavista.digital.com/), эти две системы охватили огромное пространство и фактически позволяют искать почти по всей Интернет. Они, равно как и поисковая служба Lucos (www.lycos.cs. cmu.edu/) или подобная ей HotBot (www.hotbot.com/index.html), просто неподражаемы, если требуется найти что-нибудь общее или широко известное. Достаточно набрать в соответствующих окнах, например, "мода", "выставка" или "олимпийские игры" и пару сотен адресов, как минимум, вам обеспечены. Кроме того, там существует приличный классификатор, например: спорт, компьютеры, пресса, отдых, культура и т.п. В сущности, если неизвестно, с чего начать, то лучше всего забираться на эти поисковые сервера и задавать свои вопросы. Особо стоит отметить тандем Yahoо! - Alta Vista, где поиск производится не только по собственной базе, но и передается соседу, что экономит время.

Однако не все так просто, как кажется. Дело в том, что, в отличии от человека, программное обеспечение поисковых служб такое же тупое, как и то, с чем любому из нас приходится работать. Оно производит поиск по принципу совпадения символов в запросе и символов в индексированных документах. Поэтому, например, на слово "дань" можно получить пару десятков миллионов адресов, где хранятся документы, содержащие слова: дань, здание, заданный, задание, и т.п. Причем, следует учитывать фактор возможного многократного повторения адресов, что совершенно не редкость в Интернет. Следовательно, начинать всегда надо с конца и спрашивать такие слова или сокращения, которые бы максимально однозначно соответствовали предмету вашего поиска.

К сожалению, названные службы англоязычные и русским не владеют, что зачастую усложняет поиск нужных мест по причине отличия английского языка от родного. Тут я вам помочь ничем не могу. Хотя несколько советов все же есть. Во-первых, если с языком сложности, а искать надо именно за пределами границ бывшего СССР, то имеет смысл установить у себя специализированные интерактивные переводчики, позволяющие "на лету" переводить как в MIE, так и в NN, в обоих направлениях. Во-вторых, для облегчения поиска не используйте в запросах английских предлогов или артиклей. Хорошо еще, если программа поиска их вообще проигнорирует. Гораздо хуже, если она воспримет предлог в качестве самостоятельного слова и начнет выдавать вообще все подряд (представьте, что вы спросили информацию на слово "на"...).

Достаточно часто люди сразу принимают на веру то, что им говорит компьютер. Это, пожалуй, самое неприятное заблуждение из всех, мне известных. Дело в том, что компьютер мыслит совершенно иначе, чем человек. Вас заинтересовали Олимпийские игры 1998 года в Нагано? Сомневаюсь, что вы найдете много полезного, если спросите просто "Нагано". Городок этот немаленький. И предстоит вам разгребать завалы ссылок наганских банков, фирм, магазинов, музеев, всяческих обществ и исторических справок, в которых фигурирует указанное слово. Не рекомендую также спрашивать столь общее слово, как "спорт" или "олимпийские игры". Имеет смысл развернуть ваш запрос как можно шире и выставить слова не абы как, а в определенной логичной последовательности: Олимпийские, игры, Нагано, 1998. Многие поисковые серверы ранжируют полученный результат, указывая процент совпадений слов в нем заданных. Таким образом, первыми в очереди будут находится документы, где процент попадания максимальный и там, скорее всего, будет рассказываться про эти самые олимпийские игры.

Если с первого раза вы ничего полезного не нашли - не отчаивайтесь. Скорее всего, просто вопрос был сформулирован не так. Искал я как-то фотографии довольно редкого самолета времен Второй Мировой войны Henscel Hs132 и почти ничего путного не попадалось. Но как только поисковый сервер получил задание найти адреса авиационных музеев, где есть экспонаты об этой войне, все пошло как по маслу. Кроме того, хоть известные поисковые службы и претендуют на всемирную глобальность, но все же содержание их баз данных значительно различаются, так что один и тот же вопрос, заданный в разных поисковых службах, может привести к совершенно различным результатам. Так что не ленитесь спрашивать разные сервера.

С другой стороны, расспрашивать поисковики можно до бесконечности, ибо Сеть растет словно на дрожжах и столь примитивный способ применим лишь тогда, когда вы не занимаетесь целенаправленным поиском и ничем кроме поиска. Я имею в виду, если ничего особо редкого вас не интересует, да и сколь-нибудь серьезно засесть за Сеть не имеете вы никакой возможности. Совершенно иное дело, если в Интернет приходится заглядывать частенько. Тут, как говорится, могут быть варианты. Вообще-то их всего два. Можно воспользоваться бурно развивающейся сейчас push-технологией и просто подписаться на некоторый набор услуг (пока еще это практически везде осуществляется бесплатно), и с определенной периодичностью электронная почта будет доставлять вам, например, спортивные новости, прямиком в почтовый ящик. Однако технология это новая, поэтому почтовая рассылка и распространена не слишком широко и, что досаднее всего, ограничивается чрезвычайно маленьким перечнем тем. Тут уж лучше организовать свою собственную независимую push-службу для себя любимого исключительно.

Дело в том, что есть соответствующие программные средства, так сказать, индивидуального пользования, позволяющие производить обследование и контроль Web-страниц почти автоматически. Они распадаются на три группы: метапоисковые инструменты, которые одновременно посылают один и тот же запрос на несколько поисковых серверов, ассистенты, помогающие эффективнее управлять поиском, и автономные браузеры, которые проверяют Web-страницы и загружают их в случае появления там чего-либо нового.

Одним из лучших метапоисковых инструментов является программа SavvySearch. Она позволяет отправить запрос сразу в три сервера одновременно да еще допускает настройку вида представления получаемого результата. Сревера можно объединят в наборы для коллективного поиска. Одно плохо, SavvySearch не забирается глубже пятой страницы результатов поиска и очень сильно зависит от трафика.

Хорошими рекомендациями сопровождается метапоисковая программа Arf (лежит на www.execpc.com/~bitsafe/arf). Arf стоит недорого, около 20 долларов, не слишком изыскана, но прекрасно подходит для автоматического поиска и сведения воедино его результатов. Ее интерфейс позволяет ввести запрос, а также установить максимальное число найденных страниц (до 10 тысяч) и те поисковые серверы, на которые будет посылаться запрос. После этого вы нажимаете кнопку Start, и Arf выдает простой, никак не рассортированный список адресов, а также загружает те страницы, на которые эти адреса указывают. Можно запустить сразу несколько экземпляров Arf и в каждом задать свой запрос.

Программа WebSeeker (www.ffg.com) стоит дороже, но и может больше, например, алфавитную сортировку результатов поиска. WebSeeker одновременно запрашивает целых двадцать поисковых серверов в Сети и Usenet и составляет список найденных страниц, в котором можно производить сортировку и поиск. Работает WebSeeker не так быстро, как хотелось бы, но обладает значительной поисковой мощью.

Утилиты-ассистенты обладают несколько иными возможностями и позволяют, в том числе, даже контролировать саму процедуру поиска, а также могут, на основании заранее составленного графика, периодически рассылать один и тот же запрос по разным поисковикам, извещая вас лишь тогда, когда среди полученных материалов появится что-нибудь новое. Такой подход значительно облегчает жизнь, ибо я сильно сомневаюсь, что в мире найдется много людей, способных помнить наизусть даже десятки итоговых адресных страниц, не говоря уже об определении новинок на взгляд.

Великолепным поисковым ассистентом является More Like This, (www.morelikethis.com). Взаимодействие с ним осуществляется с помощью несложной панели инструментов, плавающей поверх окна программы-браузера. С помощью этой панели можно быстро и легко посылать на серверы изощренные запросы: просто нажмите кнопку More Like Query, введите интересующее вас слово и нажмите OK. Программа отправит запрос на выбранный поисковый сервер и откроет страницу с результатами в окне браузера. Приятно, что в More Like This не требуется соблюдать какого-нибудь специального синтаксиса вопросов. Кроме того, кнопка "More Like This" сама переведет запрос в форму, доступную поисковым серверам. Вы можете также щелкнуть по кнопке "More Like Title", чтобы отправить запрос, основанный на названии той страницы Интернет, которую сейчас просматриваете.

Если необходима "пушка по круче", то, возможно, вам подойдет Internet FastFind (www.symantec/com). Как метапоисковая система FastFind собирает все результаты на одной странице, которую затем можно просмотреть на экране браузера, сортируя их при этом по множеству критериев. Кроме того, программа с легкостью работает не только с протоколом HTTP, но и прекрасно себя чувствует, если требуется общаться с FTP узлами.

Компания Quarterdeck предлагает новый поисковый инструмент типа сервера All-in-One под названием WebCompass 2.0 (quarterdeck/com). Всяческих возможностей в WebCompass более, чем достаточно не только обычному пользователю, но и действительно "профессиональному" киберследопыту. WebCompass 2.0 предоставляет папки для организации поиска по темам и работы с интересующими вас Web-страницами. Программа следит за изменениями этих страниц, а подпрограммы-агенты прогоняют в назначенное время ваши запросы и извещают вас, если появляется что-то новенькое.

Поверьте мне на слово, уже через пару месяцев неспешных набегов на Сеть, у вас появятся любимые, интересные или просто полезные страницы, посещения которых будет чрезвычайно информативным и полезным. Но очень скоро вы также заметите, что ваши возможности заглянуть и быстро просмотреть содержимое страницы все же уступают вашим потребностям. К тому же, как это ни печально, если вы присмотрели себе не автоматический сервер новостей, далеко не все они обновляются так быстро, как вам бы хотелось, то в этой ситуации прекрасным подспорьем могут оказаться, так называемые, off-line браузеры.

На самом деле никакие они не off-line. Просто автоматические и все. Смысл таких программ заключается в возможности создать некоторый список адресов и некоторый перечень запросов. Далее они самостоятельно будут просматривать узлы и информировать вас обо всех произошедших там изменениях, которые вы еще не видели.

В этом плане может подойти программа PointCast (www.pointcast. com), которая поставляет новости по вашим излюбленным темам, используя специальный хранитель экрана в Windows для показа новостных заголовков. Хотя вы можете выбирать тип новостей, с которыми вам хотелось бы знакомиться (бизнес, политика, финансы, спорт), и периодичность, с которой они будут обновляться, в выборе вас ограничивает меню, предлагаемое PointCast. Таким образом, эта программа скорее удобный способ просмотра заголовков, чем инструмент для быстрого поиска конкретной информации.

Программа Smart Bookmarks 2.02 (www.firstfloor.com) характеризуется как развитие механизма закладок браузера; на самом деле, однако, это самостоятельная программа, которая не только работает с закладками, но и загружает Web-страницы в автономном режиме. На овладение этой программой требуется известное время, но усилия окупаются. После того, как вы создали закладку для какого-то узла или сформулировали интересующий вас запрос, Smart Bookmarks следит за изменениями в этом узле (или узлах). Когда изменения происходят, программа сообщает об этом, и вы можете потребовать загрузки соответствующей страницы.

Если этого покажется недостаточно, попробуйте OM-Express (www.openmarket.com) Среди подобного рода средств, это самая простая в обращении программа. У нее простой и понятный интерфейс, имеется руководство, позволяющее быстро научиться работать с программой. OM-Express показывает в браузере исходные URL даже для тех Web-страниц, которые скопированы на ваш компьютер.

Есть еще один прекрасный способ поиска и манипулирования информацией. В Интернет существует прорва всяких платных служб по самым различным темам, от политики до порнографии. Однако это малость выходит за рамки темы этой статьи и трогать мы ее не станем. Во всяком случае до тех пор, пока в нашей стране не появятся люди, понимающие цену оперативной информации и способные за нее платить.

Напоследок хочу немного рассказать о чисто русских поисковых службах, значительно развившихся за последний год. Это, прежде всего, индексная поисковая служба "Русский Интернет" (www.rocit.ru/au/default.asp), охватывающая более пятидесяти тысяч серверов русскоязычной части Всемирной Паутины. Отличительной чертой "Русского Интернета" является значительное преобладание количества частных страниц над всеми остальными категориями информации.

Неплохим рейтинговым местом можно назвать поисковую службу "Все звезды" (www.stars.ru). Ее база не так велика и не столь разнообразна, но, благодаря свободному доступу к рейтинговой таблице, можно достаточно легко находить места с интересной информацией, которые впоследствии могут стать "началом большого пути".

За последние полгода значительного прогресса добился сервер "АПОРТ" (www.aport.ru/), где можно найти не только официальные, фирменные или частные страницы, но и тексты официальных документов различных государственных инстанций.

Очень активно в последнее время работает метапоисковая система "СЛЕДОПЫТ", позволяющая охватить порядка десяти крупнейших (как международных, так и российских) индексных поисковых систем одновременно. Кроме того, она может производить перевод текста запроса на английский язык и обратно, что трудно переоценить в условиях, когда многие пользователи вычислительной техники даже с русским языком знакомы не слишком хорошо.

А на десерт я хочу дать несколько рекомендаций киберпутешественникам. Чтобы вы там, в Интернет, ни делали, какими бы темами ни интересовались, а все же просматривайте не только названия найденных ресурсов или их аннотации. Очень часто, пытаясь любой ценой заманить на свои страницы прохожих, иные авторы, что называется "внаглую", пользуются полной бесплатностью регистрации и прописывают в поисковых системах индексы чуть ли не на каждый подраздел собственного сайта. А кроме того, еще и забираются в специализированные программы-регистраторы, которые также размещают информацию о новом ресурсе на нескольких узлах одновременно. В результате, добрых две трети ссылок, полученных в ответ на запрос, будут вести в одно и то же место. Имеет смысл поглядывать на сами адреса и вы значительно сократите расходы своего времени.

Если к киберпространству подходить правильно и полагаться не только на вычислительную мощь своего компьютера, то поиск необходимой информации в Сети большого труда не составит.

Александр Запольскис
E-mail: leshy@nestor.minsk.by
- титульная страница


© Компьютерная газета

полезные ссылки
Оффшорные банковские счета