GoGo совершенствует поиск по фотографиям

Поисковая система GoGo.Ru расширяет сотрудничество с фотохостингами Рунета. Данные о свежем контенте этих ресурсов теперь оперативно поступают в поисковую базу в XML-формате. Нововведение позволяет индексировать всю информацию по каждому добавленному изображению, что повышает полноту поиска. Кроме того, такой подход дает возможность увеличить частоту индексирования баз партнеров примерно в 30 раз. Если раньше поисковый робот индексировал каждый фотохостинг в среднем раз в месяц, то теперь данные в базе GoGo.Ru обновляются ежесуточно. Также XML-синдикация должна стать основой для запуска новых возможностей поиска по фотографиям.

Поиск с традиционной индексацией картинок в Интернете не всегда эффективен. Актуализация базы за счет поискового робота, обходящего все сайты один за другим, занимает много времени, а в результате удается собрать лишь самую общую информацию о размещенном на фотохостингах контенте. Более удачным решением являются автоматически составляемые рапорты самих фотохостингов о появлении новых изображений. Эту идею взяли на вооружение разработчики GoGo.Ru. Поисковый сервис позволяет фотохостингам каждый день синхронизировать свои обновления с индексной базой. Сайты генерируют по предоставленному поисковиком шаблону XML-файлы, в которых содержится информация о новом контенте. Эти файлы собираются роботом GoGo.Ru, и содержащиеся в них данные интегрируются в поисковую базу.

Таким образом, база GoGo.Ru регулярно пополняется достоверной информацией о качественном фотоконтенте Рунета, причем поисковик получает для каждой фотографии дополнительные данные - от ее размера до ссылки на личную страницу автора. Это позволит в скором будущем существенно расширить функциональность сервиса. В проекте уже участвуют девять фотохостингов Рунета, в том числе "Фото@Mail.Ru", LiveInternet.ru, 500px.com, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Keep4U.Ru, AutoWP.ru, и Fota.Mota.ru. В настоящее время механизм поиска по изображениям GoGo.Ru также умеет автоматически распознавать фотографии и отделять их от прочих картинок, что позволяет пользователю соответственно ограничивать результаты поиска.

Mail.Ru

©1997-2024 Компьютерная газета