...
...

Caffeine – очередной движок поисковой системы Google

Google завершила работы над обновлением движка своей одноименной поисковой системы. По данным компании, результаты веб-поиска будут на 50 процентов актуальнее, чем аналогичный прошлогодний показатель. Теперь система способна предложить пользователям поискового сервиса огромную коллекцию веб-контента. Будь это новость, запись в блоге или на форуме, теперь у пользователей появится возможность находить ссылки на подобную информацию гораздо быстрее с момента ее публикации во всемирной сети.

Тестирование нового механизма поиска под названием Caffeine началось еще в августе 2009 года и ожидалось, что оно завершится через несколько месяцев, однако как теперь уже стало понятно, оно затянулось практически на целый год. При этом Google не раз заявляла, что новая система поиска станет одним из самых важных и ощутимых нововведений из тех, которые вносились в схему поиска с 2006 года.

Как заявили в компании, новая система поиска должна считаться с тем, что в течение последних двух лет с появлением блогов, видео и социальных медиа-технологий, быстро растет количество различного веб-контента. Таким образом, Caffeine призвана целиком и полностью удовлетворить постоянно растущие запросы пользователей.

Раньше вся масса веб-страниц была разделена на несколько слоев, некоторые из них обновлялись чаще и быстрее, чем другие. Основной слой обрабатывался в свою очередь приблизительно каждые 2 недели. Чтобы обновить оставшуюся часть информации, нужно было проанализировать всю сеть, что затягивало время между моментом обнаружения страницы и моментом, когда Google делал ее доступной для поиска.





Каждую секунду поисковая система обрабатывает сотни тысяч страниц. Для того чтобы представить себе масштабы работы поисковика, допустим, что эти страницы бумажные, тогда стопка из них росла бы со скоростью порядка 5 км в секунду. Тогда как в базе данных Caffeine содержится порядка 100 млн. гигабайт данных, а новая информация добавляется со скоростью нескольких сотен тысяч гигабайт в день.

Сnet; Slashgear

Павел Новик



© Компьютерная газета