...
...

СУБД говорит по-русски

СУБД говорит по-русски

http://www.bizcom.ru/win/mainrusw.htm

Олег Кудрявов


На пресс-конференции, состоявшейся 24 июня 1997 г. в офисе российского отделения компании Informix, отечественная компания "РЕДЛАБ" объявила о завершении разработки первого модуля DataBlade "Русский текст" (Russian Text DataBlade), предназначенного для хранения, управления и полнотекстового поиска по русскоязычным документам. Перед присутствующими на пресс-конференции выступили, ответив затем на их вопросы, генеральный директор "РЕДЛАБ" проф. Р. Л. Смелянский, менеджер по маркетингу российского отделения компании Informix Е. Яковлев и менеджер по развитию рынка Восточной Европы в области www и новых технологий Х. Залкин (H. Zalkin).

DataBlade - это программный модуль, встраиваемый в объектно-реляционную СУБД Informix-Universal Server и расширяющий ее функциональные возможности для поддержки специфических данных. Используя несколько модулей DataBlade, можно обеспечить хранение всего многообразия данных (в том числе и видеоинформации на диске, видеоленте или видеосервере), быструю обработку запросов и поиск документов по их содержимому (включая распознавание изображений по таким атрибутам, как цвет, форма, текстура и композиция), комплексный анализ данных (например, временных рядов). На сегодняшний день существует 29 различных по своему функциональному назначению стандартных модулей DataBlade для упомянутой СУБД. Используя специальное средство фирмы Informix, а именно DataBlade Developer Kit, каждый пользователь может разработать собственные модули DataBlade для реализации специфических информационно-поисковых и аналитических задач, причем эти модули будут органично дополнять СУБД Informix-Universal Server.

Модуль DataBlade "Русский текст" использует уникальную технологию морфологического разбора (со скоростью 3-5 Мбайт/м) и высокоэффективный способ индексации, а также допускает расширение словаря (путем добавления новых слов), содержащего в текущей версии более 140 000 словооснов. Пользователь может повышать скорость обработки запросов, определяя списки часто встречающихся, но не используемых для запросов так называемых стоп-слов (служебных слов, союзов, предлогов, местоимений и др.), которые не учитываются при поиске и индексации. Благодаря соответствию стандартам и совместимости с соответствующими модулями, для других языков "Русский текст" можно использовать совместно с другими модулями DataBlade для обработки многоязычных документов. Лингвистическая модель, на которой базируется морфологический разбор, позволяет получить полный спектр производных словоформ для заданной основы. В системе используются идеи и методы, разработанные опытными специалистами, занимающимися проблемой взаимодействия человека и компьютера на русском языке. Используемый в модуле поисковый механизм индексирования позволяет осуществить практически мгновенный полный контекстный поиск по сложным запросам, включающим такие логические операторы, как И, ИЛИ, НЕ, и учитывающим отношение "меньше-больше", поиск по шаблону и нечеткий поиск в случае, если неизвестно точное написание нужного слова. Модуль допускает настройку на лексику заказчика.

С появлением на российском рынке модуля DataBlade "Русский текст" система управления базами данных Informix-Universal Server становится пока единственной СУБД, предоставляющей полную поддержку на русском языке.

Нашел и подготовил Александр Запольскис
E-mail: leshy@nestor.minsk.by
- титульная страница


© Компьютерная газета

полезные ссылки
Оффшорные банковские счета