Искусственный интеллект для электронной документации

Ученые корпорации Xerox изобрели мощное программное обеспечение (ПО), которое обладает искусственным интеллектом для "прочтения" электронных документов. Программа самостоятельно, в автоматическом режиме осуществляет тематическую классификацию материалов с последующей их маршрутизацией (переадресацией) на нужные адреса электронной почты или в онлайновые документарные системы.

Данное ПО разработано как инструмент по категоризации электронных документов для бизнес-пользователей, и ее применение позволит упорядочить и оптимизировать хранение и обработку электронных архивов. Установка этого ПО осуществляется компанией Xerox на лицензионной основе.

Инструменты по категоризации электронных документов, предлагаемые сегодня на рынке, осуществляют автономное архивирование по каждой теме в отдельности, на основе так называемого "линейного" принципа. Например, такие понятия как "биохимия" и "биофизика" с человеческой точки зрения являются смежными темами, однако система линейной категоризации не выявляет между ними никакого сходства. В отличие от уже существующих систем, новая разработка Xerox, созданная на основе запатентованных технологий, строится на иерархической модели классификации, позволяющей устанавливать логическую связь между двумя тематическими категориями и тем самым классифицировать документ более "разумно" с информационной точки зрения.

Основные преимущества новой технологии Xerox
- Система запускается практически мгновенно. Благодаря применению передовых методов машинного обучения, ей достаточно лишь несколько примеров для "усвоения" алгоритма иерархической классификации документов по предложенным категориям.
- Данная технология проста в использовании. С ее помощью легко трансформировать беспорядочный массив электронной информации в четко структурированный архив документов по нужной тематике.
- Данная система способна к самообучению и усвоению совершенно новых категорий без всякого вмешательства оператора. Механизм категоризации самостоятельно идентифицирует новые или прогнозируемые тематические разделы и в рабочем порядке предлагает выявленные новые категории на усмотрение пользователя.

Система категоризации электронных документов, предложенная компанией Xerox способна обрабатывать документы на 20 иностранных языках и ее легко настроить для выполнения конкретных задач пользователя. ПО осуществляет интеллектуальную переадресацию документов нужному абоненту, с помощью индивидуально заданной конфигурации.

Технология документарной категоризации разработана учеными Европейского научно-исследовательского центра Xerox (XRCE) на основе знаний и опыта в области лингвистического анализа и методов машинного обучения. Программа создана на платформе Java и совместима с различными операционными системами включая UNIX, Linux и Windows. Компания Xerox планирует лицензирование данной технологии для поставщиков программного обеспечения или корпораций желающих интегрировать ее в существующие системы документооборота для оптимизации клиентского сервиса, архивирования информации и управления данными.

©1997-2024 Компьютерная газета