Ниже перечислены комплексные проекты, демонстрирующие функциональные возможности грамматического движка. Для ознакомления с демонстрационными программами для отдельных функций API перейдите на эту страницу примеров.
Поисковый движок использует морфологический анализатор для приведения слов в запросе к базовой форме и для получения списка возможных словоформ. Тезаурус позволяет определить грамматически связанные слова, синонимы и переводы, которые расширяют результаты поиска. В некоторых случаях может использоваться синтаксический анализатор для проверки, что в найденном документе слова запроса грамматически связаны.
См. также описание настольной поисковой системы Интегра.
|
См. также описание консольной поисковой утилиты faind. |
ThesaurusBrowser - утилита с браузер-подобным интерфейсом для просмотра словаря, в том числе - содержимого словарных статей и связей в тезаурусе. Подробное описание на этой странице. Позволяет искать словарные статьи по любой из грамматических форм:
SQLEditor - редактор словаря, загруженного в SQL базу данных FireBird/MySQL. Входит в состав SDK. Позволяет изменять, создавать и удалять словарные статьи и связи в тезаурусе (подробнее здесь):

Синонимизатор и перефразировщик полностью задействует все части грамматического движка. Морфологический и синтаксический анализаторы используются для определения грамматической структуры предложения, включая грамматическую связь слов, например - прилагательных и существительных. Тезаурус позволяет подыскать синонимы для замены. Морфологический синтезатор используется для приведения подставляемых синонимов в необходимой грамматической форме. При перефразировке выполняется также синтаксический синтез - по синтаксическому графу восстанавливается предложение с изменением порядка слов. Наконец, в некоторых случаях может использоваться база N-грамм как поставщик сведений о прагматике языка.
См. также описание утилиты Rewriter.
Модуль перевода работает в многоязычным словарем. Для разбора исходной фразы используется морфологический и синтаксический анализаторы. Некоторые языки требуют особого подхода к сегментации текста - делению его на отдельные слова. Тезаурус дает переводы отдельных слов. Морфологический анализатор приводит словарные статьи к нужным грамматическим формам. База N-грамм фильтрует грамматически корректные, но недопустимые в языковой практике варианты перевода.
© Elijah Koziev 2010
Поисковая система
SDK Поисковой системы
Экранный переводчик
|
|
изменено 01-Jul-10 | ||||||||||||||||||||||||||||||||||||||