В состав текущей версии SDK грамматического словаря входят:
Русский морфологический словарь -
лексикон и тезаурус,
более 205 тысяч словарных статей, десятки тысяч
синонимов,
антонимов,
гипернимов и гипонимов,
однокоренных слов и так далее. Вместо
русской словарной базы можно выбрать вариант SDK с английским словарем - см. далее.
Английский морфологический
словарь, включающий около 210 тысяч словарных статей.
Токенизатор и сегментатор
текста (подробнее
).
Модуль морфологического разбора слов и предложений (подробнее
), для русского или английского языка соответственно.
Модуль синтаксического разбора предложения (подробнее
), для русского или английского языка соответственно.
Скомпилированная dll/so для доступа к базе грамматического
словаря для выбранной x32 или x64 платформы Windows или Linux, и
.NET обертка для Win 32/64 DLL, имеющие большой
набор функций для выполнения склонения,
спряжения, проверки согласования, определения
морфологических атрибутов слова, и так далее.
Скомпилированная dll и so лемматизатора
для Windows 32/64 и .NET с примерами на C++, стеммер и
библиотека поиска ключевых слов с морфологией для .NET с примерами
Компилятор словаря, скрипт для расширения
базового русского словарного модуля, учебный анализатор русских предложений в виде исходников и скрипта пересборки анализатора.
Утилиты для Windows и Linux: lexicon,
syntax, empirika
Утилиты для Windows
debugger (только 32 бита),
LexiconEditor,
Thesaurus
Примеры
использования на C++, C#, Delphi.
Обратите внимание, что в SDK грамматического словаря не входит генератор текста и перефразировщик.
Варианты SDK для Windows и Linux поставляются как отдельные программные продукты. Английский и русский варианты словарной базы и анализаторов также являются отдельными программными продуктами.
Перейти к детальному описанию
API грамматического движка 
Для получения информации и разъяснений обращайтесь к разработчикам, пожалуйста.
При покупке и русского, и английского словарей предоставляется бонус - двуязычный русско-английский словарь, в котором тезаурус дополнительно содержит переводы слов.
Перед принятием решения о покупке SDK грамматического словаря Вы можете скачать ознакомительную версию SDK под нужную платформу:
Скачать русскую морфологию для Windows 32 бита (20 Мб)
Скачать русскую морфологию для Linux 32 бита (31 Мб)
Скачать русскую морфологию для Linux 64 бита (31 Мб)
Ознакомительная версия грамматического словаря может быть использована в любых коммерческих приложениях при условии указания ссылки на данный ресурс.
Эта версия практически идентична полному дистрибутиву, за исключением нескольких функциональных и количественных ограничений. В частности, в ней урезан русский тезаурус и лексикон, то есть уменьшено количество словарных статей, синонимов и других связей. Также в ней отсутствуют средства для пополнения лексикона.
В ознакомительный SDK входит упрощенный английский словарный модуль. Для его подключения достаточно скопировать содержимое каталога bin-windows-english в bin-windows после установки или распаковки дистрибутива. Настройка всех утилит на работу с английскими словами и предложениями произойдет автоматически.
Процедуры морфологического разбора и синтаксического анализа предложений в ознакомительном варианте SDK ничем не отличаются от коммерческой версии SDK. В состав дистрибутива входят утилиты Lexicon и Syntax, а также программа Debugger, позволяющие проверить процесс морфологического и синтаксического разбора в интерактивном режиме. Кроме того, входящий в SDK грамматического словаря компонент solarix_grammar_engine.dll (или solarix_grammar_engine.so для Linux) дает возможность удобного вызова функций API из прикладного кода на C, C++ и Delphi.
После установки или распаковки архива в подкаталоге ...\demo\ai\solarix\Grammar_Engine можно найти несколько примеров вызова процедур API из программ на C++, C# и Delphi.
В качестве демонстрации функциональных возможностей можно также взять бесплатную программу морфологического разбора слов и предложений.
Отдельно доступна условно-бесплатная программа Грамматический Словарь Русского Языка, которая предоставляет простой и удобный доступ к русскому и английскому лексикону и тезаурусу с удобной навигацией в стиле веб-браузера.
Обновление дистрибутива при изменении старшего номера версии, например с 9.xx на 10.xx, предоставляется со скидкой 50%.
Обновление дистрибутива при изменении младшего номера версии предоставляется либо бесплатно, либо со скидкой до 90%.
Для морфологического словаря под Windows необходимо запустить сначала основной инсталлятор и затем инсталлятор выбранного языка. Они установят компоненты и все остальные файлы в выбранный каталог, по умолчанию это будет c:\Program Files\RussianGrammaticalDictionary. После этого можно перейти в подкаталог demo\ai\solarix\Grammar_Engine\Lexicon и ознакомиться с примером использования solarix_grammar_dictionary.dll.
Для Linux-версии морфологического словаря необходимо распаковать архив, перейти в подкаталог .../scripts/build и вызвать в консоли команды: su, ./install.sh и exit. Динамические библиотеки будут скопированы в соответствующий каталог, после чего можно, к примеру, перейти в подкаталог .../demo/ai/solarix/Grammar_Engine/Lemmatizator/C и ознакомиться с демонстрацией работы русского лемматизатора. В каталоге .../demo/ai/solarix/Grammar_Engine/LexiconLinux можно найти пример работы на C с морфологическим анализатором русского языка.
Для проверки работоспособности русского словаря необходимо открыть консоль в каталоге ...\scripts\syntax, и запустить скрипты тестирования lemmatizer-ru.cmd, morphology-ru.cmd и syntax-ru.cmd. Они содержат протестируют лемматизатор, морфологический и синтаксический анализатор.
Проверка английского словаря заключается в запуске скриптов morphology-en.cmd и syntax-en.cmd в том же каталоге.
Некоторые технические ограничения, накладываемые локальным бинарным словарем из данного продукта, могут быть преодолены переходом на серверный вариант. В серверном варианте словарь полностью размещается в реляционной СУБД, а исполнимые модули, включая dll движка, работают как клиенты БД.
При этом процедурный API в серверном варианте полностью идентичен "локальной" версии. Благодаря этому программы, работающие с грамматическим словарем через API, не нуждаются в переработке и даже пересборке. Достаточно заменить solarix_grammar_engine.dll на solarix_grammar_engine_mysql.dll и при создании экземпляра словаря указать на измененный конфигурационный файл dictionary.xml
Детальные характеристики серверного варианта доступны на странице продукта.
© Elijah Koziev 2010
Поисковая система
SDK Поисковой системы
Экранный переводчик
|
|
изменено 20-May-12 | ||||||||||||||||||||||||||||||||||||||