1. Скрипты для формирования словарной базы в одной из поддерживаемых СУБД:
MySQL
MS SQL
FireBird
SQLite
Oracle
Сформированный словарь содержит на выбор русский или английский лексикон с полностью раскрытыми парадигмами изменяемых частей речи (для русского языка это имя существительное, прилагательное, причастие, глагол, сравнительные степени наречия, для английского языка это существительные, прилагательные и наречия с синтетической моделью образования степеней, и глаголы) и проставленными морфологическими атрибутами для каждой словоформы, тезаурус, включающий обширный словарь синонимов, антонимов и однокоренных слов, а также лемматизатор.
Морфологическая база данных позволяет решать такие задачи, как:
морфологический анализ отдельных слов
получение нужной грамматической формы слова, то есть
склонение существительных, прилагательных и причастий,
спряжение глаголов, получение сравнительных и превосходных форм
наречий
лемматизация - приведение
слова к базовой словарной форме, а также субстантивация и другие грамматические преобразования
поиск синонимов,
антонимов, переводов, гиперонимов и гипонимов, и пр.
2. Редактор словаря в MySQL SQLex
3. Библиотека ORM Persistent Dictionary для доступа к словарю в MySQL, MS SQL, FireBird, Oracle и через ODBC из .NET кода (C# и пр.)
Данный вариант грамматического словаря является обычной реляционной базой данных, поэтому для программного доступа к нему могут использоваться удобные для прикладного программиста средства. В зависимости от используемой СУБД и языка программирования можно применять native API типа OCI, универсальные типа ODBC, и специфичные для одной платформы OLE DB, ADO.NET.
Формирование SQL запросов можно выполнять как самостоятельно, так и поручать эту работу промежуточному слою, например Linq2SQL или ORM Persistent Dictionary, оставаясь в рамках объектно-ориентированной парадигмы.
В качестве отдельного продукта доступен грамматический сервер, в котором SQL словарь дополнен специально скомпилированными вариантами утилит и dll, умеющими загружать словарь из реляционной БД. В грамматическом сервере кроме прямых запросов к базе данных можно использовать любые функции процедурного API, в том числе выполнять морфологический и синтаксический разбор предложений.
С помощью программы SQLex можно редактировать грамматический словарь - добавлять, править, удалять словарные статьи и связи между ними (тезаурус).
Детальное описание реляционной схемы грамматического словаря.
Есть также статья с описанием процесса загрузки SQL словаря.
Вводный урок по разным способам поиска слов в словарной базе.
Урок с описанием метода определения части речи.
Урок по поиску и восстановлению слов с буквой ё.
Для основных частей речи детально описано решение типичных задач:
Вы можете скачать скрипт для формирования ознакомительной версии морфологического словаря для одной из поддерживаемых СУБД:
Ознакомительная версия словаря имеет включает набор словарных статей и связей между ними, урезанный до 10000 самых частотных слов русского языка. С точки зрения реляционной структуры таблиц ознакомительная версия полностью идентична коммерческой версии. Для быстрого знакомства рекомендуем воспользоваться SQLite версией - см. подробнее здесь.
На сайте также доступна демонстрационная онлайн-версия словаря
Цена 12000 рублей, за подробностями и разъяснениями пожалуйста обращайтесь к разработчикам.
После покупки SQL словаря Вы сможете бесплатно получать обновления до смены главного номера версии, но не более 1 года.
© Elijah Koziev 2010
Поисковая система
SDK Поисковой системы
Экранный переводчик
|
|
изменено 20-May-12 | ||||||||||||||||||||||||||||||||||||||