База данных по русской и английской лексике и морфологии

Состав базы данных морфологического словаря

1. Скрипты для формирования словарной базы в одной из поддерживаемых СУБД:

  MySQL

  MS SQL

  FireBird

  SQLite

  Oracle

Сформированный словарь содержит на выбор русский или английский лексикон с полностью раскрытыми парадигмами изменяемых частей речи (для русского языка это имя существительное, прилагательное, причастие, глагол, сравнительные степени наречия, для английского языка это существительные, прилагательные и наречия с синтетической моделью образования степеней, и глаголы) и проставленными морфологическими атрибутами для каждой словоформы, тезаурус, включающий обширный словарь синонимов, антонимов и однокоренных слов, а также лемматизатор.

Морфологическая база данных позволяет решать такие задачи, как:

  морфологический анализ отдельных слов

  получение нужной грамматической формы слова, то есть склонение существительных, прилагательных и причастий, спряжение глаголов, получение сравнительных и превосходных форм наречий

  лемматизация - приведение слова к базовой словарной форме, а также субстантивация и другие грамматические преобразования

  поиск синонимов, антонимов, переводов, гиперонимов и гипонимов, и пр.

2. Редактор словаря в MySQL SQLex

3. Библиотека ORM Persistent Dictionary для доступа к словарю в MySQL, MS SQL, FireBird, Oracle и через ODBC из .NET кода (C# и пр.)

Программный доступ к словарю

Данный вариант грамматического словаря является обычной реляционной базой данных, поэтому для программного доступа к нему могут использоваться удобные для прикладного программиста средства. В зависимости от используемой СУБД и языка программирования можно применять native API типа OCI, универсальные типа ODBC, и специфичные для одной платформы OLE DB, ADO.NET.

Формирование SQL запросов можно выполнять как самостоятельно, так и поручать эту работу промежуточному слою, например Linq2SQL или ORM Persistent Dictionary, оставаясь в рамках объектно-ориентированной парадигмы.

В качестве отдельного продукта доступен грамматический сервер, в котором SQL словарь дополнен специально скомпилированными вариантами утилит и dll, умеющими загружать словарь из реляционной БД. В грамматическом сервере кроме прямых запросов к базе данных можно использовать любые функции процедурного API, в том числе выполнять морфологический и синтаксический разбор предложений.

Редактирование словаря

С помощью программы SQLex можно редактировать грамматический словарь - добавлять, править, удалять словарные статьи и связи между ними (тезаурус).

Документация и примеры

Детальное описание реляционной схемы грамматического словаря.

Есть также статья с описанием процесса загрузки SQL словаря.

Вводный урок по разным способам поиска слов в словарной базе.

Урок с описанием метода определения части речи.

Урок по поиску и восстановлению слов с буквой ё.

Для основных частей речи детально описано решение типичных задач:

существительное

глагол

прилагательное

причастие

наречие

деепричастие

Демонстрационная версия базы данных

Вы можете скачать скрипт для формирования ознакомительной версии морфологического словаря для одной из поддерживаемых СУБД:

MySQL 4 Мб

MS SQL 4 Мб

FireBird 4 Мб

SQLite 4 Мб

Ознакомительная версия словаря имеет включает набор словарных статей и связей между ними, урезанный до 10000 самых частотных слов русского языка. С точки зрения реляционной структуры таблиц ознакомительная версия полностью идентична коммерческой версии. Для быстрого знакомства рекомендуем воспользоваться SQLite версией - см. подробнее здесь.

На сайте также доступна демонстрационная онлайн-версия словаря

Стоимость SQL словаря, условия использования и обновления

Цена 12000 рублей, за подробностями и разъяснениями пожалуйста обращайтесь к разработчикам.

После покупки SQL словаря Вы сможете бесплатно получать обновления до смены главного номера версии, но не более 1 года.

English >>

  © Elijah Koziev 2010
прикладные проекты на основе грамматического словаря API грамматической машины компоненты для доступа к грамматическому словарю условия получения SDK токенизатор и сегментатор морфологический анализ и синтез лемматизатор база N-грамм синтаксический анализатор словоформы морфология и синтаксис русского языка падеж число род совершенный и несовершенный вид экспорт в SQL формат экспорт в XML формат скрипт SQL словаря структура SQL словаря структура XML словаря компоненты для доступа к грамматическому словарю ORM Persistent Dictionary Library лемматизация стемминг примеры использования грамматического словаря склонение существительных в русском языке склонение русских прилагательных спряжение глаголов в русском языке поиск текста с учетом морфологии OCR подсистема расширенные регулярные выражения генератор текста генератор случайного текста и имитатор рандомизатор синонимизатор перефразировщик Статистика буквенных паттернов

Грамматический словарь русского языка



Грамматический словарь
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
требования: 512 Mb свободной памяти, 300 Мб на диске
размер:         34 Мб

  скачать грамматический словарь купить грамматический словарь SDK грамматического словаря
грамматический словарь русского языка



SDK Грамматического словаря



SDK Грамматического Словаря
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
размер:         13 Мб

SQL словарь (демо):
sqlite mysql oracle firebird mssql

скачать демо-версию SDK купить SDK API грамматического словаря



Поисковая система



Integra
настольная и сетевая поисковая система 

платформа:  Windows XP ... Windows 7
требования: 512 Mb свободной памяти
размер:         21 Мб

Дополнительные компоненты:
MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать поисковую систему SDK поисковой системыописание поисковой системы



SDK Поисковой системы



SDK Поискового движка
API для настольной и сетевой поисковая система 

платформа:  Windows XP ... Windows 7
размер:         17 Мб

Дополнительные компоненты:

MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать SDK SDK поисковой системы



Экранный переводчик



Translator
экранный переводчик

платформа:  Windows XP ... Windows 7
требования: 256 Mb свободной памяти
размер:         4.4 Мб

Дополнительные компоненты:
расширенный англо-русский словарь 6.4 Мб


скачать экранный переводчикописание экранного переводчика



изменено 20-May-12