Падежи в грамматическом словаре

Падежная система в языковой модели

Падежная система - это важнейшая часть языковой модели, на которой строится морфологический и синтаксический анализ текста. Многочисленные правила согласования падежей для разных частей речи позволяют выявлять структуру предложения для языка с относительно свободным порядком слов.

Центральным моментом падежной системы является падеж существительного. Соответствующий набор падежей и особенности их употребления будут описаны далее. Числительные, местоимения и прилагательные, употребляющиеся в аналогичных синтаксических ролях, в целом повторяют порядок склонения существительных, но с некоторыми упрощениями, так как в их парадигмах отсутствуют вспомогательные падежи (локатив, партитив, вокатив).

Второй важный аспект падежной системы русского языка - падежная валентность глаголов, включая причастия и деепричастия, а также предлогов. В отличие от существительных и прилагательных, падежная валентность определяет не образование форм слова, а возможность синтаксического связывания с группой, находящейся в соответствующем падеже:

Я вышел из дому.

Я пришел на занятия.

Я решил задачу.

Мы обменялись номерами телефона.

Для предложных паттернов есть несколько интересных моментов относительно употребления падежей.

Прежде всего, одна падежная форма - предложная - употребляется только с предлогами. Далее, разные предлоги имеют разный набор падежных валентностей - некоторые употребляются только родительным падежом, другие - допускают несколько разных падежей. Такое разнообразие косвенно отражает тот факт, что предложные паттерны имеют разную семантику. Так как количество требуемых семантических концепций значитально превышает количество предлогов, то большинство предлогов могут нести разную семантическую нагрузку.

Наконец, только предлог "в" употребляется с именительным падежом в специальной конструкции, когда присоединяемое одушевленное существительное стоит во множественном числе:

выйти в лидеры чемпионата

Падежи в русском языке

Основные падежи

Падеж - это одна из двух словоизменительных категорий для существительного в русском языке, наряду с грамматическим числом. Изменение существительного по падежам обычно называют склонением. Некоторые другие части речи также изменяются по падежам - прилагательное, причастие, числительное, местоимение.

При рассмотрении морфологии русского языка обычно перечисляют 6 основных падежей:

именительный

родительный

творительный

винительный

дательный

предложный

Основными эти падежи называются потому, что во-первых они широко употребимы, во-вторых все ранее упомянутые части речи имеют грамматические формы для всех этих падежей.

Дополнительные падежи

Некоторые падежные формы встречаются только для существительных. По этой причине, а также в силу своей малоупотребимости соответствующие падежи выделены в группу дополнительных.

счетный встречается в словосочетаниях с числительным, откуда и получил свое название.

Пример: два часá (для сравнения родительный падеж не прошло и чáса)

Так как положение ударения не хранится в грамматическом словаре, данный падеж не используется.

партитив (второй родительный)

Пример: выпьем чаю (для сравнения родительный падеж чая)

В отличие от местного падежа (локатива), партитив обычно можно заменить формой родительного падежа с минимальным изменением семантики: выпьем чая.

К примеру, запрос к базе данных

партитив для существительного

выдаст парадигму существительного чай с формой партитива (вторая колонка, название падежа ПАРТ):

партитив

отложительный (аблатив) - определяет исходную точку передвижения. В русском языке опрактически всегда совпадает с родительным, за некоторыми исключениями.

úз лесу вышел

úз дому вышел

Обратите внимание, что в вышеприведенных словосочетаниях ударение ставится на предлоге, существительное становится полностью безударным.


местный (локатив) иногда еще называется вторым предложным, для подавляющего большинства существительных совпадает с предложным.

Пример: на берегý (для сравнения предложный о бéреге)

Следующий SQL запрос к словарю

локатив местный падеж

даст парадигму существительного лес с формой локатива

локатив


звательный (вокатив) характерен для разговорной речи при обращении к собеседнику

Коль, мам

Список названий падежей русского языка

При наличии исходных текстов словаря можно просто посмотреть на объявление координаты Падеж в файле sg_rus_main.sol.

Другой способ - воспользоваться функциями процедурного API грамматического словаря. В частности, функция sol_GetCoordName возвращает имя координаты, заданной с помощью целочисленной константы, а функции sol_CountCoordStates и sol_GetCoordStateName позволяют перебрать в цикле все состояния координаты.

Наконец, вывести список состояний любой координаты, в том числе падежа, можно с помощью запроса к SQL словарю:

русские падежи

Результат, первый столбец содержит числовой код падежа, который используется в том числе в вызовах процедурного API:

русские падежи

Статистика падежных форм существительтных в русском языке

Далее приводятся гистограммы распределения числа падежных форм существительных в зависимости от последней буквы формы. При этом на всех гистограммах просуммированы формы единственного и множественного числа.

Именительный падеж - для него характерен самый длинный "хвост" распределения, сравнимый с оным для винительного падежа:

именительный падеж существительных в русском языке

Родительный падеж:

родительный падеж существительных в русском языке

Творительный падеж - достоверность отнесения формы к творительному падежу на основании последней буквы почти максимальная, лучше только у предложного:

творительный падеж существительных в русском языке

Винительный падеж, самый нерегулярный падеж русского языка:

винительный падеж существительных в русском языке

Дательный падеж:

дательный падеж существительных в русском языке

Предложный падеж не балует разнообразием окончаний:

предложный падеж существительных в русском языке

Если немного переписать запрос к SQL словарю, то можно получить гистограмму числа грамматических форм существительных, оканчивающихся на конкретную букву или набор букв. Например для буквы м получается

падежи существителного с окончанием 'м'

Как видно, по выборке из одних существительных выбранный признак - окончание м - весьма эффективно детектирует творительный и дательный падеж.

Падежи в английском языке

Английский язык в ходе исторической эволюции практически утратил падежную систему. В настоящее время английские существительные имеют формы 2х падежей - основной номинатив (nominative case) и редко используемый притяжательный (possessive case), который иногда называют Old English genitive. Притяжательный падеж используется только для одушевленных существительных:

horse's head

man's hand

Кроме двух вышеуказанных падежей, английские местоимения в некоторых случаях имеют выделенные формы объектного падежа (objective case), которые появляются в паттернах вида:

I see her.

Do you trust me?

Take him in my heart.

Падежи в японском языке

Формально в японском языке выделяют более дюжины падежных форм существительных. Однако из-за предельной регулярности образования соответствующих форм они не хранятся в словаре в явном виде. Вместо этого мы храним базовую (словарную) форму, а соответствующие падежные суффиксы рассматриваем как отдельную служебную часть речи - постфикс.

Главным приложением, в котором используется японский словарный сегмент, является переводчик. По причинам практического характера в нем японские падежи практически не используются в явном виде. Вместо этого правила трансформации анализируют постфиксы и другие части контекста и переводят на русский язык с их учетом. Таким образом, прямого соответствия между японскими и русскими падежами практически нет.

Определение падежа слова

Определение падежа для изолированного слова

Следует отчетливо понимать, что определение падежа для отдельного слова, без учета контекста, зачастую приводит к неразрешимым неоднозначностям. Виноваты в этом совпадающие падежные формы, например

кошки (родительный падеж единственное число) - кошки (именительные падеж множественное число)

Выполнить определение падежа можно с помощью функций API грамматического словаря, например функция sol_ProjectWord возвращает список всех альтернативных проекций слова на лексикон, далее можно с помощью функции sol_GetProjCoordState определить падеж для каждой из проекций.

Определение падежа для слова в контексте

Знание контекста позволяет убрать из рассмотрения многие варианты при совпадении падежных форм. Например, наличие прилагательного перед существительным уменьшает неоднозначности, обычно до единственного варианта:

большой кошки - большие кошки

Соответствующая работа выполняется морфологическим анализатором. В рамках процедурного API есть функция sol_MorphologyAnalysis, которая выполняет морфологический разбор с учетом большого количества правил согласования слов в естественном языке.

Склонение - получение нужной падежной формы из базовой

Данная задача может решаться в рамках средств грамматического словаря несколькими способами.

При использовании процедурного API  можно использовать функцию sol_GetNounForm для существительного и sol_GetAdjectiveForm для прилагательного.

Дополнительная информация по существительным и прилагательным

Род существительных

Число

Склонение существительных

Склонение прилагательных


Особенности описания русских существительных

Особенности описания английских существительных


Грамматические категории в морфологическом словаре

Морфология русского языка

Особенности согласования прилагательных и существительных


  © Elijah Koziev 2010
прикладные проекты на основе грамматического словаря API грамматической машины компоненты для доступа к грамматическому словарю условия получения SDK токенизатор и сегментатор морфологический анализ и синтез лемматизатор база N-грамм синтаксический анализатор словоформы морфология и синтаксис русского языка падеж число род совершенный и несовершенный вид экспорт в SQL формат экспорт в XML формат скрипт SQL словаря структура SQL словаря структура XML словаря компоненты для доступа к грамматическому словарю ORM Persistent Dictionary Library лемматизация стемминг примеры использования грамматического словаря склонение существительных в русском языке склонение русских прилагательных спряжение глаголов в русском языке поиск текста с учетом морфологии OCR подсистема расширенные регулярные выражения генератор текста генератор случайного текста и имитатор рандомизатор синонимизатор перефразировщик Статистика буквенных паттернов

Грамматический словарь русского языка



Грамматический словарь
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
требования: 512 Mb свободной памяти, 300 Мб на диске
размер:         34 Мб

  скачать грамматический словарь купить грамматический словарь SDK грамматического словаря
грамматический словарь русского языка



SDK Грамматического словаря



SDK Грамматического Словаря
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
размер:         13 Мб

SQL словарь (демо):
sqlite mysql oracle firebird mssql

скачать демо-версию SDK купить SDK API грамматического словаря



Поисковая система



Integra
настольная и сетевая поисковая система 

платформа:  Windows XP ... Windows 7
требования: 512 Mb свободной памяти
размер:         21 Мб

Дополнительные компоненты:
MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать поисковую систему SDK поисковой системыописание поисковой системы



SDK Поисковой системы



SDK Поискового движка
API для настольной и сетевой поисковая система 

платформа:  Windows XP ... Windows 7
размер:         17 Мб

Дополнительные компоненты:

MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать SDK SDK поисковой системы



Экранный переводчик



Translator
экранный переводчик

платформа:  Windows XP ... Windows 7
требования: 256 Mb свободной памяти
размер:         4.4 Мб

Дополнительные компоненты:
расширенный англо-русский словарь 6.4 Мб


скачать экранный переводчикописание экранного переводчика



изменено 05-Nov-12