Падежи в грамматическом словаре

Падежи в русском языке

Основные падежи

Падеж - это одна из двух словоизменительных категорий для существительного в русском языке, наряду с грамматическим числом. Изменение существительного по падежам обычно называют склонением. Некоторые другие части речи также изменяются по падежам - прилагательное, причастие, числительное, местоимение.

При рассмотрении морфологии русского языка обычно перечисляют 6 основных падежей:

именительный

родительный

творительный

винительный

дательный

предложный

Основными эти падежи называются потому, что во-первых они широко употребимы, во-вторых все ранее упомянутые части речи имеют грамматические формы для всех этих падежей.

Дополнительные падежи

Некоторые падежные формы встречаются только для существительных. По этой причине, а также в силу своей малоупотребимости соответствующие падежи выделены в группу дополнительных.

счетный встречается в словосочетаниях с числительным, откуда и получил свое название.

Пример: два часá (для сравнения родительный падеж не прошло и чáса)

Так как положение ударения не хранится в грамматическом словаре, данный падеж не используется.

партитив (второй родительный)

Пример: выпьем чаю (для сравнения родительный падеж чая)

В отличие от местного падежа (локатива), партитив обычно можно заменить формой родительного падежа с минимальным изменением семантики: выпьем чая.

К примеру, запрос к базе данных

партитив для существительного

выдаст парадигму существительного чай с формой партитива (вторая колонка, название падежа ПАРТ):

партитив

отложительный (аблатив) - определяет исходную точку передвижения. В русском языке опрактически всегда совпадает с родительным, за некоторыми исключениями.

úз лесу вышел

úз дому вышел

Обратите внимание, что в вышеприведенных словосочетаниях ударение ставится на предлоге, существительное становится полностью безударным.


местный (локатив) иногда еще называется вторым предложным, для подавляющего большинства существительных совпадает с предложным.

Пример: на берегý (для сравнения предложный о бéреге)

Следующий SQL запрос к словарю

локатив местный падеж

даст парадигму существительного лес с формой локатива

локатив


звательный (вокатив) характерен для разговорной речи при обращении к собеседнику

Коль, мам

Список названий падежей русского языка

При наличии исходных текстов словаря можно просто посмотреть на объявление координаты Падеж в файле sg_rus_main.sol.

Другой способ - воспользоваться функциями процедурного API грамматического словаря. В частности, функция sol_GetCoordName возвращает имя координаты, заданной с помощью целочисленной константы, а функции sol_CountCoordStates и sol_GetCoordStateName позволяют перебрать в цикле все состояния координаты.

Наконец, вывести список состояний любой координаты, в том числе падежа, можно с помощью запроса к SQL словарю:

русские падежи

Результат, первый столбец содержит числовой код падежа, который используется в том числе в вызовах процедурного API:

русские падежи

Статистика падежных форм существительтных в русском языке

Далее приводятся гистограммы распределения числа падежных форм существительных в зависимости от последней буквы формы. При этом на всех гистограммах просуммированы формы единственного и множественного числа.

Именительный падеж - для него характерен самый длинный "хвост" распределения, сравнимый с оным для винительного падежа:

именительный падеж существительных в русском языке

Родительный падеж:

родительный падеж существительных в русском языке

Творительный падеж - достоверность отнесения формы к творительному падежу на основании последней буквы почти максимальная, лучше только у предложного:

творительный падеж существительных в русском языке

Винительный падеж, самый нерегулярный падеж русского языка:

винительный падеж существительных в русском языке

Дательный падеж:

дательный падеж существительных в русском языке

Предложный падеж не балует разнообразием окончаний:

предложный падеж существительных в русском языке

Если немного переписать запрос к SQL словарю, то можно получить гистограмму числа грамматических форм существительных, оканчивающихся на конкретную букву или набор букв. Например для буквы м получается

падежи существителного с окончанием 'м'

Как видно, по выборке из одних существительных выбранный признак - окончание м - весьма эффективно детектирует творительный и дательный падеж.

Падежи в английском языке

Английский язык в ходе исторической эволюции практически утратил падежную систему. В настоящее время английские существительные имеют формы 2х падежей - основной номинатив (nominative case) и редко используемый притяжательный (possessive case), который иногда называют Old English genitive. Притяжательный падеж используется только для одушевленных существительных:

horse's head

man's hand

Кроме двух вышеуказанных падежей, английские местоимения в некоторых случаях имеют выделенные формы объектного падежа (objective case), которые появляются в паттернах вида:

I see her.

Do you trust me?

Take him in my heart.

Падежи в японском языке

Формально в японском языке выделяют более дюжины падежных форм существительных. Однако из-за предельной регулярности образования соответствующих форм они не хранятся в словаре в явном виде. Вместо этого мы храним базовую (словарную) форму, а соответствующие падежные суффиксы рассматриваем как отдельную служебную часть речи - постфикс.

Главным приложением, в котором используется японский словарный сегмент, является переводчик. По причинам практического характера в нем японские падежи практически не используются в явном виде. Вместо этого правила трансформации анализируют постфиксы и другие части контекста и переводят на русский язык с их учетом. Таким образом, прямого соответствия между японскими и русскими падежами практически нет.

Определение падежа слова

Определение падежа для изолированного слова

Следует отчетливо понимать, что определение падежа для отдельного слова, без учета контекста, зачастую приводит к неразрешимым неоднозначностям. Виноваты в этом совпадающие падежные формы, например

кошки (родительный падеж единственное число) - кошки (именительные падеж множественное число)

Выполнить определение падежа можно с помощью функций API грамматического словаря, например функция sol_ProjectWord возвращает список всех альтернативных проекций слова на лексикон, далее можно с помощью функции sol_GetProjCoordState определить падеж для каждой из проекций.

Определение падежа для слова в контексте

Знание контекста позволяет убрать из рассмотрения многие варианты при совпадении падежных форм. Например, наличие прилагательного перед существительным уменьшает неоднозначности, обычно до единственного варианта:

большой кошки - большие кошки

Соответствующая работа выполняется морфологическим анализатором. В рамках процедурного API есть функция sol_MorphologyAnalysis, которая выполняет морфологический разбор с учетом большого количества правил согласования слов в естественном языке.

Склонение - получение нужной падежной формы из базовой

Данная задача может решаться в рамках средств грамматического словаря несколькими способами.

При использовании процедурного API  можно использовать функцию sol_GetNounForm для существительного и sol_GetAdjectiveForm для прилагательного.

Дополнительная информация по существительным и прилагательным

Род существительных

Число

Склонение существительных

Склонение прилагательных


Особенности описания русских существительных

Особенности описания английских существительных


Грамматические категории в морфологическом словаре

Морфология русского языка

Особенности согласования прилагательных и существительных


  © Elijah Koziev 2010
прикладные проекты на основе грамматического словаря API грамматической машины компоненты для доступа к грамматическому словарю условия получения SDK токенизатор и сегментатор морфологический анализ и синтез лемматизатор база N-грамм синтаксический анализатор словоформы морфология и синтаксис русского языка падеж число род совершенный и несовершенный вид экспорт в SQL формат экспорт в XML формат скрипт SQL словаря структура SQL словаря структура XML словаря компоненты для доступа к грамматическому словарю ORM Persistent Dictionary Library лемматизация стемминг примеры использования грамматического словаря склонение существительных в русском языке склонение русских прилагательных спряжение глаголов в русском языке поиск текста с учетом морфологии OCR подсистема расширенные регулярные выражения генератор текста генератор случайного текста и имитатор рандомизатор синонимизатор перефразировщик Статистика буквенных паттернов

Грамматический словарь русского языка



Грамматический словарь
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
требования: 512 Mb свободной памяти, 300 Мб на диске
размер:         34 Мб

  скачать грамматический словарь купить грамматический словарь SDK грамматического словаря
грамматический словарь русского языка



SDK Грамматического словаря



SDK Грамматического Словаря
склонение и спряжение глаголов, существительных, прилагательных

В состав входит русский и английский словарь.

платформа:  Windows 2000 ... Windows 7
размер:         13 Мб

SQL словарь (демо):
sqlite mysql oracle firebird mssql

скачать демо-версию SDK купить SDK API грамматического словаря



Поисковая система



Integra
настольная и сетевая поисковая система 

платформа:  Windows XP ... Windows 7
требования: 512 Mb свободной памяти
размер:         21 Мб

Дополнительные компоненты:
MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать поисковую систему SDK поисковой системыописание поисковой системы



SDK Поисковой системы



SDK Поискового движка
API для настольной и сетевой поисковая система 

платформа:  Windows XP ... Windows 7
размер:         17 Мб

Дополнительные компоненты:

MySQL поисковый сервер 13.5 Мб
Integra.Premium MySQL 3.9 Мб

скачать SDK SDK поисковой системы



Экранный переводчик



Translator
экранный переводчик

платформа:  Windows XP ... Windows 7
требования: 256 Mb свободной памяти
размер:         4.4 Мб

Дополнительные компоненты:
расширенный англо-русский словарь 6.4 Мб


скачать экранный переводчикописание экранного переводчика



изменено 22-Aug-11