Падежная система - это важнейшая часть языковой модели, на которой строится морфологический и синтаксический анализ текста. Многочисленные правила согласования падежей для разных частей речи позволяют выявлять структуру предложения для языка с относительно свободным порядком слов.
Центральным моментом падежной системы является падеж существительного. Соответствующий набор падежей и особенности их употребления будут описаны далее. Числительные, местоимения и прилагательные, употребляющиеся в аналогичных синтаксических ролях, в целом повторяют порядок склонения существительных, но с некоторыми упрощениями, так как в их парадигмах отсутствуют вспомогательные падежи (локатив, партитив, вокатив).
Второй важный аспект падежной системы русского языка - падежная валентность глаголов, включая причастия и деепричастия, а также предлогов. В отличие от существительных и прилагательных, падежная валентность определяет не образование форм слова, а возможность синтаксического связывания с группой, находящейся в соответствующем падеже:
Я вышел из дому.
Я пришел на занятия.
Я решил задачу.
Мы обменялись номерами телефона.
Для предложных паттернов есть несколько интересных моментов относительно употребления падежей.
Прежде всего, одна падежная форма - предложная - употребляется только с предлогами. Далее, разные предлоги имеют разный набор падежных валентностей - некоторые употребляются только родительным падежом, другие - допускают несколько разных падежей. Такое разнообразие косвенно отражает тот факт, что предложные паттерны имеют разную семантику. Так как количество требуемых семантических концепций значитально превышает количество предлогов, то большинство предлогов могут нести разную семантическую нагрузку.
Наконец, только предлог "в" употребляется с именительным падежом в специальной конструкции, когда присоединяемое одушевленное существительное стоит во множественном числе:
выйти в лидеры чемпионата
Падеж - это одна из двух словоизменительных категорий для существительного в русском языке, наряду с грамматическим числом. Изменение существительного по падежам обычно называют склонением. Некоторые другие части речи также изменяются по падежам - прилагательное, причастие, числительное, местоимение.
При рассмотрении морфологии русского языка обычно перечисляют 6 основных падежей:
именительный
родительный
творительный
винительный
дательный
предложный
Основными эти падежи называются потому, что во-первых они широко употребимы, во-вторых все ранее упомянутые части речи имеют грамматические формы для всех этих падежей.
Некоторые падежные формы встречаются только для существительных. По этой причине, а также в силу своей малоупотребимости соответствующие падежи выделены в группу дополнительных.
счетный встречается в словосочетаниях с числительным, откуда и получил свое название.
Пример: два часá (для сравнения родительный падеж не прошло и чáса)
Так как положение ударения не хранится в грамматическом словаре, данный падеж не используется.
партитив (второй родительный)
Пример: выпьем чаю (для сравнения родительный падеж чая)
В отличие от местного падежа (локатива), партитив обычно можно заменить формой родительного падежа с минимальным изменением семантики: выпьем чая.
К примеру, запрос к базе данных

выдаст парадигму существительного чай с формой партитива (вторая колонка, название падежа ПАРТ):

отложительный (аблатив) - определяет исходную точку передвижения. В русском языке опрактически всегда совпадает с родительным, за некоторыми исключениями.
úз лесу вышел
úз дому вышел
Обратите внимание, что в вышеприведенных словосочетаниях ударение ставится на предлоге, существительное становится полностью безударным.
местный (локатив) иногда еще называется вторым предложным, для подавляющего большинства существительных совпадает с предложным.
Пример: на берегý (для сравнения предложный о бéреге)
Следующий SQL запрос к словарю

даст парадигму существительного лес с формой локатива

звательный (вокатив) характерен для разговорной речи при обращении к собеседнику
Коль, мам
При наличии исходных текстов словаря можно просто посмотреть на объявление координаты Падеж в файле sg_rus_main.sol.
Другой способ - воспользоваться функциями процедурного API грамматического словаря. В частности, функция sol_GetCoordName возвращает имя координаты, заданной с помощью целочисленной константы, а функции sol_CountCoordStates и sol_GetCoordStateName позволяют перебрать в цикле все состояния координаты.
Наконец, вывести список состояний любой координаты, в том числе падежа, можно с помощью запроса к SQL словарю:

Результат, первый столбец содержит числовой код падежа, который используется в том числе в вызовах процедурного API:

Далее приводятся гистограммы распределения числа падежных форм существительных в зависимости от последней буквы формы. При этом на всех гистограммах просуммированы формы единственного и множественного числа.
Именительный падеж - для него характерен самый длинный "хвост" распределения, сравнимый с оным для винительного падежа:
Родительный падеж:
Творительный падеж - достоверность отнесения формы к творительному падежу на основании последней буквы почти максимальная, лучше только у предложного:
Винительный падеж, самый нерегулярный падеж русского языка:
Дательный падеж:
Предложный падеж не балует разнообразием окончаний:
Если немного переписать запрос к SQL словарю, то можно получить гистограмму числа грамматических форм существительных, оканчивающихся на конкретную букву или набор букв. Например для буквы м получается
Как видно, по выборке из одних существительных выбранный признак - окончание м - весьма эффективно детектирует творительный и дательный падеж.
Английский язык в ходе исторической эволюции практически утратил падежную систему. В настоящее время английские существительные имеют формы 2х падежей - основной номинатив (nominative case) и редко используемый притяжательный (possessive case), который иногда называют Old English genitive. Притяжательный падеж используется только для одушевленных существительных:
horse's head
man's hand
Кроме двух вышеуказанных падежей, английские местоимения в некоторых случаях имеют выделенные формы объектного падежа (objective case), которые появляются в паттернах вида:
I see her.
Do you trust me?
Take him in my heart.
Формально в японском языке выделяют более дюжины падежных форм существительных. Однако из-за предельной регулярности образования соответствующих форм они не хранятся в словаре в явном виде. Вместо этого мы храним базовую (словарную) форму, а соответствующие падежные суффиксы рассматриваем как отдельную служебную часть речи - постфикс.
Главным приложением, в котором используется японский словарный сегмент, является переводчик. По причинам практического характера в нем японские падежи практически не используются в явном виде. Вместо этого правила трансформации анализируют постфиксы и другие части контекста и переводят на русский язык с их учетом. Таким образом, прямого соответствия между японскими и русскими падежами практически нет.
Следует отчетливо понимать, что определение падежа для отдельного слова, без учета контекста, зачастую приводит к неразрешимым неоднозначностям. Виноваты в этом совпадающие падежные формы, например
кошки (родительный падеж единственное число) - кошки (именительные падеж множественное число)
Выполнить определение падежа можно с помощью функций API грамматического словаря, например функция sol_ProjectWord возвращает список всех альтернативных проекций слова на лексикон, далее можно с помощью функции sol_GetProjCoordState определить падеж для каждой из проекций.
Знание контекста позволяет убрать из рассмотрения многие варианты при совпадении падежных форм. Например, наличие прилагательного перед существительным уменьшает неоднозначности, обычно до единственного варианта:
большой кошки - большие кошки
Соответствующая работа выполняется морфологическим анализатором. В рамках процедурного API есть функция sol_MorphologyAnalysis, которая выполняет морфологический разбор с учетом большого количества правил согласования слов в естественном языке.
Данная задача может решаться в рамках средств грамматического словаря несколькими способами.
При использовании процедурного API можно использовать функцию sol_GetNounForm для существительного и sol_GetAdjectiveForm для прилагательного.
Особенности описания русских существительных
Особенности описания английских существительных
Грамматические категории в морфологическом словаре
Особенности согласования прилагательных и существительных
© Elijah Koziev 2010
Поисковая система
SDK Поисковой системы
Экранный переводчик
|
|
изменено 05-Nov-12 | ||||||||||||||||||||||||||||||||||||||