- •1 Обработка естественного языка на фонетическом уровне
- •1.3.1 Нейтрализация звонких и глухих согласных
- •1.3.2 Нейтрализация твердых и мягких согласных
- •1.3.3 Нейтрализация удвоенных фонем и одиночных
- •1.3.4 Нейтрализация и ассимиляция согласных фонем по месту и способу образования
- •1.3.5 Непроизносимые согласные
- •1.3.7 Аккомодация
- •1.3.8 Редукция гласных в безударном положении
- •2 Разработка средств обработки естественного языка на морфологическом уровне
- •2.3.1 Классификация исходных форм
- •2.3.2 Склонение имен
- •Чередования в основе.
- •К этой же группе относятся существительные с пометой "мн.", например, санки, ножны, ср. Санок, ножен. Построение сравнительной степени прилагательных.
- •2.3.3 Спряжение
- •Построение глагольных форм.
- •Настоящее время несовершенного вида и будущеевремя совершенного вида.
- •Неличные формы.
- •3 Инструментальные средства морфологического анализа слов русского языка
- •Задания к лабораторным работам Лабораторная работа №1
- •Задание
- •Лабораторная работа №2
- •Содержание отчёта
- •Литература
- •Лабораторная работа №3
- •Содержание отчёта
- •Контрольные вопросы
- •Срок выполнения – 2 недели.
2.3.1 Классификация исходных форм
Словарная статья в словаре Зализняка состоит из:
заглавного слова;
основного буквенного символа;
индекса;
дополнительных помет и указаний.
В частном случае тот или иной из этих элементов может отсутствовать.
Если разным значениям слова соответствуют какие-то различия в образовании форм, словарная статья распадается на несколько подстатей, каждая из которых строится как самостоятельная статья.
Основной буквенный символ (у всех слов, кроме существительных и глаголов) – это буквенное сокращение, обозначающее часть речи. У существительных основной буквенный символ состоит из символов рода и одушевленности (или символа «мн.»), у глаголов из символов вида и переходности или непереходности1); часть речи в этих случаях не указывается, поскольку она ясна из основного буквенного символа.
Индексы имеются только у изменяемых частей речи. Элементы, из которых складывается индекс таковы (обязательным является только первый из них):
а) тип склонения или спряжения (от 0 до 8 у имен, от 1 до 16 у глаголов);
б) символы наличия чередований в основе;
в) символы одного из наиболее распространенных отклонений от стандартного склонения или спряжения.
2.3.2 Склонение имен
Тип склонения обозначается цифрой от 0 до 8. Цифра 0 означает, что слово неизменяемо (т. е. все формы внешне одинаковы). Цифры 1-7 означают разные типы склонения, зависящие от того, на что оканчивается основа слова. Цифра 8 означает особый тип склонения, отличающийся сразу от всех типов 1-7.
Для различения типов 1-7 необходимо введём понятие «графической основы» слова. Под графической основой слова понимается буквенная последовательность, получаемая из исходной формы слова следующими операциями:
а) у слов субстантивного (существительные) и местоименного склонений:
1) если они оканчиваются на гласную, -ь, -й, отбрасывается одна конечная буква;
2) если они оканчиваются на согласную (кроме й), графическая форма равна исходной форме;
б) у слов субстантивного склонения:
1) (кроме оканчивающихся на -ся) отбрасываются две конечных буквы;
2) у слов на -ся отбрасывается 4 буквы.
Примеры выделения графической основы: акул-а, лыжн-я, ведр‑о, бель-е, кра-й, топол-ь, лиси-й, поезд, стол, дядин, отцов; бел-ый, син-ий, часовой, запят-ая, пресмыкающ-ееся.
Субстантивное, адъективное и местоименное склонения характеризуются своими окончаниями. В таблицах 2.1-2.4 приводятся стандартные (т. е. наиболее распространенные и потому принимаемые за норму) окончания этих трех склонений. Что касается склонения числительных, то оно не представляет собой чего-либо единого и имеет много аномалий.
Окончания приводятся ниже в графической (не фонемной) форме. Они даны в двух вариантах: слева от косой черты окончания типа 1, справа – типа 2. (С содержательной точки зрения окончания типа 1 – это стандартные окончания основ на твердую согласную, типа 2 – для слов на мягкую согласную). Запись без косой черты означает, что окончания типов 1 и 2 здесь одинаковы. В некоторых случаях имеются, кроме того, варианты окончания, зависящие от места ударения(запись безуд. …; уд. …). В творительном падеже женского рода таблиц 2.1, 2.2 и 2.4 наряду с окончаниями -ой/-ей употребляется и -ою/-ею. Нулевое окончание обозначается ‘#’.
Окончания типов 3-7 представляют собой комбинации из окончаний типа 1 и 2.
Таблица 2.1 – Оончания субстантивного склонения
|
Единственное число |
Множественное число |
||||||
|
М |
С |
ж |
М |
С |
ж |
||
И. |
#/ -ь |
-о / -е |
-а / -я |
-ы / -и |
-а / -я |
-ы / -и |
||
Р. |
-а / -я |
-ы / -и |
-ов / -ей |
# / безуд.-ь, уд. -ей |
||||
Д. |
-у / -ю |
-е |
-ам / -ям |
|||||
В. |
Неод. |
= И. |
= И. |
-у / -ю |
= И. |
|||
|
Одуш. |
= Р. |
|
|
= Р. |
|||
Т. |
-ом / -ем |
-ой* / -ей* |
-ами / -ями |
|||||
П. |
-е |
-ах / -ях |
Таблица 2.2 – Окончания адъективного склонения. Полные формы
|
Ед. |
Мн. |
||||
|
М. |
с. |
ж. |
(всех родов) |
||
И. |
[ ый ой]/-ий |
-ое / -ее |
-ая / -яя |
-ые / -ие |
||
Р. |
-ого / -его |
-ой / -ей |
-ых / -их |
|||
Д. |
-ому / -ему |
-ой / -ей |
-ым / -им |
|||
В. |
Неод. |
= И. |
= И. |
-ую / -юю |
= И. |
|
|
Одуш. |
= Р. |
|
|
= Р. |
|
Т. |
-ым / -им |
-ой* / -ей* |
-ыми/ -ими |
|||
П. |
-ом / -ем |
-ой / -ей |
-ых / -их |
Таблица 2.3 – Окончания адъективного склонения. Краткие формы
Ед. |
Мн. |
||
м. |
с. |
Ж. |
(всех родов) |
# / -ь |
-о / -е |
-а / -я |
-ы / -и |
Таблица 2.4 – Окончания местоименного склонения
|
Ед. |
Мн. |
|||
|
М. |
с. |
ж. |
(всех родов) |
|
И. |
# /-ь |
-о / -е |
-а / -я |
-ые / -ие |
|
Р. |
-ого / -его |
-ой / -ей |
-ых / -их |
||
Д. |
-ому / -ему |
-ой / -ей |
-ым / -им |
||
В |
Неод. |
= И. |
= И. |
-у / -ю |
= И. |
|
Одуш. |
= Р. |
|
|
= Р. |
Т. |
-ым / -им |
-ой* / -ей* |
-ыми/ -ими |
||
П. |
-ом / -ем |
-ой / -ей |
-ых / -их |
В приводимой таблице 2.5 окончания каждого из типов представлены как результат некоторых буквенных замен в окончаниях типа 1 и 2 (в субстантивном склонении в отдельных случаях выступают просто другие окончания).
Замене везде подвергается только первая буква окончания, так замена ы на и означает, что во всяком окончании, начинающемся с ы (например -ы, -ые, -ым, -ыми и т.д.) это ы заменяется на и (т.е. получается -и, -ие, -им, -ими и т.д.); замена безударного о на е означает такое же преобразование, но только в тех формах, где начальная гласная окончания не имеет ударения.
Цифра 8 означает особый тип склонения (представлены только у существительных).
Его окончания: И.,В. -ь, Р., Д., П., -и, Т. жен. -ью, муж. -ем; мн. число - окончания типа 2, кроме Р. мн., где всегда -ей, независимо от ударения (после шипящих я в окончаниях заменяется на а).
Таблица 2.5 – Отличия типов склонения 3-7 от 1,2
Тип склонения |
Графическая основа оканчивается на: |
Окончания |
Дополнительные особенности субстантивного склонения |
3 |
к, г, х |
типа 1, с заменой ы на и |
- |
4 |
ш, ж, ч, щ |
типа 1, с заменами: ы на и; безуд. о на е |
в Р. мн. муж. -ей (вместо -ов, -ев ); Р. мн. Жен. и сред. безуд. Нуль / уд. -ей (вместо нуля) |
5 |
ц |
типа 1, с заменой безуд. о на е |
- |
6 |
Гласную (кроме и) или й |
типа 2 с |
в Р. мн. Муж. -ев (вместо -ей ); Р. мн. жен. и сред. й (вместо -ь -ей) |
7 |
и |
Заменой ь на й |
в Р. Мн. особенности , как в типе 6; в Д. ед. жен. и П. всех родов [безуд.-и/уд. -е] (вместо -е) |