- •1 Обработка естественного языка на фонетическом уровне
- •1.3.1 Нейтрализация звонких и глухих согласных
- •1.3.2 Нейтрализация твердых и мягких согласных
- •1.3.3 Нейтрализация удвоенных фонем и одиночных
- •1.3.4 Нейтрализация и ассимиляция согласных фонем по месту и способу образования
- •1.3.5 Непроизносимые согласные
- •1.3.7 Аккомодация
- •1.3.8 Редукция гласных в безударном положении
- •2 Разработка средств обработки естественного языка на морфологическом уровне
- •2.3.1 Классификация исходных форм
- •2.3.2 Склонение имен
- •Чередования в основе.
- •К этой же группе относятся существительные с пометой "мн.", например, санки, ножны, ср. Санок, ножен. Построение сравнительной степени прилагательных.
- •2.3.3 Спряжение
- •Построение глагольных форм.
- •Настоящее время несовершенного вида и будущеевремя совершенного вида.
- •Неличные формы.
- •3 Инструментальные средства морфологического анализа слов русского языка
- •Задания к лабораторным работам Лабораторная работа №1
- •Задание
- •Лабораторная работа №2
- •Содержание отчёта
- •Литература
- •Лабораторная работа №3
- •Содержание отчёта
- •Контрольные вопросы
- •Срок выполнения – 2 недели.
Содержание отчёта
Титульный лист.
Задание, содержащее исходный индивидуальный текст.
Перечень словоформ текста в инверсном порядке (можно в несколько столбцов).
Размеченный словарь начальных форм в инверсном порядке.
Таблицу расшифровки условных обозначений разметки, содержащую поля: условное обозначение, постоянные грамматические характеристики слова, ссылка на правило словоизменения.
Таблицу правил словоизменения для заданного словаря (до 10 правил).
Парадигмы слов по 1 на каждое правило.
Листинг программы с комментариями.
Литература
Зализняк А. А. Русское именное словоизменение. - М.: Наука, 1967.
Зализняк А. А. Грамматический словарь русского языка. Словоизменение. Около 100000 слов. М.:«Русский язык», 1977, 880с.
Лабораторная работа №3
Тема: Морфологический анализ слов русского языка.
Цель: Получение навыков разработки средств морфологического анализа и описания грамматических характеристик слов русского языка в рамках заданной предметной области.
Задание
Для словаря и правил словоизменения, полученных в Л. р. № 2, разработать программу морфологического анализа слов русского языка.
Ход работы
Разработать программу, позволяющую выполнять морфологический анализ:
введенного слова;
слов указанного текстового файла.
Результат морфологического анализа слова – начальная форма слова и описывающая его грамматическую форму морфологическая информация.
Морфологический анализ слова считаем успешным, если получен один или более результатов морфологического анализа. Иначе считаем, что морфологический анализ окончился неудачей.
Результат морфологического анализа слов указанного текстового файла:
текстовый файл, содержащий результаты успешного морфологического анализа слов текста в формате
<слово>\n\t<лемма>\t<МИ>[{\n\t<лемма>\t<МИ>}]\n
текстовый файл, содержащий перечень слов, для которых морфологический анализ окончился неудачей.
Выполнить морфологический анализ исходного текста.
Содержание отчёта
Титульный лист.
Задание, содержащее исходный словарь.
Описание основных структур данных разработанной системы.
Алгоритм морфологического анализа слова.
Результаты морфологического анализа текстового файла из ЛР№ 1.
Листинг программы с комментариями.
Контрольные вопросы
Классификация методов МА, лемма, парадигма, морфологическая информация, способы представления морфологической информации, псевдооснова, псевдоокончание.
Срок выполнения – 2 недели.
Лабораторная работа №4
Тема: Элементы синтаксического анализа.
Цель: Получение навыков использования систем морфологического анализа и освоение элементов синтаксического анализа.
Задание
Используя библиотеку РДМА_ИПИИ, разработать программу, определяющую наличие синтаксической связи между парами слов.
Ход работы
Выбрать из исходного текста 3 простых распространённых предложения.
Для выбранных предложений:
определить морфологическую информацию составляющих его слов;
определить пары (тройки – для предложной связи) связанных слов, определить тип связи, главное и зависимое слова;
построить дерево зависимостей.
Формализовать правила обнаружения связи пар (троек) слов.
Написать программу, определяющую, является ли введённая пара (тройка) слов синтаксически связанной, и каков тип связи. Морфологическую информацию слов программа должна определять средствами библиотеки морфологического анализа слов русского языка «РДМА_ИПИИ».