- •1 Обработка естественного языка на фонетическом уровне
- •1.3.1 Нейтрализация звонких и глухих согласных
- •1.3.2 Нейтрализация твердых и мягких согласных
- •1.3.3 Нейтрализация удвоенных фонем и одиночных
- •1.3.4 Нейтрализация и ассимиляция согласных фонем по месту и способу образования
- •1.3.5 Непроизносимые согласные
- •1.3.7 Аккомодация
- •1.3.8 Редукция гласных в безударном положении
- •2 Разработка средств обработки естественного языка на морфологическом уровне
- •2.3.1 Классификация исходных форм
- •2.3.2 Склонение имен
- •Чередования в основе.
- •К этой же группе относятся существительные с пометой "мн.", например, санки, ножны, ср. Санок, ножен. Построение сравнительной степени прилагательных.
- •2.3.3 Спряжение
- •Построение глагольных форм.
- •Настоящее время несовершенного вида и будущеевремя совершенного вида.
- •Неличные формы.
- •3 Инструментальные средства морфологического анализа слов русского языка
- •Задания к лабораторным работам Лабораторная работа №1
- •Задание
- •Лабораторная работа №2
- •Содержание отчёта
- •Литература
- •Лабораторная работа №3
- •Содержание отчёта
- •Контрольные вопросы
- •Срок выполнения – 2 недели.
Задания к лабораторным работам Лабораторная работа №1
Тема: построение транскриптора слов русского языка.
Задание
Из связного текста размером не менее 200 слов сформировать словарь.
Упорядочить полученный словарь по алфавиту в порядке возрастания.
В словах, состоящих более, чем из одного слога, обозначить ударение символом ‘/’.
Сформировать базу продукционных правил, используя правила транскрипции русского языка.
Разработать программное обеспечение, которое на базе созданных правил строит транскрипцию слов русского языка и имеет следующие возможности:
формирование транскрипций для всех слов словаря и запись полученного результата в текстовый файл, каждая строка которого представлена в виде
<слово с обозначенным ударением> – <транскрипция>;
вывод полученного результата в окно приложения в виде списка;
построение транскрипции произвольного слова, введенного пользователем.
Сформировать отчет, в котором, отразить:
исходный текст;
список сформированных продукционных правил;
словарь полученных транскрипций;
полный листинг программы.
Литература:
Орфоэпический словарь русского языка: произношение, ударение, грамматические формы. / Под ред. Р.И.Аванесова. – М.,1997.
Буланин Л.Л.. Фонетика современного русского языка. М., «Высшая школа», 1970
Ковалев В.П., Минина Л.И. «Современный русский литературный язык», Часть 1, М., «Просвещение», 1979.
Матусевич М. И. Современный русский язык. Фонетика. М., 1976.
Бондарко Л.Б. Звуковой строй современного русского языка. – М.: Просвещение. – 1977. – 175 с.
Бондарко Л.В. Фонетическое описание языка и фонологическое описание речи. – Л.:ЛГУ. – 1981. – 199 с.
Лабораторная работа №2
Тема: Обработка естественно-языковых текстов на морфологическом уровне.
Цель: получение навыков создания грамматических словарей, разработки средств морфологического синтеза слов русского языка для заданной предметной области.
Задание
Для предметной области, заданной текстом из Л. р. № 1 создать грамматический словарь, на основе которого разработать программу морфологического синтеза слов.
Ход работы
Создание грамматического словаря.
Разработать программу, позволяющую:
получить перечень слов (словоформ) текста;
отсортировать этот перечень в инверсном порядке (см. прил. 1).
Сформировать из полученного перечня словоформ словарь начальных форм.
Сформировать из полученного перечня словоформ словарь начальных форм для изменяемых частей речи (существительное, прилагательное, местоимение, глагол, числительное).
Отобрать из перечня правил словоизменения (см. прил. 2) все правила, необходимые для словоизменения (морфологического синтеза) слов словаря.
Выполнить разметку словаря начальных форм (вручную или автоматизировано). Разметка должна отражать постоянные грамматические характеристики слова и тип его словоизменения.
Разработать программу, позволяющую выполнять словоизменение слов Вашего словаря.
Требования к функциональности программы:
программа должна позволять строить заданную форму введённого слова (если оно принадлежит словарю), если эта форма принадлежит его парадигме;
программа должна позволять строить парадигму введённого слова, если оно принадлежит словарю (вывод в файл или на экран).