Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СЕЧЕНОВ 3_4 конечн.doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
6.01 Mб
Скачать

2.2 Формализация русского языка

Естественный язык (ЕЯ) выполняет две основные функции: коммуникационную и выразительную. В первом случае язык рассматривается как средство общения, во втором - с точки зрения его внутренней организации.

В широком смысле язык можно определить как систему единиц разного уровня и соответствующую систему правил композиции-декомпозиции и интерпретации. Указанные правила композиции-декомпозиции представляют собой грамматику языка.

В лингвистике письменного русского естественного языка выделяются следующие уровни рассмотрения текста: дискурс, предложение (сложное или простое), словосочетание, слово, морфема, слог.

В русском языке можно выделить морфологию, синтаксис (в узком смысле слова), семантику и прагматику. Под морфологией понимается система правил порождения слов (словоформ) из языковых единиц более низкого уровня. Синтаксис - множество правил, согласно которым слова объединяются в словосочетания, предложения и дискурс. Семантика задает множество правил интерпретации значений лексических единиц различных уровней. Прагматика языка определяет систему отношений интерпретатора языка к самой знаковой системе.

В качестве минимальной лексической единицы дискурса, т. е. связного текста, обычно выступает слово, однако оно в общем случае не является элементом смысла. Слово может содержать следующие типы морфем: префиксы (приставки), корни и аффиксы (суффикс + окончание). К морфемам также можно отнести и возвратные частицы СЬ и СЯ. Корень несет основную смысловую нагрузку. Префикс вместе с корнем образуют основу слова.

Введение ограничений на грамматику языка общения обусловлено:

- отсутствием достаточно полных формальных моделей русского языка;

- ограничением на быстродействие ЭВМ и объем доступной оперативной памяти;

- большой трудоемкостью разработки информационного и программного обеспечения лингвистического процессора (десятки человеко-лет).

2.3. Грамматические и семантические категории, используемые в лингвистическом процессоре.

Часть речи: существительное, прилагательное, краткое прилагательное, глагол, инфинитив, деепричастие, наречие, количественное числительное, местоимение, союз, предлог, частицы, знак препинания;

Род: мужской, средний, женский;

Число: единственное, множественное;

Время: прошедшее, настоящее, будущее;

Падеж: именительный, родительный, дательный, винительный, творительный, предложный;

Одушевленность: неодушевленное, одушевленное;

Лицо: первое, второе, третье;

Пассивность: (залог): пассивный, активный;

Вид: совершенный, несовершенный;

Наклонение: изъявительное, повелительное;

Тип наречия: обстоятельственное, определительное;

Тип числительного: «1», «2», «3», другие числовые значения, неопределенное, именованное;

Тип союза: сочинительный, подчинительный;

Тип частицы: вопросительная, отрицательная, утвердительная;

Синтаксические отношения: предикативное (ПРЕД), комплетивные (1K - 5K), определительное (ОПР), обстоятельственное (ОБСТ), количественное (КОЛ), однородное (ОДН), отрицательное (ОТР), вспомогательное (ВСП), аппозитивное (АППОЗ);

Семантические отношения (элементарные): подмножество, подмножество различное, элемент, элемент различный, связь, агент, тема, источники, цель, инструмент, способ, характеристика, значение характеристики, место, предпосылка, следствие, операция, количество, принадлежность, назначение и, или, не;

Семантические типы: предикат действий, функциональный предикат, глагол-связка (БЫТЬ), пустой глагол (ОСУЩЕСТВЛЯТЬ), фазовые глаголы (НАЧИНАТЬ, ОКАНЧИВАТЬ), модальные глаголы (МОЧЬ, ДОЛЖЕН), понятие, характеристика, значение характеристики, числительное, предлог.