Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
InfIntSys-09Conspect_add.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
3.64 Mб
Скачать

3.2. Ограниченный естественный язык. Синтаксис, семантика, словари

Человеческий язык как средство передачи и восприятия информации, существенно отличается от машинных языков своей нестрогостью, неоднозначностью интерпретации, огромным словарным размером и пр. При использовании естественного языка в технических системах имеет смысл говорить лишь о некоторых ограниченных подмножествах языка, ориентированных на узкие проблемные области и имеющие жестко фиксированные наборы форм построения предложений (естественно-языковых форм).

Полезное использование естественного языка в технических системах возможно, если отображения f и f -1 эффективно вычислимы. Полные естественные языки, используемые человеком, имеют функции отображения , которые пока на компьютере эффективно вычислены быть не могут. Отсюда стремление работать с упрощенными, т.е. ограниченными естественно-языковыми формами. Такие ограничения связаны с введением упрощенного синтаксиса, семантики языка.

Синтаксис определяет правила, описывающие входящие в язык тексты как цепочки символов, составляющие морфемы, словоформы, словосочетания и предложения. Морфема - значимая мельчайшая часть слова (корень, суффикс, окончания). Словоформа или просто слово-цепочка морфем. Словосочетание и предложения представляют собой цепочки слов незаконченных и законченных по содержанию. Синтаксис связан с алфавитом А={a1,…,аN} - определенный набор используемых символов.

Семантика определяет правила, смысловые значения входящих в язык цепочек.

Словари определяют другое упрощение естественного языка. Различают терминальные и нетерминальные словари. Терминальный словарь VT - это набор исходных элементов, из которых строятся синтаксически правильные цепочки символов, т.е. словарь основных слов языка, из которых строятся предложения. Нетерминальный словарь VH -это набор символов, которыми обозначаются исходных элементов или словарь синтаксических типов. Элементы этих словарей называются соответственно терминальными и нетерминальными символами. Число элементов VT и VH в ограниченных естественно-языковых формах существенно сужено, поскольку определяется узкой предметной областью и возможностями программного интерпретатора языка.

5________________________

3.3. Ограниченный естественный язык. Грамматики

Синтаксис, семантика и словари определяют грамматику языку, отображающую его структуру. Строгость языка зависит от степени формализации его грамматики.

В общем виде, грамматику можно представить упорядоченной системой вида

G = (VT, VH, H0 . Р),

где VT и VH - терминальный и нетерминальный словари; H0 - начальный нетерминальный символ, обозначающий класс всех тех языковых объектов, для описания которых предназначена грамматика; Р - правила грамматики, которые могут быть порождающими, распознающими, преобразующими.

Порождающие правила - позволяют строить любую правильную цепочку, давая указания об ее строении. Основная форма правил: «Если имеется набор символов φ, то может быть построена правильная цепочка ψ с определенным строением».

Распознающие правила - позволяют решить, является ли цепочка правильной , и дает указания о ее строении. Основная форма правил такая:

«Если цепочка φ удовлетворяет синтаксическим правилам, то φ – правильная цепочка и ее строение такое-то».

Преобразующие правила - правила позволяют для любой правильно построенной цепочки строить ее отображение в виде правильной цепочки, задавая при этом указания о порядке проведения отображения. Основная форма правил: «Если φ то ψ» (заменить цепочку φ на ψ). Такие правила позволяют делать выводы. Ограниченный естественный язык должен иметь формализованную грамматику с небольшим количеством правил порождения и преобразования предложений, причем эти правила не должны допускать неоднозначностей. В машинном варианте грамматика отображена в базе знаний грамматик, обычно имеющей продукционную форму.

Заметим, что грамматики могут быть контекстно-свободными (КС- грамматики) и контекстно-зависимыми (КЗ- грамматики). В первом случае предложения естественного языка не связываются с содержанием (контекстом) и интерпретируются относительно простыми КС -грамматиками. Во втором случае интерпретация усложняется неоднозначностью распознавания предложений естественного языка, которая может быть снята только дополнительным анализом контекста с помощью КЗ- грамматик.

6________________________

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]