Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
документация2.doc
Скачиваний:
5
Добавлен:
04.06.2015
Размер:
1.68 Mб
Скачать

Выбор модели представления проблемных знаний Критерии анализа текстов входных языков/подъязыков

ЕСЛИ

ТО

Признаки деловой прозы

Часть речи=Прилагательное, характеризующее понятие И ставится непосредственно перед определяемым понятием (например, «сложная техническая система»)

Деловая проза

ИНАЧЕ

Не относится (перефразировать)

Часть речи=Существительное в родительном падеже, выступающее в роли характеристик понятия, И ставится в предложении непосредственно после этого понятия (например, «система объектов»)

Деловая проза

ИНАЧЕ

Не относится (перефразировать)

Словосочетание=(Анафорическая ссылка ИЛИ Отрицательная конструкция (например, «последний из указанных …» и «функция не может быть визуализирована»)) И словосочетание не используется

Деловая проза

ИНАЧЕ

Не относится (перефразировать)

Словосочетание=(Причастный оборот ИЛИ Деепричастный оборот ИЛИ Анафорическая ссылка) И словосочетание не используется

Деловая проза

ИНАЧЕ

Не относится (перефразировать)

Свойства подъязыка

Подъязык обладает достаточным набором языковых средств для обозначения любого факта из ПрО

Подъязык относительно полон

При добавлении к обозримой выборке текстов подъязыка других текстов того же подъязыка не происходит пополнения словаря и грамматики

Подъязык обладает свойством замкнутости

Подъязык имеет конечный и ограниченный словарь

Подъязык конечен

В подъязыке ограничен набор грамматических средств и конструкций из общеязыкового арсенала

Подъязык формально ограничен

Для понимания входных текстов подъязыка несущественны поверхностно-синтаксические различия текстов с тождественным смыслом

Подъязык обладает свойством устойчивости

Компонент V

300<Количество словоформ<=400 И количество падежей у слова<=3 И количество суффиксов<=3

декларативный подход (хранятся все словоформы)

ИНАЧЕ

процедурный подход (хранятся основы)

Лексические функции, МУ

Если функция ставит в соответствие данному слову такое слово, лексическое значение которого в семантическом представлении совпадает, целиком или частично, с лексическим значением данного слова

Лексические замены

Средства перефразирования, т.е. средства лексической синонимии в широком смысле слова

Лексические замены

Лексические замены

Синонимы, конверсивы, синтаксические дериваты

Производные другой части речи, полностью сохраняющие лексическое значение исходного слова

Синонимы, конверсивы, синтаксические дериваты

Conv21(боится (1, 2))

Пугать (боится: кто (1), кого (2); пугает: кто (2), кого (1))

Conv321(купить (1, 2. 3))

Продать (купить: кто (1), что (2), у кого (3); продать: кто (3), что (2). кому (1))

S0 (вышивать)

Вышивание

А0 (учиться)

Учебный

А0 (книга)

Книжный

Аdv0 (политика)

Политически

Аdv0 (язык)

Лингвистически

V0 (шум)

Шуметь

V0 (агрессия)

Нападать

Gener (теннис)

Игра

Anti (закрывать)

Открывать

Особая зона словарной статьи, в которую помещена синтаксическая и семантическая информация о данной лексеме

Модель управления

Выбор метода обнаружения и исправления ошибок

Не используются словари

Метод обнаружения и исправление ошибок = частотный ИЛИ полиграммный

Используется сортировка слов по частоте их встречаемости в текстах

Метод обнаружения и исправление ошибок = частотный

Используются списки возможных сочетаний букв в словах

Метод обнаружения и исправление ошибок = полиграммный

Используются словари

Метод обнаружения и исправление ошибок = абсолютный ИЛИ относительный

Используется словарь встречаемых ранее ошибок

Метод обнаружения и исправление ошибок = абсолютный

Используется словарь возможных словоформ И для искаженного слова осуществляется поиск наиболее похожей на него словоформы

Метод обнаружения и исправление ошибок = относительный