Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ES_Lek_ALL.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.35 Mб
Скачать

3.3.2. Лінгвістичний аспект

Лінгвістичний (А2) аспект стосується досліджень мовних проблем, тому що мова – це основний засіб спілкування в процесі витягу знань.

В інженерії знань можна виділити три шари лінгвістичних проблем (Рис.3.11 ):

А2 = {S21, S22, S23) = (“загальний код, понятійна структура, словник користувача).

Р ис.3.11. Лінгвістичний аспект витягу знань

Загальний код” (S21)

“Загальний код” вирішує проблему мовних ножиців між професійною термінологією експерта і повсякденною літературною мовою інженера по знаннях і включає наступні компоненти:

S21 = {s21_i} = {загальнонаукова термінологія; спеціальні поняття з професійної літератури; елементи побутового мови; неологізми, сформовані за час спільної роботи; професійний жаргон і ін.).

Нас цікавлять компоненти V1 і V2 – мови, на яких говорять аналітик і експерт (V1', V2' – невербальні компоненти). Розходження мов V1 і V2 і обумовлює “мовний бар'єр” чи “мовні ножиці” у спілкуванні інженера по знаннях і експерта.

Ці дві мови є відображенням “внутрішньої мови” експерта й аналітика.

Мова аналітика V1 складається з трьох компонентів:

  • s21_1 – загальнонаукової термінології з його “теоретичного багажу”;

  • s21_2 – термінів предметної області, що він почерпнув зі спеціальної літератури в період підготовки;

  • s21_3 – побутові розмовні мови, яким користається аналітик.

Мова експерта V2 включає:

  • s21_1 – загальнонаукову термінологію;

  • s21_2 – спеціальну термінологію, прийняту в предметній області;

  • s21_3 – побутова мова;

  • s21_4 – неологізми, створені експертом за час роботи, тобто його професійний жаргон.

Надалі цей загальний код перетвориться в деяку понятійну (семантичну) мережу, що є прообразом поля знань предметної області. Вироблення загального коду починається з виписуванням аналітиком усіх термінів, уживаних експертом, і уточнення їхнього змісту: Фактично це складання словника предметної області. Потім випливає групування термінів і вибір синонімів (слів, що означають те саме). Розробка загального коду закінчується складанням словника термінів предметної області з попереднім угрупованням їх за змістом, тобто по понятійній близькості (це вже перший крок структурування знань).

На цьому етапі аналітик повинний з великою увагою віднестися до всіх спеціальних термінів, намагаючись максимально вникнути в суть розв'язуваних проблем і термінологію. Освоєння аналітиком мови предметної області – перша сходинка на підступах до створення адекватної бази знань.

Рис.3.12. Структура загального коду

Понятійна структура (S22)

Проблеми формування понятійної структури представляють наступний шар S22 лінгвістичного аспекту проблеми витягу знань.

Більшість фахівців зі штучного інтелекту і когнітивної психології вважають, що основна особливість природного інтелекту і пам'яті зокрема – це зв'язаність усіх понять у деяку мережу. Тому для розробки бази знань потрібний не словник, а “енциклопедія”, у якій усі терміни пояснені в словникових статтях з посиланнями на інші терміни.

Таким чином, лінгвістична робота інженера по знаннях на даному шарі проблем полягає в побудові таких зв'язаних фрагментів за допомогою “ зшивання ” термінів. Фактично ця робота є підготовкою до етапу концептуалізації, де це “шиття ” здобуває деякий закінчений вид.

При ретельний роботі аналітика й експерта в понятійних структурах починає проглядатися ієрархія понять.

Варто підкреслити, що робота зі складання словника і понятійної структури вимагає лінгвістичного “чуття”, легкості маніпулювання термінами і багатого словникового запасу інженера по знаннях, тому що найчастіше аналітик змушений самостійно розробляти словник ознак. Чим багатше і виразніше виходить загальний код, тим більше повніше база знань.

Словник користувача (S23)

Лінгвістичні результати, співвіднесені до шарів загального коду і понятійної структури, спрямовані на створення адекватної бази знань. Однак часто професійний рівень кінцевого користувача не дозволяє йому застосувати спеціальну мову предметної області в повному обсязі.

Несподіваними для починаючих розроблювачів є проблеми формування окремого словника для створення дружнього інтерфейсу з користувачем ЕС, досліджувані в шарі S23. Необхідні спеціальні прийоми, що збільшують “прозорість” і приступність системи. Для розробки користувальницького інтерфейсу потрібна додаткова доробка словника загального коду з виправленням на доступність і “прозорість” системи.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]