
- •Лекція 1
- •2.1. Комбінаторний вибух
- •2.1.2. Евристичний пошук
- •Лекція 2
- •1.1 Значення експертного аналізу
- •1.2. Характеристики експертних систем
- •1.3. Базові функції експертних систем
- •1.3.1. Накопичення знань
- •1.3.2. Представлення знань
- •1.3.3. Управління процесом пошуку рішення
- •1.3.4. Роз'яснення прийнятого рішення
- •Лекція-3.
- •4.2. Методи отримання кількісних і якісних експертних оцінок.
- •Лекція-5.
- •5.2.1. Класифікація по розв'язуваній задачі
- •Лекція-6.
- •2.4.5. Оцінка системи
- •Лекція-7.
- •1.4.1. Дані і знання
- •3.1. Знання і їхнє представлення в сші
- •Лекція-8.
- •8.1. Поле знань
- •8.1.1. Про мову опису поля знань
- •8.1.2. Семіотична модель поля знань
- •8.1.3. “Піраміда” знань
- •8.2. Стратегії одержання знань
- •Лекція 9.
- •9.3.1. Психологічний аспект
- •3.3.2. Лінгвістичний аспект
- •3.3.3. Гносеологічний аспект витягу знань
- •Лекція 10.
- •4.1. Класифікація методів практичного видобування знань
- •4.2. Комунікативні методи
- •4.2.1. Пасивні методи
- •Лекція 11.
- •4.2.2. Активні індивідуальні методи
- •4.2.3. Активні групові методи
- •Лекція 12.
- •4.3. Текстологічні методи
- •4.4. Найпростіші методи структурування
- •4.4.1. Алгоритм для «чайників»
- •4.4.2. Спеціальні методи структурування
3.3.2. Лінгвістичний аспект
Лінгвістичний (А2) аспект стосується досліджень мовних проблем, тому що мова – це основний засіб спілкування в процесі витягу знань.
В інженерії знань можна виділити три шари лінгвістичних проблем (Рис.3.11 ):
А2 = {S21, S22, S23) = (“загальний код, понятійна структура, словник користувача).
Р
ис.3.11.
Лінгвістичний аспект витягу знань
“Загальний код” (S21)
“Загальний код” вирішує проблему мовних ножиців між професійною термінологією експерта і повсякденною літературною мовою інженера по знаннях і включає наступні компоненти:
S21 = {s21_i} = {загальнонаукова термінологія; спеціальні поняття з професійної літератури; елементи побутового мови; неологізми, сформовані за час спільної роботи; професійний жаргон і ін.).
Нас цікавлять компоненти V1 і V2 – мови, на яких говорять аналітик і експерт (V1', V2' – невербальні компоненти). Розходження мов V1 і V2 і обумовлює “мовний бар'єр” чи “мовні ножиці” у спілкуванні інженера по знаннях і експерта.
Ці дві мови є відображенням “внутрішньої мови” експерта й аналітика.
Мова аналітика V1 складається з трьох компонентів:
s21_1 – загальнонаукової термінології з його “теоретичного багажу”;
s21_2 – термінів предметної області, що він почерпнув зі спеціальної літератури в період підготовки;
s21_3 – побутові розмовні мови, яким користається аналітик.
Мова експерта V2 включає:
s21_1 – загальнонаукову термінологію;
s21_2 – спеціальну термінологію, прийняту в предметній області;
s21_3 – побутова мова;
s21_4 – неологізми, створені експертом за час роботи, тобто його професійний жаргон.
Надалі цей загальний код перетвориться в деяку понятійну (семантичну) мережу, що є прообразом поля знань предметної області. Вироблення загального коду починається з виписуванням аналітиком усіх термінів, уживаних експертом, і уточнення їхнього змісту: Фактично це складання словника предметної області. Потім випливає групування термінів і вибір синонімів (слів, що означають те саме). Розробка загального коду закінчується складанням словника термінів предметної області з попереднім угрупованням їх за змістом, тобто по понятійній близькості (це вже перший крок структурування знань).
На цьому етапі аналітик повинний з великою увагою віднестися до всіх спеціальних термінів, намагаючись максимально вникнути в суть розв'язуваних проблем і термінологію. Освоєння аналітиком мови предметної області – перша сходинка на підступах до створення адекватної бази знань.
Рис.3.12. Структура загального коду
Понятійна структура (S22)
Проблеми формування понятійної структури представляють наступний шар S22 лінгвістичного аспекту проблеми витягу знань.
Більшість фахівців зі штучного інтелекту і когнітивної психології вважають, що основна особливість природного інтелекту і пам'яті зокрема – це зв'язаність усіх понять у деяку мережу. Тому для розробки бази знань потрібний не словник, а “енциклопедія”, у якій усі терміни пояснені в словникових статтях з посиланнями на інші терміни.
Таким чином, лінгвістична робота інженера по знаннях на даному шарі проблем полягає в побудові таких зв'язаних фрагментів за допомогою “ зшивання ” термінів. Фактично ця робота є підготовкою до етапу концептуалізації, де це “шиття ” здобуває деякий закінчений вид.
При ретельний роботі аналітика й експерта в понятійних структурах починає проглядатися ієрархія понять.
Варто підкреслити, що робота зі складання словника і понятійної структури вимагає лінгвістичного “чуття”, легкості маніпулювання термінами і багатого словникового запасу інженера по знаннях, тому що найчастіше аналітик змушений самостійно розробляти словник ознак. Чим багатше і виразніше виходить загальний код, тим більше повніше база знань.
Словник користувача (S23)
Лінгвістичні результати, співвіднесені до шарів загального коду і понятійної структури, спрямовані на створення адекватної бази знань. Однак часто професійний рівень кінцевого користувача не дозволяє йому застосувати спеціальну мову предметної області в повному обсязі.
Несподіваними для починаючих розроблювачів є проблеми формування окремого словника для створення дружнього інтерфейсу з користувачем ЕС, досліджувані в шарі S23. Необхідні спеціальні прийоми, що збільшують “прозорість” і приступність системи. Для розробки користувальницького інтерфейсу потрібна додаткова доробка словника загального коду з виправленням на доступність і “прозорість” системи.