Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕХНОЛОГІЇ МЕНЕДЖМЕНТУ ЗНАНЬ

.pdf
Скачиваний:
152
Добавлен:
07.02.2016
Размер:
3.02 Mб
Скачать

Розділ 4

ПРИКЛАДНІ АСПЕКТИ МЕНЕДЖМЕНТУ ТА ІНЖЕНЕРІЇ ЗНАНЬ

Латентні структури знань і психосемантика

Метод репертуарних решіток

Керування знаннями

Візуальне проектування баз знань як інструмент пізнання

Проектування адаптивних навчальних систем

У розділі розглянуто прикладні аспекти інженерії знань, використання латентних структур знань та психосемантики для видобування глибинних знань. Досліджено метод репертуарних решіток, керування знаннями та проектування бази знань. В кінці розділу описано використання адаптивних навчальних систем та їх проектування.

4.1. Латентні структури знань і психосемантика

Більшість систем, що видобувають знання, полегшують складний і трудомісткий процес формування баз знань і реалізують прямий діалог з експертом. Однак виявлені в такий спосіб структури знань часто характеризують лише поверхневу складову знань експерта, не торкаючись їхньої глибинної структури. Такий самий недолік має більшість методів безпосереднього видобування знань.

Щоб видобути глибинні шари експертного знання, можна скористатися методами психосемантики – науки, що виникла на стику когнітивної психології, психолінгвістики, психології сприйняття і досліджень індивідуальної свідомості. Психосемантика досліджує структури свідомості через моделювання індивідуальної системи знань і виявлення тих категоріальних структур свідомості, які можуть не усвідомлюватися (латентні, імпліцитні або приховані).

121

4.1.1.Семантичні простори

іпсихологічне градуювання

Основним методом експериментальної психосемантики є метод реконструкції суб’єктивних семантичних просторів. Тут психосемантика тісно пов’язана із психолінгвістикою й лінгвістичною семантикою – з методологією виявлення значень слів, лексикографією, “відмінковою граматикою” і структурними дослідженнями. Однак лінгвістичні методи, в основному, спрямовані на аналіз текстів, відчужених від суб’єкта, від його мотивів і задумів.

Психолінгвістичні методи спрямовані безпосередньо на випробуване. Більшість із них пов’язані з різними формами суб’єктивного градуювання. Перед випробуваним ставиться завдання оцінити “подібність знань” за допомогою деякої градуйованої шкали, наприклад, від 0 до 5 або від 0 до 9. У цьому разі дослідник отримує чисельно подані стандартизовані дані, що легко піддаються статистичному опрацюванню.

Психосемантика – як один з нових напрямів сучасної психології – відразу була оцінена фахівцями в галузі штучного інтелекту як перспективний інструмент, що дає змогу реконструювати семантичний простір пам’яті як психологічну модель глибинної структури знань експерта. Уже перші досягнення психосемантики в середині 80-х рр. XX ст. дали можливість одержати доволі наочні результати. У психології семантичні простори виступають як модель категоріальної структури індивідуальної свідомості. В концептуальному аналізі знань структуру семантичного простору експерта можна вважати основою для формування поля знань. Окремі параметри семантичного простору відповідають різним компонентам поля (розмірність простору співвідноситься зі складністю поля, виділені понятійні структури – з метапоняттями, змістовні зв’язки між поняттями-стимулами – це суть відношення тощо).

Найлегше ознайомитися з експериментальною психосемантикою на прикладі, пов’язаному з виявленням структури і розмірності семантичного простору знань із деякої предметної області. В основі побудови семантичних просторів, як правило, лежить статистична процедура (наприклад, факторний аналіз, багатомірне градуювання або кластерний аналіз), що дає змогу групувати низку окремих ознак

122

опису в місткіші категорії-фактори. Мовою поля знань, це – побудова концептів вищого рівня абстракції. У геометричній інтерпретації семантичного простору значення окремої ознаки відображається як точка або вектор із заданими координатами усередині n-мірного простору, координатами якого виступають виділені фактори. Побудова семантичного простору, у такий спосіб передбачає перехід до опису предметної області на вищому рівні абстракції, тобто перехід від мови, що містить великий алфавіт ознак описування, до місткішої мови концептуалізації, що містить менше число концептів і виступає своєрідною метамовою стосовно першої. Залежно від досвіду та професійної компетентності тих, кого випробовують, розмірність простору і розташування в ній первинних понять може істотно коливатися. Ця особливість семантичних просторів може бути використана на стадії контролю в процесі навчання, під час тестування експериментів і користувачів.

Так, для перевірки знань і розуміння англійської мови в роботі [118] було взято десять найпоширеніших прийменників, які доволі важко перекладати. На екрані дисплея випробовуваному пропонували кілька прийменників і запитували, чи часто в нього викликає труднощі вибір одного із цих прийменників. Ступінь затруднення оцінювали в балах від 1 до 9. На основі цих даних методами багатомірного градуювання побудовано структуру складності вживання англійських прийменників з погляду носія російської мови. Ця модель істотно залежить від рівня знань. Так, модель новачка не є організованою структурою. У людей, що мають певні навички, виявилася деяка структурованість семантичного простору, у ньому чітко позначилися пари й трійки подібних прийменників.

Найчіткіша й найзв’язніша структура наведена на рис. 4.1. За її допомогою можна пояснити особливості диференціації прийменників в англійській мові. Основу структури подано у вигляді кола, близькі крапки на якому відповідають прийменникам, що важко диференціювати. Структура спирається на дві ортогональні осі. Вісь абсцис відповідає прийменникам напрямку руху, а вісь ординат – прийменникам мети, або засобу.

На підставі одержаних методами психосемантики моделей можна здійснювати контроль знань. Аналізуючи індивідуальні семантичні простори виявляються питання, які не засвоєні й не уклалися в

123

систему. Контроль структури знань здійснюється на основі зіставлення семантичних просторів хороших фахівців і новачків (студентів, слухачів, молодих фахівців). Ступінь погодженості семантичних просторів (їхньої розмірності, ознаки й конфігурації понять) визначатиме рівень знань новачка.

with,by

with

by

 

 

 

on

 

 

 

about

 

in

 

 

at

 

 

 

of

 

to

for

for

 

 

 

to

from

Рис. 4.1. Семантичний простір близькості англійських прийменників

Однак, тут необхідно врахувати, що семантичні простори двох кваліфікованих фахівців можуть бути різними, тому що містять індивідуальні розходження сприйняття, що віддзеркалюють досвід і характер діяльності людини. Тому не завжди можна формально порівняти семантичні простори експерта й новачка, варто попередньо вивчити семантичні простори декількох фахівців, а потім уже робити порівняння.

У роботі [56] описано подібний експеримент. Отримані когнітивні структури знань досвідченого льотчика-винищувача й пілотановачка з використанням двох методів: багатовимірного градуювання (алгоритм MDS – Alscal) і мережного градуювання із урахованими зв’язками (алгоритм Pathfinder). Обидва алгоритми засновані на використанні оцінок психологічної близькості. Досвідчений пілот і новачок оцінювали всі можливі парні сполучення 30-ти пов’язаних з польотом понять, приписуючи числа від 0 до 9 кожній парі, де 0 позначав найслабший ступінь зв’язку між поняттями, а 9 – най-

124

сильніший. Ці оцінки потім опрацьовували із застосуванням обох алгоритмів градуювання.

Відповідно до алгоритмів MDS кожний концепт, що виражає деяке поняття, вміщують в k-вимірний простір так, що відстань між точками характеризує психологічну близькість відповідних концептів. Алгоритм Pathfinder будує семантичну мережу. Дуги можуть бути або орієнтованими (несиметричне відношення), або неорієнтованими (симетричне відношення). Обидва методи забезпечують стискання великих обсягів даних (у формі попарних оцінок) до меншого набору параметрів; але націлені вони на виявлення різних властивостей досліджуваних структур. Якщо в алгоритмі Pathfinder центром уваги є локальні відношення між концептами, то алгоритм MDS забезпечує ширше розуміння властивостей простору концептів, що підлягає метризації.

Результівні когнітивні структури виявилися близькими для пілотів-винищувачів з однаковим рівнем досвіду, але були різними для різних груп випробуваних. Автори експериментів виявили, що за когнітивною структурою, характерною для пілота-винищувача, можна встановити, новачок він чи досвідчений пілот. Нарешті, здійснений ними ж аналіз когнітивних структур виявив наявність концептів і відношень, спільних для подань досвідченого фахівця й новачка, і, крім того, низку концептів і відносин, які з’явилися тільки в одному з подань. Прямим розвитком розглянутої роботи стала експертна система керування повітряним боєм ACES.

Аналогічне дослідження механізмів нагромадження досвіду здійснене в галузі програмування на ЕОМ. За допомогою методів градуювання було показано, що один з аспектів досвіду програміста – організація знань відповідно до задуму програми, або семантики, а не відповідно до синтаксису.

Мережне подання абстрактних понять програмування на основі оцінок зв’язності концептів у програмістів показано на рис. 4.2. Експеримент засвідчив, що всіх програмістів на основі аналізу структури семантичного простору можна поділити на три групи: новачки, недосвідчені фахівці середнього рівня, досвідчені фахівці. Цей висновок збігається з результатами, отриманими в роботі [29]. Крім того, досліджували еволюцію когнітивної структури програміста в міру його розвитку від новачка до досвідченого фахівця.

125

 

Підпрограма

 

 

 

 

 

 

 

 

 

 

 

 

Параметр

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оператор

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Функція

 

 

 

 

 

 

Присвоєння

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Відлагод-

 

Програма

 

 

 

Вихід

 

Числові

 

 

Глобальні

ження

 

 

 

 

 

 

дані

 

 

 

змінні

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Алгоритм

 

 

Символьні

 

 

 

 

 

 

 

 

Масив

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дані

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сортування

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пошук

 

 

 

 

 

 

 

 

 

Повторення

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 4.2. Асоціативна мережа структури знань експерта-програміста

Інтерпретація виявлених відношень (зв’язків) між поняттями вимагає додаткових зусиль від колективу розроблювачів інтелектуальних систем. Так, наприклад, для означення дуг на рис. 4.2 необхідним став додатковий експеримент, учасникам якого запропоновано пару понять і поставлено завдання дати словесний опис зв’язку між поняттями пари. Результати наведено в табл. 4.1. Отже, асоціативна мережа на рис. 4.2 може бути перетворена на семантичну.

Всі вищезгадані методи (зокрема кластерний аналіз) можна зарахувати до методів психологічного градуювання. Їхню основу становлять алгоритми перетворення складних структур даних у зрозумілішу форму, що передбачається психологічно змістовною. Результівне подання залежить від методу:

кластерний аналіз породжує деревоподібну структуру; багатомірне градуювання й факторний аналіз – просторову; алгоритм МDS – мережну;

репертуарні решітки – конструкти або мета-виміри.

Таблиця 4.1

126

Опис зв’язку між поняттями

Пов’язані пари понять

Відношення між пов’язаною парою

понять

 

 

 

Підпрограма – програма

Є частина

 

 

Символьні дані – вихід

Є тип

 

 

Параметр – програма

Використовується

 

 

Програма – вихід

Робить

 

 

Сортування – пошук

Містить у собі

 

 

Чисельні дані – параметр

Може бути

 

 

Функція – оператор

Є

 

 

Функція – програма

Є частина

 

 

Налагодження – програма

Піддається

 

 

Вихід – чисельні дані

Складається з...

 

 

Масив – символьні дані

Може складатися з...

 

 

Функція – підпрограма

Є

 

 

Присвоєння значень – параметр

Використовується для

Масив – глобальна зміна

Може бути

 

 

Масив – чисельні дані

Може складатися з...

 

 

Повторення – сортування

Є частина

 

 

Програма – алгоритм

Є виконання

 

 

Сортування – алгоритм

Є

 

 

Сортування – чисельні дані

Робиться на

 

 

Присвоєння – оператор

Є

 

 

Формальна методологія психосемантичного градуювання дає змогу частково автоматизувати процес структурування знань і одержувати “когнітивний розріз” його подань про предметну область. Методологія градуювання дає змогу виявляти структури знання непрямим шляхом, одержуючи відповіді від експертів на доволі прості запитання (наприклад, “наскільки близькі поняття Х1 і Х2” замість “скажіть, який зв’язок між Х1 і Х2, як вони впливають один на одного”).

Майже всі експерименти дали змогу виявити одну закономірність. Розмірність семантичного простору з підвищенням рівня професіоналізму зменшується. Цей висновок збігається з відомими твердженнями когнітивної психології про те, що процес пізнання супроводжується узагальненням.

127

Побудова семантичного простору зазвичай передбачає три послідовні кроки.

1.Вибір і застосування відповідного методу оцінки семантичної подібності. Цей крок містить у собі експеримент із випробовуваними особами, яким пропонується оцінити спільність поданих стимульних ознак на деякій шкалі.

2.Побудова структури семантичного простору на основі математичного аналізу отриманої матриці подібності. Відбувається зменшення кількості досліджуваних понять внаслідок узагальнення й одержання генералізованих осей.

3.Ідентифікація, інтерпретація виділених факторних структур, кластерів або груп об’єктів, осей тощо. На цьому етапі необхідно знайти значеннєві еквіваленти, мовні “ярлики” для виділених структур. Тут великого значення набуває лінгвістичне чуття й професіоналізм фахівця, що здійснює дослідження, і випробуваних експертів. Часто до інтерпретації залучають групу експертів.

4.1.2.Методи багатовимірного градуювання

Надалі розвиток методів психосемантики відбувався в напрямі розроблення зручних пакетів прикладних програм, заснованих на методах багатовимірного градуювання (БГ), факторного аналізу, а також спеціалізованих методів (статистичного) опрацювання репертуарних решіток. З іншого боку, специфіка низки конкретних додатків, насамперед – в інженерії знань, вимагала також розвитку інших (не чисельних) методів опрацювання психосемантичних даних, що використовують – у тій або іншій формі – парадигму логічного виведення на знаннях. Однак аналіз практичного застосування систем обох типів до завдань інженерії знань призводить до висновку про недосконалість наявних методик і необхідності їхнього розвитку відповідно до сучасних вимог інженерії знань. Найбільші перспективи в цій галузі, очевидно, мають методи багатовимірного градуювання.

Багатовимірне градуювання (БГ) сьогодні – це математичний інструментарій, призначений для опрацювання оброблення даних про попарні подібності, зв’язки або відношення між аналізованими об’єктами з метою подання цих об’єктів у вигляді точок деякого координатного простору. БГ є одним із розділів прикладної статистики,

128

наукової дисципліни, що розробляє й систематизує поняття, прийоми, математичні методи й моделі, призначені для збирання, стандартного запису, систематизації й опрацювання статистичних даних з метою їхнього лаконічного подання, інтерпретації й одержання наукових і практичних висновків. Традиційно БГ використовується для рішення трьох типів завдань:

пошук та інтерпретація латентних (тобто схованих, безпосередньо неспостережуваних) змінних, що пояснюють задану структуру попарних відстаней (зв’язків, наближеностей);

верифікація геометричної конфігурації системи аналізованих об’єктів у координатному просторі латентних змінних;

стиснення вихідного масиву даних з мінімальними втратами в їхній інформативності.

Незалежно від завдання БГ завжди використовується як інструмент наочного подання (візуалізації) вихідних даних. БГ широко застосовується в дослідженнях з антропології, педагогіці, психології, економіці, соціології.

В основі такого підходу лежить інтерактивна процедура суб’єктивного градуювання, коли випробовуваній особі (тобто експертові) пропонується оцінити подібність між різними елементами за допомогою деякої градуйованої шкали (наприклад, від 0 до 9, або від –2 до +2). Після такої процедури аналітик має у розпорядженні чисельно подані стандартизовані дані, які піддаються опрацюванню наявними пакетами прикладних програм, що реалізують різні алгоритми формування концептів вищого рівня абстракції та будують геометричну інтерпретацію семантичного простору в евклідовій системі координат.

Основний тип даних у БГ – міри близькості між двома об’єктами (i, j) – dij. Якщо міра близькості така, що найбільші значення dij відповідають парам найбільш схожих об’єктів, то dij – міра подібності, якщо, навпаки, найменш схожим, то dij – міра розходження.

БГ використовує дистанційну модель розходження, посглуговуючись поняттями відстані в геометрії як аналогією подібності й розходження понять. Щоб функція d, визначена на парах об’єктів (a, b), була евклідовою відстанню, вона повинна задовольняти такі чотири аксіоми:

129

d(a, b)≥0, d(a, a)=0, d(a, b)=d(b, a),

d(a, b)+d(b, c)≥d(a, c).

Тоді, відповідно до звичайної формули евклідової відстані, міра розходження двох об’єктів i та j зі значеннями ознаки k в об’єктів i та j відповідно xik і xjk

K

ij dij (xik

k 1

1

x jk )2 2 .

Дистанційна модель була багаторазово перевірена в соціології та психології, що дає можливість оцінити її придатність для використання.

У більшості робіт з БГ використовується матрична алгебра. Геометрична інтерпретація дає змогу зобразити абстрактні поняття матричної алгебри в конкретній графічній формі. Серед множини алгоритмів БГ широко використовуються різні модифікації метричних методів Торгерсона, а також неметричні моделі, наприклад, Крускала.

Порівнюючи методи БГ з іншими методами аналізу, теоретично застосовними в інженерії знань (ієрархічний кластерний аналіз або факторний аналіз), БГ переважає завдяки можливості дати наочне кількісне координатне зображення, найчастіше найпростішої й тому легше інтерпретованої експертами.

4.1.3. Використання метафор для виявлення “прихованих” структур знань

Незважаючи на згадану близькість завдань, інженерія знань і психосемантика істотно відрізняються як у теоретичних підвалинах, на яких вони ґрунтуються, так і в практичних методиках. Але головна відмінність полягає в тому, що інженерія знань спрямована на виявлення – як остаточного результату – моделі міркувань, динамічної або операційної складової ментального простору (або функціональної структури поля знань Sf), тоді як психосемантика, намагаючись подати ментальний простір у вигляді евклідового простору, дає змогу робити видимою статичну структуру взаємного “розташування” об’єктів у пам’яті у вигляді проекцій скупчень об’єктів (концептуальна структура Sk).

130