Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕХНОЛОГІЇ МЕНЕДЖМЕНТУ ЗНАНЬ

.pdf
Скачиваний:
152
Добавлен:
07.02.2016
Размер:
3.02 Mб
Скачать

Гомоморфізмом системи Е в однотипну їй систему Е’ буде: E' (E' ,(o'i : i I ),(r' j : j J )) , називається відображення

Ф : E E ',

яке задовольняє такі дві умови:

Ф(oi (e1 ,..., enj )) o 'i (Ф(e1 ),...,Ф(enj )); (e1 ,..., em ) rj (Ф(e1 ),...,Ф(em )) r ' j .

Для всіх елементів e1 ,..., em з Е та всіх i I, j J .

Відповідно до введених позначень рівнів піраміди суть гомоморфізму моделей (тобто понять і відношень) предметної області

Ф : М M ',

де M A, R, S ;

M

 

 

 

 

 

,

A – мета-поняття, або поняття

 

A , R , S

вищого рівня абстракції;

R

– мета-відношення; S – мета-стратегії.

Сходячи по ступенях піраміди, ми отримуємо систему гомоморфізмів, що відповідає результатам, отриманим в когнітивній психології про зменшення розмірності семантичного простору пам’яті зі збільшенням досвіду експертів.

2.2. Стратегії одержання знань

Під час формування поля знань ключовим питанням є сам процес отримання знань, коли відбувається перенесення компетентності експертів на інженерів зі знань. Для назви цього процесу в літературі з експертних систем (ЕС) набуло поширення кілька термінів: придбання, здобування, витягання, одержання, виявлення, формування знань. У англійській спеціальній літературі переважно використовуються два: acquisition (придбання) і elicitation (виявлення, витягання, встановлення).

Термін “придбання” трактують або дуже широко – тоді він об’єднує весь процес передавання знань від експерта до бази знань ЕС, або вже як спосіб автоматизованої побудови бази знань за допомогою діалогу експерта і спеціальної програми (структура поля знань заздалегідь закладають у програму). В обох випадках термін “придбання” не стосується самого таїнства екстрагування структури знань з потоку інформації про предметну область. Цей процес описують поняттям

видобування”.

41

Видобування знань (knowledge elicitation) – це процедура взаємодії експерта з джерелом знань, у результаті якої стають явними процес міркувань фахівців в ухваленні рішення і структура їхніх уявлень про предметну область.

Сьогодні більшість розробників ЕС відзначають, що процес видобування знань залишається “найвужчим” місцем у побудові промислових ЕС. До того ж їм доводиться практично самостійно розробляти методи витягання, зіштовхуючись із такими труднощами:

організаційні непогодженості; невдалий метод витягання, що не збігається зі структурою знань у

певній області; неадекватна модель (мова) для подання знань.

Можна додати до цього:

невміння налагодити контакт з експертом; термінологічний різнобій;

відсутність цілісної системи знань в результаті витягання тільки “фрагментів”;

спрощення “картини світу” експерта тощо.

Процес видобування – це тривала і трудомістка процедура, в якій інженерові зі знань, озброєному спеціальними знаннями з когнітивної психології, системного аналізу, математичної логіки тощо, необхідно відтворити модель предметної області, якою користуються експерти для прийняття рішення. Часто розроблювачі-початківці ЕС, бажаючи спростити цю процедуру, намагаються підмінити інженера зі знань самим експертом. З багатьох причин це небажано.

По-перше, велика частина знань експерта – це результат численних нашарувань ступенів досвіду. І часто, знаючи, що з А виводиться В, експерт не усвідомлює, що ланцюжок його міркувань був набагато довший, наприклад A D C B або A Q R B .

По-друге, як стверджував ще Платон, мислення діалогічне. І тому діалог інженера зі знань і експерта – найприродніша форма вивчення лабіринтів пам’яті експерта, у яких зберігаються знання, частина яких має невербальний характер, тобто виражені не у формі слів, а, наприклад, у формі наочних образів. І саме в процесі пояснення інженерові зі знань експерт на ці розмиті асоціативні образи навішує чіткі словесні ярлики, тобто вербалізує знання.

42

По-третє, експертові важче створити модель предметної області внаслідок глибини й обсягу інформації, якою він володіє. Ще в ситуаційному керуванні було виявлено: об’єкти реального світу зв’я- зані більш ніж 200 типами відношень (тимчасові, просторові, при- чинно-наслідкові, типу” частина–ціле” тощо). Ці відношення і зв’язки предметної області утворять складну систему, з якої виділити “скелет” або головну структуру іноді доступніше аналітикові, що до того ж володіє системною методологією.

Термін “придбання” у цього залишений за автоматизованими системами прямого спілкування з експертом. Вони дійсно безпосередньо здобувають вже готові фрагменти знань відповідно до структур, закладених розроблювачами систем. Більшість цих інструментальних засобів спеціально орієнтовано на конкретні інтелектуальні системи із жорстко позначеною предметною областю й моделлю подання знань, тобто не є універсальними.

Придбання знань (knowledge acquisition) – процес наповнення бази знань експертом з використанням спеціалізованих програмних засобів.

Наприклад, система TEIRESIAS, що стала прародичкою всіх інструментаріїв для придбання знань, призначена для поповнення бази знань системи MYCIN або її дочірніх галузей, побудованих на “оболонці” EMYCIN в галузі медичної діагностики з використанням продукційної моделі подання знань. Три покоління та основні тенденції СПЗ будуть детально описані нижче.

Термін формування знань традиційно закріпився за надзвичайно перспективною галуззю інженерії знань, що активно розвивається і займається розробленням моделей, методів і алгоритмів навчання. Вона об’єднує індуктивні моделі формування знань і автоматичного породження гіпотез, наприклад, ДСМ-метод на основі навчальних вибирань, навчання за аналогією та іншими методами. Ці моделі дають змогу виявити причинно-наслідкові емпіричні залежності в базах даних з неповною інформацією, що містять структуровані числові й символьні об’єкти (часто в умовах неповноти інформації).

Формування знань (machine learning) – процес аналізу даних і виявлення прихованих закономірностей з використанням спеціального математичного апарату програмних засобів.

43

Традиційно до завдань формування знань або машинного навчання належать завдання прогнозування, ідентифікації (синтезу) функцій, розшифровування мов, індуктивного виведення й синтезу з додатковою інформацією. У широкому сенсі до навчання на прикладах можна зарахувати і методи навчання розпізнавання образів [9].

Індуктивне виведення правил із фактів застосоване також у системах AQ, AQUINAS, KSSI, INSTIL і деяких інших.

Найдослідженішими серед методів машинного навчання є, очевидно, методи розпізнавання образів, зокрема алгебраїчний підхід, в якому передбачається збагачення вихідних евристичних алгоритмів за допомогою алгебраїчних операцій і побудова сімейства алгоритмів, що гарантує одержання коректного алгоритму для виконання досліджуваного класу завдань, тобто алгоритму, що правильно класифікує кінцеву вибірку по всіх класах. Однак застосування методів формування знань не стало промисловою технологією розроблення баз знань.

Щоб ці методи стали елементами технології інтелектуальних систем, необхідно виконати низку завдань:

забезпечити механізм сполучення незалежно створених баз даних, що мають різні схеми, з базами знань інтелектуальних систем;

встановити відповідність між набором полів бази даних і безліччю елементів декларативного компонента бази знань;

виконати перетворення результату роботи алгоритму навчання у спосіб подання, підтримуваний програмними засобами інтелектуальної системи.

Крім перерахованих, існують також й інші стратегії одержання знань, наприклад, у разі навчання на прикладах (case-based reasoning), коли джерело знань – це множина прикладів предметної області. Навчання на основі прикладів (прецедентів) передбачає налаштування алгоритму розпізнавання на завдання за допомогою надання прикладів, класифікація яких відома.

Навчання на прикладах тісно пов’язане з машинним навчанням. Відмінність полягає в тому, що результат навчання в розглянутому тут випадку повинен бути інтерпретований у деякій моделі, в якій, можливо, вже містяться факти та закономірності предметної області, і перетворений у спосіб подання, що допускає використання результату навчання в базі знань, для моделювання міркувань, для роботи механізму пояснення тощо, тобто робить результат навчання елементом

44

відповідної технології. Наприклад, у системі INDUCE породжується несуперечливий опис деякого класу об’єктів з великою кількістю прикладів і контрприкладів заданого класу. Як мова подання використовується мова багатозначної логіки першого порядку).

Зазначимо також появу двох нових “прапорців” у стані прихильників методів машинного навчання – це data mining і knowledge discovery. Обидва підходи ґрунтуються на аналізі даних і пошуку закономірностей.

Отже, можна виділити три основні стратегії проведення стадії одержання знань під час розроблення інтелектуальних систем (див.

рис. 2.3).

1.З використанням ЕОМ за наявності відповідного програмного інструментарію, інакше – придбання знань.

2.З використанням програм навчання за наявності репрезентативної (тобто доволі представницької) вибірки прикладів прийняття рішень у предметній області та відповідних пакетів прикладних програм, інакше – формування знань.

3.Без використання обчислювальної техніки безпосереднім контактом інженера зі знань і джерела знань (експерт, спеціальна література або інші джерела), інакше – видобування знань.

Ідентифікація

Отримання

Структурування

...

 

 

проблеми

знань

 

 

 

Без застосування ПК

Із застосуванням ПК

1. Видобування

 

2. Набування

 

3. Формуван-

знань

 

знань

 

ня знань

 

 

 

 

 

Рис. 2.3. Стратегії одержання знань

У навчальному посібнику докладно розглядатимуться процеси видобування і придбання знань, тому що на сучасному етапі розроблення інтелектуальних систем ці стратегії є найефективнішими й найперспективнішими. Формування знань, що тяжіє більшою мірою до

45

області machine learning, тобто індуктивного навчання, ґрунтуючись на добре дослідженому апараті розпізнавання образів і виявлення подібності об’єктів, виходить за межі цього підручника. Також поза цією книгою залишилися питання формування знань з даних (data mining, knowledge discovery) тощо.

2.3. Теоретичні аспекти видобування знань

Оскільки основною проблемою інженерії знань є процес видобування знань, інженерові зі знань необхідно чітко розуміти природу й особливості цих процесів. Щоб розібратися в природі видобування знань, виділимо три основні аспекти цієї процедури (рис. 2.4):

А = {А1, А2, A3} = {психологічний, лінгвістичний, гносеологічний}.

Гносеологічний аспект А3

 

 

 

 

Видобу-

Л

 

вання

 

знань

 

 

н

 

а

і

 

 

 

ґ

 

с

 

в

 

п

 

і

 

е

с

 

 

к

т

 

т

и

 

 

А

ч

 

 

н

 

 

2

 

 

и

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

н

и

 

 

 

 

 

 

 

 

 

іч

 

1

 

 

 

 

 

 

 

г

 

 

А

 

 

 

о

л

о

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

 

 

х

 

 

 

 

е

 

 

 

 

и

 

 

 

п

 

 

 

 

П

с

 

 

 

с

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

Рис. 2.4. Теоретичні аспекти інженерії знань

2.3.1. Психологічний аспект

Із трьох аспектів видобування знань психологічний – А1 – є провідним, оскільки визначає успішність і ефективність взаємодії інженера зі знань (аналітика) з основним джерелом знань – експертомпрофесіоналом. Психологічний аспект виділяється ще й тому, що видобування знань відбувається найчастіше в процесі безпосереднього

46

спілкування розроблювачів системи. А у спілкуванні психологія є домінантною.

Спілкування, або комунікація (від лат. communicatio – зв’язок) – це міждисциплінарне поняття, що позначає всі форми безпосередніх контактів між людьми – від дружніх до ділових. Воно широко досліджується у психології, філософії, соціології, етології, лінгвістиці, семіотиці й інших науках. Існує кілька десятків теорій спілкування, і єдине, з чим погоджуються всі автори, – це складність, багатоплановість процедури спілкування. Підкреслюють, що спілкування – не просто односпрямований процес передавання повідомлень і не двотактний обмін порціями відомостей, а нерозчленований процес циркуляції інформації, тобто спільний пошук істини (див. рис. 2.5).

Неправильна

Експерт

Повідомлення

Інженер зі

схема

знань

 

 

 

 

 

 

Правильна

 

Засоби

Інженер зі

схема

Експерт

спілкування

знань

 

 

 

 

 

 

Рис. 2.5. Структура процесу спілкування

Отже, спілкування є процесом вироблення нової інформації, загальної для людей, що спілкуються, і яка породжує їхню спільність. І хоча спілкування – перший вид діяльності, який опановує людина в онтогенезі, по-справжньому володіють культурою й наукою спілкування одиниці.

Можна виділити чотири основні рівні спілкування.

1.Рівень маніпулювання, коли один суб’єкт розглядає іншого як засіб або перешкоду стосовно проекту своєї діяльності.

2.Рівень “рефлексивної гри”, коли у процесі своєї діяльності людина враховує “контрпроект” іншого суб’єкта, але не визнає за ним самооцінки і прагне до “виграшу”, до реалізації свого проекту.

3.Рівень правового спілкування, коли суб’єкти визнають право на існування проектів діяльності один одного й намагаються погодити їх хоча б зовні.

47

4. Рівень морального спілкування, коли суб’єкти внутрішньо приймають загальний проект взаємної діяльності.

Прагнення й уміння спілкуватися на вищому, четвертому, рівні може характеризувати ступінь професіоналізму інженера зі знань. Видобування знань – це особливий вид спілкування, який можна зарахувати до духовно-інформаційного типу. Спілкування ділиться на мате- ріально-практичне; духовно-інформаційне; практично-духовне. Інформаційний аспект спілкування для інженера зі знань з прагматичного погляду найважливіший.

Відомо, що втрати інформації під час розмовного спілкування великі (рис. 2.6).

Задумано

Набуло словесної форми

Вимовлено

Вислухано

Зрозуміло

Залишилось у пам’яті

100 %

90 %

80 %

 

 

 

 

70 %

 

 

 

 

60 %

 

 

 

 

 

 

 

 

24 %

Експерт

Спілкування

 

Інженер зі

 

знань

 

 

 

 

 

Рис. 2.6. Втрати інформації під час розмовного спілкування

У зв’язку з цим розглянемо проблему збільшення інформативності спілкування аналітика й експерта за рахунок використання психологічних знань.

Можна виділити такі структурні компоненти моделі спілкування під час видобування знань:

учасники спілкування (партнери); засоби спілкування (процедура); предмет спілкування (знання).

Відповідно до цієї структури виділимо три “етапи” психологічних проблем, які виникають під час видобування знань (рис. 2.7):

А1 – {S11, S12, S13} – {контактний, процедурний, когнітив-

ний}.

48

Психологічний аспект А1

S11 Контактний етап

S12 Процедурний етап

S13 Когнітивний етап

Рис. 2.7. Психологічний аспект видобування знань

Контактний етап (S11)

Практично всі психологи відзначають, що на будь-який колективний процес впливає атмосфера, що виникає в групі учасників. Існують експерименти, результати яких незаперечно показують, що часто дружня атмосфера в колективі більше впливає на результат, ніж індивідуальні здібності окремих членів групи. Особливо важливо, щоб у колективі розроблювачів складалися кооперативні, а не конкурентні стосунки. Для кооперації характерна атмосфера співробітництва, взаємодопомоги, зацікавленості в успіхах один одного, тобто вищий рівень морального спілкування, а для відносин конкурентного типу – атмосфера індивідуалізму й міжособистісного суперництва (нижчий рівень спілкування).

Прогнозувати зараз сумісність у спілкуванні зі 100 %-ю гарантією неможливо. Однак можна виділити багато факторів і риси особистості, характеру й інших особливостей учасників спілкування, які, безсумнівно, впливають на ефективність процедури.

Розроблення проблематики контактного етапу дало змогу виявити такі параметри партнерів, що впливають на результати процедури видобування знань:

S11 = {s11_і} = (стать, вік, особистість, темперамент, мотивація тощо), частина з яких згодом увійшли у формування моделі користувача. Значення параметрів статі (s11_1) і віку (s11_2) хоча й впливають на ефективність контакту, але не є критичними. У літературі [51] відзначається, що гарні результати дають гетерогенні пари (чоловік/жінка) і співвідношення: 20 > (Ве – Ва) > 5, де Ве – вік експерта; Ва – вік аналітика.

49

Під особистістю (s11_3) зазвичай розуміється стійка система психологічних рис, що характеризує індивідуальність людини. Компоненти (s11_3), що рекомендуються, досліджені в роботі [32] і доповнені якостями з посібника для журналістів, про що згадується у книзі [34]. (s11_3) = (доброзичливість, аналітичність, гарна пам’ять, увага, спостережливість, уява, вразливість, більша зібраність, наполегливість, товариськість, спритність).

З часів Галена і Гіпократа, що виділили чотири класичні типи темпераменту (s11_4), увійшли в наукову термінологію поняття (s11_4) = (холерик, сангвінік, меланхолік, флегматик). Відомо, що флегматики й меланхоліки повільніше засвоюють інформацію. І для забезпечення психологічного контакту з ними не варто задавати бесіді занадто швидкий темп, квапити їх з відповіддю. Зате вони набагато краще засвоюють нове, на відміну від холериків, для яких властиве поверхневе засвоювання інформації. Останніх варто спеціально наводити на міркування й рефлексію. У меланхоліків часто занижена самооцінка, вони сором’язливі, й у бесіді їх треба підбадьорювати. Отже, найуспішнішими в межах етапу S11 є сангвініки й холерики. На ефективність колективного рішення завдань впливає також і мотивація (s11_5), тобто прагнення до успіху. Інженер зі знань залежно від умов розроблення повинен вишукувати різноманітні стимули для експертів (зокрема й матеріальні). Експерт передає аналітику один з найдорожчих у світі продуктів – знання. І якщо одні люди діляться досвідом добровільно та із задоволенням, то інші доволі неохоче відкривають свої професійні таємниці. Іноді корисно розбудити в експерті дух суперництва, конкуренції (не порушуючи, звичайно, обстановки кооперативності в колективі).

Процедурний етап (S12)

Параметри процедурного етапу S12 описують безпосередньо процес здійснення процедури видобування знань. Фактично – це професійні параметри:

S12 = {s12_і} = {ситуація спілкування (місце, час, тривалість); устаткування (допоміжні засоби, освітленість, меблі); професійні прийоми (темп, стиль, методи тощо)}.

Інженер зі знань, що успішно опанував науку встановлення атмосфери довіри й взаєморозуміння з експертом (контактний етап – S11), повинен ще зуміти скористатися сприятливим впливом цієї

50