Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕХНОЛОГІЇ МЕНЕДЖМЕНТУ ЗНАНЬ

.pdf
Скачиваний:
152
Добавлен:
07.02.2016
Размер:
3.02 Mб
Скачать

розділили 702 виявлених поняття на сім категорій (методом сортування карток). Таблиця 3.3 відображає числові дані концептуалізації.

Таблиця 3.3

 

 

Дані концептуалізації

 

 

 

 

 

 

 

 

 

 

Відсоток

 

 

 

 

 

 

від

 

Відсоток від загального числа термінів,

Категорії

загального

одержаних відповідним методом

 

числа

 

 

 

 

 

 

 

 

термінів

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список

Інтерв’ю-

Список

Створення

 

 

 

запитань

вання

операцій

заголовку

 

 

 

 

 

 

 

Пояснення

6

 

5,5

7,2

7,0

4,9

 

 

 

 

 

 

 

Загальні

22,0

 

43,6

18,9

36,8

4,9

правила

 

 

 

 

 

 

 

 

 

 

 

 

 

Режимні

9,0

 

9,8

8,4

11,6

6,6

правила

 

 

 

 

 

 

 

 

 

 

 

 

 

Поняття

42,0

 

18,4

38,9

8,5

77,7

 

 

 

 

 

 

 

Процедури

9,0

 

5,1

9,5

25,6

1,2

 

 

 

 

 

 

 

Факти

9,0

 

15,0

12,5

8,9

1,2

 

 

 

 

 

 

 

Інші поняття

3,0

 

2,6

4,6

1,6

3,5

 

 

 

 

 

 

 

Загалом результати показали, що для виявлення безпосередньо концептів найрезультативнішими виявились методи інтерв’ювання і створення заголовка підручника. Проте найбільша кількість загальних правил була породжена за методом списку дій. Отже, ще раз справдилося твердження про те, що немає “найкращого” методу, є методи, які підходять для тих чи інших ситуацій і типів знань.

Цікаво, що число правил – продукцій “якщо..., то...” – склало найбільший відсоток у всіх чотирьох методах. Це говорить про те, що популярна продукційна модель навряд чи є звичною для людських моделей репрезентації знань.

Методи виявлення зв’язків між поняттями

Концепти не існують незалежно, вони введені в загальну поняттєву структуру за допомогою відношень. Виявлення зв’язків між поняттями, розробляючи бази знань, створює для інженера зі знань чимало проблем. Те, що знання в пам’яті – це деякі пов’язані структури, а не окремі фрагменти, загальновідомо і очевидно. До того ж основний

111

наголос в наявних моделях подання знань робиться на поняття, а зв’язки вводять доволі примітивні (здебільшого, причинно-наслідкові).

В останніх роботах з теорії ШІ щоразу більшу увагу приділяють взаємопов’язаності структур знань. Так, в роботі [130] введено поняття сценарію (script) як деякої структури подання знань. Основу сценарію становить КОП (концептуальна організація пам’яті) та мета-КОПи – деякі узагальнювальні структури. Сценарії, своєю чергою, поділяються на фрагменти, чи сцени (chunks). Зв’язки між фрагментами – часові чи просторові, всередині фрагмента – найрізноманітніші: ситуаційні, асоціативні, функціональні тощо.

Усі методи виявлення таких зв’язків можна поділити на дві групи:

формальні; неформальні (основані на додатковій роботі з експертом).

Неформальні методи виявлення зв’язків вигадує інженер зі знань для того, щоб змусити експерта вказати явні та неявні зв’язки між поняттями. Найпоширенішим є метод “сортування карток” у групи, що широко застосовується і для формування понять. Другим неформальним методом є побудова замкнутих кривих. У цьому разі експерта просять обвести замкнутою кривою пов’язані між собою поняття. Цей метод може бути реалізований як на папері, так і на екрані дисплея. Тут можна говорити про залучення елементів когнітивної графіки.

Після того, як визначені зв’язки між поняттями, всі поняття немов би розпадаються на групи. Такі групи є метапоняттями, присвоєння імен яким відбувається на наступній стадії процесу структурування.

Методи виділення метапонять та деталізація понять “піраміда знань”

Процес утворення метапонять, тобто інтерпретації груп понять, одержаних на попередній стадії, як і зворотна процедура – деталізація понять, очевидно, є такими операціями, що принципово не піддаються формалізації. Вони вимагають високої спеціалізації експертів, а також наявності здатності до “наклеювання” лінгвістичних ярликів. Якщо на рис. 3.8 показані схеми узагальнення та деталізації на тривіальних прикладах, то в реальних предметних областях ця задача виявляється доволі трудомісткою. Незалежно від того, формальними чи нефор-

112

мальними методами були виявлені поняття чи деталі понять, присвоєння імен чи їхня інтерпретація – завжди неформальний процес, в якому інженер зі знань просить експерта дати назву деякій групі понять чи окремих ознак.

 

 

доба

 

 

 

рік

 

ранок

день

вечір

ніч

зима

весна

літо

осінь

Рис. 3.8. Узагальнення та деталізація понять

3.3.2. Еволюція систем одержання знань

Перше покоління таких систем з’явилося в середині 80-х років XX ст. – системи одержання знань (СОЗ). Це засіб наповнення порожніх” ЕС, тобто систем, з БЗ яких вилучені знання (наприклад, EMYCIN – EMPTY MYCIN, спустошена медична ЕС MYCIN зі спеціальною діалоговою системою заповнення бази знань TEIRESIAS). Їхні автори вважали, що прямий діалог експерта з комп’ютером через СОЗ допоможе скоротити життєвий цикл розроблення. Однак досвід створення та впровадження СОЗ засвідчив недосконалість такого підходу. Основні недоліки СОЗ першого покоління:

слабке опрацювання методів вилучення та структурування знань; жорсткість моделі подання знань, вбудованої в СОЗ і прив’язаної до

програмної реалізації; обмеження на предметну область.

Отже, традиційна схема розроблення СОЗ I покоління (створення конкретної ЕС спустошення БЗ розроблення СОЗ для нових наповнень БЗ формування нової БЗ для іншої ЕС) виявилась непридатною для промислового застосування.

Друге покоління СОЗ з’явилося наприкінці 80-х років минулого століття і було орієнтоване на ширший модельний підхід з наголосом на попередньому детальному аналізі предметної області. Так, у Європі широке застосування одержала методологія KADS (Knowledge Acquisition and Documentation Structuring), в основі якої лежить по-

няття інтерпретаційної моделі, яка дає змогу процеси вилучення,

113

структурування та формалізації знань розглядати як “інтерпретацію” лінгвістичних знань в інші подання та структури.

KADS-методологія

Рис. 3.9 демонструє перетворення знань за методологією KADS через специфікацію п’ятьох кроків аналізу “ідентифікація – концептуалізація – гносеологічний рівень – рівень аналізу виконання” та стадії чи простору проектування. Результатом аналізу є концептуальна модель експертизи, що складається з чотирьох рівнів (рівня області – рівня виведення – рівня задачі – стратегічного рівня), яка згодом вводиться в простір проектування. Розв’язуючи реальні задачі KADS використовує бібліотеку інтерпретаційних моделей, що описують загальні експертні задачі, такі як діагностика, моніторинг тощо, без конкретного наповнення об’єктами предметної області. Інтерпретаційна модель – це концептуальна модель без рівня області. На основі вилучених лінгвістичних даних відбувається відбір, комбінація та вкладення верхніх рівнів моделі, тобто рівнів виведення та задачі, які наповнюються конкретними об’єктами й атрибутами з рівня області, та відображають у результаті концептуальну модель задачі, яку розглядають. На рис. 3.9 подано модель життєвого циклу KADS.

Лінгвістичні

дані

Концептуальна

модель

Модель

проектування

Детальна

модель

проектування

Коди

Простір проектування Простір аналізу

Ідентифікація

Концептуальний

рівень

Гносеологічний

рівень

Логічний рівень

Рівень аналізу виконання

Рівні аналізу

Рис. 3.9. Модель життєвого циклу KADS

114

Перші системи програмної підтримки KADS-методології зображені набором інструментальних засобів KADS Роwer Tools. У цей набір входять такі системи: редактор протоколів РЕD (Ргоtocol Editor); редактор систем понять (Соnсерt Editor); редактор концептуальних моделей СМЕ (Соnсерtual Моdel Еditог) та ІМ-бібліотекар IML

(Interpretation Model Librarian).

Редактор протоколів – програмний засіб, що допомагає інженеру зі знань у здійсненні аналізу знань про предметну область на лінгвістичному рівні. Працюючи зі знаннями на цьому рівні, вихідним матеріалом є тексти (протоколи) – записи інтерв’ю з експертом, протоколи “думок вголос” та будь-які інші тексти, корисні з погляду інженера зі знань. Редактор протоколів реалізований як гіпертекстова система, що забезпечує виділення фрагментів у тексті, який аналізують, встановлення зв’язків між фрагментами, групування фрагментів, анотування фрагментів. Фрагменти можуть мати будь-яку довжину – від окремого слова до протоколу.

Плани

Метаправила

Стратегічний

рівень

Контролює

Цілі

Задачі

Рівень

задачі

Застосовує

Метакласи

Джерела

Рівень знань виведення

 

 

Описує

 

 

 

 

 

 

 

Концепції

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Відношення

 

 

 

 

 

 

 

 

Рівень

 

 

 

Структури

 

 

 

 

 

 

 

 

 

 

 

задачі

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.10. Основні моделі KADS

115

Фрагменти можуть не перекривати один одного. Можливі такі типи зв’язків між фрагментами:

анотація (зв’язок між фрагментом протоколу та деяким текстом, введеним інженером зі знань для специфікації цього фрагмента);

член групи (зв’язок між фрагментом та назвою – ім’ям групи фрагментів; об’єднання фрагментів у групу дає змогу інженеру зі знань структурувати протоколи. Група фрагментів одержує унікальну назхву);

поіменований звязок (зв’язок між двома фрагментами, ім’я зв’язку обирає інженер зі знань);

понятійний звязок (поіменований зв’язок між фрагментом та поняттям, зазвичай використовується, якщо фрагмент містить визначення понять).

Редактор понять допомагає інженеру зі знань організувати предметні знання у вигляді набору понять і відношень, що їх поєднують. Кожне поняття має назву і може мати атрибути; кожен атрибут може мати значення. Які атрибути використовуються – це визначає інженер зі знань із урахуванням специфіки предметної області. За допомогою редактора понять інженер зі знань може вводити довільні відношення між поняттями і створювати ієрархічні структури з того чи іншого поняття. Існує єдине відношення (IS-A), семантика якого “вбудована” в редактор. Якщо інженер зі знань встановлює це відношення між двома поняттями, то має місце успадкування атрибутів. Обравши атрибут “визначення”, користувач зможе побачити на екрані графічне зображення структури виведення, елементами якої є джерела знань та метакласи. Як джерела знань, так і метакласи мають свої набори атрибутів; інженер зі знань може переглянути їх, вказуючи на відповідний елемент.

Психосемантика

Окрім ідеології KADS, на розроблення СОЗ II-го покоління значний вплив мали методи суміжних наук, зокрема психосемантики, одного з молодих напрямів прикладної психології, перспективного інструменту, що дає змогу реконструктурувати семантичний простір у пам’яті і тим самим моделювати глибинні структури знань експерта (див. наступний розділ). Уже перші вклади психосемантики в ШІ в середині 80-х років XX ст. дали змогу одержати достатньо наглядні результати. У подальшому розвиток цих методів відбувався по лінії роз-

116

роблення зручних пакетів прикладних програм, основаних на методах багатомірного шкалювання, факторного аналізу, а також спеціалізованих методів опрацювання репертуарних решіток (див. наступний розділ). Прикладами СОЗ такого типу є системи КЕLLY, MEDIS. Специфіка конкретних додатків вимагала розвитку також “нечисельних” методів, які використовують парадигму логічного виведення. Прикладами систем цього напряму є системи ЕТS і AQUINAS. Успіхи СОЗ II-го покоління дали змогу значно розширити ринок ЕС, який до кінця 80-х років XX ст. оцінювався в 300 млн. доларів на рік. Однак і ці системи не були вільними від недоліків, до найважливіших з яких можна зарахувати:

недосконалість інтерфейсу, в результаті чого непідготовлені експерти не можуть оволодіти системою і відмовляються від неї;

важкість налаштування на конкретне професійне мовне середовище; необхідність розроблення дорогих лінгвістичних процесорів для

аналізу звичайних мовних повідомлень та текстів.

Третє покоління СОЗ – КЕАТS, МАСАО, NЕХРЕRТ-ОВJЕСТ – перенесло акцент у проектуванні з експерта на інженера зі знань. Нові СОЗ – це програмні засоби для аналітика, глибокі, а головне такі, що використовують графічні можливості сучасних робочих станцій та досягнення САSЕ-технологій (Соmputer-Aided Software Engineering).

Ці системи дають змогу не задавати заздалегідь інтерпретаційну модель, а формувати структуру БЗ динамічно. Існують різні класифікації СОЗ – за виразністю та потужністю інструментальних засобів; за узагальненими характеристиками; в межах структурно-функціо- нального підходу.

Методологічні проблеми

Основна проблема, що постає перед розробниками, – відсутність теоретичного базису процесу вилучення та структурування знань – породжує дочірні вужчі питання та казуси на всіх етапах створення інтелектуальних систем. Навіть ретельно опрацьована методологія KADS, описана в попередньому розділі, страждає громіздкістю та явною надмірністю. Нижче перелічені найзагальніші проблеми, що виникають в послідовності, яка відповідає стадіям життєвого циклу:

розмитість критеріїв вибору задачі; слабке опрацювання теоретичних аспектів процесів вилучення знань

(філософські, лінгвістичні, психологічні, педагогічні, дидактичні та

117

інші аспекти), а також відсутність обґрунтованої класифікації методів вилучення знань та розкиданість термінології;

відсутність єдиного теоретичного базису процедури структурування знань;

жорсткість моделей подання знань, що змушує розробників зменшувати та урізати реальні знання експертів;

недосконалість математичного базису моделей подання знань (дескриптивний, а не конструктивний характер більшості наявних математичних моделей);

емпіричність процедури вибору програмного інструментарію та процесу тестування (відсутність критеріїв, розрізнені класифікації), тестування (відсутність критеріїв, різноманітність класифікації тощо).

Технологічні проблеми

Більша частина технологічних проблем є звичайним наслідком методологічних і спричинена ними. Найсерйознішими з технологічних проблем є:

відсутність концептуальної цілісності та узгодженості між окремими прийомами та методами інженерії знань;

недостатність чи відсутність кваліфікованих спеціалістів у галузі інженерії знань;

відсутність техніко-економічних показників оцінки ефективності ЕС; явна неповнота та недостатність наявних методів структурування

знань, відсутність класифікацій та рекомендацій з вибору належного методу;

незважаючи на багатство ринку програмних засобів, недостатність промислових систем підтримки розроблення та їх вузька спрямованість (залежність від платформи, мови реалізації, обмежень предметної області), розрив між мовами ПЗ та мовами, вбудованими в “оболонки” ЕС;

жорсткість програмних методів, їх низька адаптивність, відсутність індивідуальної спрямованості на користувача та предметну область;

слабкі графічні можливості програмних засобів, недостатнє врахування когнітивних та ергономічних факторів.

118

Запитання для повторення та контролю знань

1.Як класифікують методи практичного видобування знань?

2.Який основний принцип поділу методів практичного видобування

знань?

3.Які методи видобування знань називаються комунікативними?

4.На які дві групи можна поділити комунікативні методи?

5.Які методи видобування знань називаються ігровими?

6.Як класифікують предметні області з погляду їх документованості?

7.Як класифікують предметні області за ступенем структурованості

знань?

8.Які методи видобування знань належать до пасивних?

9.Які методи видобування знань належать до індивідуальних активних?

10.Які існують різновиди методу спостережень?

11.Які виникають труднощі під час складання протоколу “думок

вголос”?

12.Як діляться питання під час читання лекцій?

13.Обґрунтуйте порівняльні характеристики пасивних методів видобування знань.

14.Які існують способи здійснення анкетування?

15.Перелічіть рекомендації під час складання анкет.

16.Що розуміють під інтерв‟ю?

17.Як відбувається класифікація запитань під час інтерв‟ю?

18.Що таке вільний діалог?

19.Які стадії видобування знань виділяють під час вільного діалогу?

20.Які порівняльні характеристики активних індивідуальних методів видобування знань Ви знаєте?

21.Які методи видобування знань належать до групових активних?

22.Які переваги групових методів Ви знаєте?

23.У чому полягає суть методу “мозкової атаки”?

24.Обґрунтуйте порівняння активних групових методів видобування

знань.

25.У чому полягає суть методу експертної гри? Наведіть приклади.

26.У чому полягає суть методу рольових ігор? Наведіть приклади.

27.У чому полягає суть методу ігор з тренажерами? Наведіть

приклади.

28.У чому полягає суть методу комп‟ютерних експертних ігор? Наведіть приклади.

29.Які методи видобування знань належать до текстологічних?

30.Сформулюйте задачу видобування знань з текстів.

31.Побудуйте схему видобування знань зі спеціальних текстів?

32.Які компоненти містить науковий текст?

119

33.Що таке мікроконтекст та макроконтекст?

34.Що таке основні моменти розуміння тексту?

35.Що таке семантична структура тексту?

36.Які компоненти впливають на інтерпретацію тексту?

37.Які Ви знаєте методи виявлення понять?

38.Як діляться методи виявлення зв‟язків між поняттями?

39.Які існують методи виділення метапонять та деталізації понять?

40.Наведіть еволюцію систем одержання знань.

41.Що таке КADS-методологія?

42.Які основні моделі КADS Ви знаєте?

43.Які існують типи зв‟язків між фрагментами?

44.Що таке психосемантика?

45.Які існують методологічні проблеми КADS?

46.Які існують технологічні проблеми КADS?

Завдання для самостійного розв’язування

Чому задача придбання знань є вузьким місцем в проектуванні інтелектуальних систем? Які рішення пропонують, щоб запобігти такій ситуації?

120