
- •5.4. Висновки 182
- •1.1. Основні означення менеджменту знань
- •1.1.1. Структура менеджменту знань
- •Маркетинґ Проектування Підготовка виробництва Виробництво Збут.
- •1.1.2. Формування знань
- •1.1.3. Введення даних
- •1.1.4. Адміністрування
- •1.1.5. Мотивація
- •1.1.6. Особливості впровадження мз
- •1.2. Менеджмент знань
- •1.3. Базові поняття менеджменту знань
- •1.3.1. Видобування знань
- •1.3.2. Системи пізнання
- •1.3.3. Організація доступу до знань
- •1.3.4. Інновації в області автоматизації
- •1.3.5. Менеджмент знань та інформації
- •1.3.6. Менеджмент знань та Інтернет
- •1.4. Онтологічний інжиніринґ
- •1.4.1. Системи керування знаннями
- •1.4.2. Онтологія
- •1.5. Висновки
- •9. Базові поняття менеджменту знань.
- •2.1. Поле знань
- •2.1.1. Мова опису поля знань
- •2.1.3. «Піраміда» знань
- •2.2. Стратегії одержання знань
- •2.3. Теоретичні аспекти видобування знань
- •2.3.1. Психологічний аспект
- •2.3.2. Лінгвістичний аспект
- •2.3.3. Гносеологічний аспект видобування знань
- •2.4. Теоретичні аспекти структурування знань
- •2.4.1. Історична довідка
- •2.4.2. Ієрархічний підхід
- •2.4.3. Традиційні методології структуризації
- •2.4.4. Об'єктно-структурний підхід (осп)
- •3.1. Класифікація методів практичного видобування знань
- •3.2. Комунікативні методи
- •3.2.1. Пасивні методи
- •3.2.2. Активні індивідуальні методи
- •3.2.3. Активні групові методи
- •3.3. Текстологічні методи
- •3.3.1. Методи структурування
- •3.3.2. Еволюція систем одержання знань
- •4.1. Латентні структури знань і психосемантика
- •4.1.1. Семантичні простори і психологічне градуювання
- •4.1.2. Методи багатовимірного градуювання
- •4.1.3. Використання метафор для виявлення «прихованих» структур знань
- •4.2. Метод репертуарних решіток
- •4.2.1. Основні поняття
- •4.2.2. Методи виявлення конструктів. Метод мінімального контексту
- •4.2.3. Аналіз репертуарних решіток
- •4.2.4. Автоматизовані методи
- •4.3. Керування знаннями
- •4.3.1. Що таке «керування знаннями»?
- •4.3.2. Керування знаннями і корпоративна пам'ять
- •4.3.3. Системи omis
- •4.3.4. Особливості розроблення омis
- •4.4. Візуальне проектування баз знань як інструмент пізнання
- •4.4.1. Від понятійних карт до семантичних мереж
- •4.4.2. База знань як пізнавальний інструмент
- •4.5. Проектування гіпермедіа бд і адаптивних навчальних систем
- •4.5.1. Гіпертекстові системи
- •4.5.2. Від мультимедіа до гіпермедіа
- •4.5.3. На шляху до адаптивних навчальних систем
- •5.1. Важливість правильної класифікації
- •5.1.1. Класифікація й об’єктно-орієнтовне проектування
- •5.1.2. Труднощі класифікації
- •5.2. Ідентифікація класів і об'єктів
- •5.2.1. Класичний і сучасний підходи
- •5.2.2. Об’єктно-орієнтований аналіз
- •5.3. Ключові абстракції й механізми
- •5.3.1. Ключові абстракції
- •5.3.2. Ідентифікація механізмів
- •5.4. Висновки
- •6.1. Поняття онтології
- •6.2. Моделі онтології й онтологічної системи
- •6.3. Методології створення і «життєвий цикл» онтології
- •6.4. Мови опису онтологій
- •6.4.1. Види owl
- •6.4.2. Структура онтологій
- •7.1. Онтологія як засіб формалізації та алгоритмізації знань в інтелектуальній системі
- •7.1.1. Аналіз підходів до навчання онтологій
- •7.1.2. Загальні принципи проектування онтологій
- •7.1.3. Формати та стандарти подання інформації
- •7.1.4. Засоби для створення онтології
- •7.2. Технологія розроблення онтологій в редакторі Protégé
- •7.2.1. Еволюція Protégé
- •7.2.2. Protégé-owl. Мова Web онтологій owl
- •7.2.3. Основні терміни та поняття у Protégé-owl
- •7.2.4. Методика розроблення онтології засобами Protégé
- •Створення й експлуатація онтології
- •7.2.5. Створення онтології
2.1.3. «Піраміда» знань
Ієрархічність понятійної структури свідомості підкреслюється в роботах багатьох психологів [18]. Поле знань можна стратифікувати, тобто розглядати на різних рівнях абстракції понять. У «піраміді знань» кожний наступний рівень служить для сходження на новий ступінь узагальнення і поглиблення знань у предметній області. Отже, можлива наявність декількох рівнів понятійної структури Sk. Видається доцільним пов'язати це із глибиною професійного досвіду або з рівнем ієрархії в структурних щаблях організації. Зазвичай, стратегії прийняття рішень, тобто функціональні структури Sf, на різних рівнях будуть істотно відрізнятися. Якщо спробувати дати математичну інтерпретацію рівнів піраміди знань U = (U1,U2,U3,…,UN), то найбільш найпрозорішим є поняття гомоморфізму — відображення деякої системи Е, що зберігає основні операції і основні відношення цієї системи. Нехай
деяка
система з основними поняттями
та основними відношеннями
.
Гомоморфізмом
системи Е
в однотипну їй систему Е'
буде:
,
називається відображення,
яке задовольняє наступні дві умови:
Для
всіх елементів
з Е
та всіх
.
Відповідно до введених позначень рівні піраміди суть гомоморфізми моделей (тобто понять і відношень) предметної області
де
;
,
—
мета-поняття, або поняття вищого рівня
абстракції;
—
мета-відношення;
—
мета-стратегії. Сходячи по ступенях
піраміди, ми отримуємо систему
гомоморфізмів, що відповідає результатам,
отриманим в когнітивній психології про
зменшення розмірності семантичного
простору пам'яті зі збільшенням досвіду
експертів.
2.2. Стратегії одержання знань
Під час формування поля знань ключовим питанням є сам процес отримання знань, коли відбувається перенесення компетентності експертів на інженерів зі знань. Для назви цього процесу в літературі з експертних систем (ЕС) набуло поширення кілька термінів: придбання, здобування, витягання, одержання, виявлення, формування знань. У англомовній спеціальній літературі в основному використовуються два: acquisition (придбання) і elicitation (виявлення, витягання, встановлення).
Термін «придбання» трактується або дуже широко — тоді він включає весь процес передавання знань від експерта до бази знань ЕС, або вже як спосіб автоматизованої побудови бази знань за допомогою діалогу експерта і спеціальної програми (при цьому структура поля знань заздалегідь закладається в програму). В обох випадках термін «придбання» не стосується самого таїнства екстрагування структури знань з потоку інформації про предметну область. Цей процес описується поняттям «видобування».
Видобування знань (knowledge elicitation) — це процедура взаємодії експерта із джерелом знань, у результаті якої стають явними процес міркувань фахівців при ухваленні рішення і структура їх уявлень про предметну область.
На сьогодні більшість розробників ЕС відзначають, що процес видобування знань залишається «найвужчим» місцем при побудові промислових ЕС. При цьому їм доводиться практично самостійно розробляти методи витягання, зіштовхуючись із такими труднощами:
організаційні непогодженості;
невдалий метод витягання, що не збігається зі структурою знань у певній області;
неадекватна модель (мова) для подання знань.
Можна додати до цього:
невміння налагодити контакт із експертом;
термінологічний різнобій;
відсутність цілісної системи знань в результаті витягання тільки «фрагментів»;
спрощення «картини світу» експерта тощо.
Процес видобування — це тривала і трудомістка процедура, в якій інженерові зі знань, озброєному спеціальними знаннями з когнітивної психології, системного аналізу, математичної логіки та ін., необхідно відтворити модель предметної області, якою користуються експерти для прийняття рішення. Часто розроблювачі-початківці ЕС, бажаючи спростити цю процедуру, намагаються підмінити інженера зі знань самим експертом. З багатьох причин це небажано.
По-перше,
велика частина знань експерта — це
результат численних нашарувань ступенів
досвіду. І часто, знаючи, що з А
виводиться В,
експерт не усвідомлює, що ланцюжок його
міркувань був набагато довший, наприклад
або
.
По-друге, як було відомо ще Платонові, мислення діалогічне. І тому діалог інженера зі знань і експерта — найприродніша форма вивчення лабіринтів пам'яті експерта, у яких зберігаються знання, частина яких має невербальний характер, тобто виражені не у формі слів, а, наприклад, у формі наочних образів. І саме в процесі пояснення інженерові зі знань експерт на ці розмиті асоціативні образи навішує чіткі словесні ярлики, тобто вербалізує знання.
По-третє, експертові важче створити модель предметної області внаслідок глибини й обсягу інформації, якою він володіє. Ще в ситуаційному керуванні було виявлено: об'єкти реального світу зв'язані більш ніж 200 типами відношень (тимчасові, просторові, причинно-наслідкові, типу » частина-ціле» та ін.). Ці відношення і зв'язки предметної області утворять складну систему, з якої виділити «скелет» або головну структуру іноді доступніше аналітикові, що до того ж володіє системною методологією.
Термін «придбання» у цього залишений за автоматизованими системами прямого спілкування з експертом. Вони дійсно безпосередньо здобувають вже готові фрагменти знань відповідно до структур, закладених розроблювачами систем. Більшість цих інструментальних засобів спеціально орієнтовано на конкретні інтелектуальні системи із жорстко позначеною предметною областю й моделлю подання знань, тобто не є універсальними.
Придбання знань (knowledge acquisition) — процес наповнення бази знань експертом з використанням спеціалізованих програмних засобів.
Наприклад, система TEIRESIAS, що стала прародичкою всіх інструментаріїв для придбання знань, призначена для поповнення бази знань системи MYCIN або її дочірніх галузей, побудованих на «оболонці» EMYCIN в області медичної діагностики з використанням продукційної моделі подання знань. Три покоління та основні тенденції СПЗ будуть детально описані нижче.
Термін формування знань традиційно закріпився за надзвичайно перспективною областю інженерії знань, що активно розвивається і займається розробленням моделей, методів і алгоритмів навчання. Вона включає індуктивні моделі формування знань і автоматичного породження гіпотез, наприклад, ДСМ-метод на основі навчальних вибирань, навчання за аналогією та іншими методами. Ці моделі дозволяють виявити причинно-наслідкові емпіричні залежності в базах даних з неповною інформацією, що містять структуровані числові й символьні об'єкти (часто в умовах неповноти інформації).
Формування знань (machine learning) — процес аналізу даних і виявлення прихованих закономірностей з використанням спеціального математичного апарату програмних засобів.
Традиційно до завдань формування знань або машинного навчання відносяться завдання прогнозування, ідентифікації (синтезу) функцій, розшифровування мов, індуктивного виведення й синтезу з додатковою інформацією. У широкому сенсі до навчання на прикладах можна віднести і методи навчання розпізнавання образів [9].
Індуктивне виведення правил із фактів застосоване також у системах AQ, AQUINAS, KSSI, INSTIL і деяких інших.
Найдослідженішими серед методів машинного навчання є, очевидно, методи розпізнавання образів, зокрема алгебраїчний підхід, в якому передбачається збагачення вихідних евристичних алгоритмів за допомогою алгебраїчних операцій і побудова сімейства алгоритмів, що гарантує одержання коректного алгоритму для рішення досліджуваного класу завдань, тобто алгоритму, що правильно класифікує кінцеву вибірку по всіх класах. Однак застосування методів формування знань наразі не стало промисловою технологією розроблення баз знань.
Щоб ці методи стали елементами технології інтелектуальних систем, необхідно вирішити ряд завдань:
забезпечити механізм сполучення незалежно створених баз даних, що мають різні схеми, з базами знань інтелектуальних систем;
встановити відповідність між набором полів бази даних і безліччю елементів декларативного компонента бази знань;
виконати перетворення результату роботи алгоритму навчання у спосіб подання, підтримуваний програмними засобами інтелектуальної системи.
Крім перерахованих, існують також і інші стратегії одержання знань, наприклад, у випадку навчання на прикладах (case-based reasoning), коли джерело знань — це множина прикладів предметної області. Навчання на основі прикладів (прецедентів) включає настроювання алгоритму розпізнавання на завдання за допомогою надання прикладів, класифікація яких відома.
Навчання на прикладах тісно пов'язане з машинним навчанням. Відмінність полягає в тому, що результат навчання в розглянутому тут випадку повинен бути інтерпретований у деякій моделі, в якій, можливо, вже містяться факти та закономірності предметної області, і перетворений у спосіб подання, що допускає використання результату навчання в базі знань, для моделювання міркувань, для роботи механізму пояснення тощо, тобто робить результат навчання елементом відповідної технології. Наприклад, у системі INDUCE нпороджується несуперечливий опис деякого класу об'єктів по великій кількості прикладів і контрприкладів заданого класу. Як мова подання використовується мова багатозначної логіки першого порядку).
Зазначимо також появу двох нових «прапорців» у стані прихильників методів машинного навчання — це data mining і knowledge discovery. Обидва підходи базуються на аналізі даних і пошуку закономірностей.
Отже, можна виділити три основні стратегії проведення стадії одержання знань під час розроблення інтелектуальних систем (див. рис. 2.3).
1. З використанням ЕОМ при наявності відповідного програмного інструментарію, інакше — придбання знань.
2. З використанням програм навчання при наявності репрезентативної (тобто досить представницької) вибірки прикладів прийняття рішень у предметній області та відповідних пакетів прикладних програм, інакше — формування знань.
3. Без використання обчислювальної техніки шляхом безпосереднього контакту інженера зі знань і джерела знань (експерт, спеціальна література або інші джерела), інакше — видобування знань.
Рис. 2.3. Стратегії одержання знань.
У навчальному посібнику докладно будуть розглядатися процеси видобування і придбання знань, тому що на сучасному етапі розроблення інтелектуальних систем ці стратегії є найефективнішими й найперспективнішими. Формування знань, що тяжіє більшою мірою до області machine learning, тобто індуктивного навчання, ґрунтуючись на добре дослідженому апараті розпізнавання образів і виявлення подібності об'єктів, виходить за рамки цього підручника. Також поза цією книгою залишилися питання формування знань із даних (data mining, knowledge discovery) та ін.