- •В.В. Литвин технології менеджменту знань
- •Розділ 1 основні поняття менеджменту знань
- •1.1. Основні означення менеджменту знань
- •1.1.1. Структура менеджменту знань
- •Маркетинґ Проектування Підготовка виробництва Виробництво Збут
- •1.1.2. Формування знань
- •1.1.3. Введення даних
- •1.1.4. Адміністрування
- •1.1.5. Мотивація
- •1.1.6. Особливості впровадження мз
- •1.2. Менеджмент знань
- •1.3. Базові поняття менеджменту знань
- •1.3.1. Видобування знань
- •1.3.2. Системи пізнання
- •1.3.3. Організація доступу до знань
- •1.3.4. Інновації в області автоматизації
- •1.3.5. Менеджмент знань та інформації
- •1.3.6. Менеджмент знань та Інтернет
- •1.4. Онтологічний інжиніринг
- •1.4.1. Системи керування знаннями
- •1.4.2. Онтологія
- •1.5. Висновки
- •Запитання для повторення та контролю знань
- •Розділ 2 теоретичні аспекти менеджменту та інженерії знань
- •2.1. Поле знань
- •2.1.1. Мова опису поля знань
- •2.1.2. Семіотична модель поля знань
- •2.1.3. “Піраміда” знань
- •2.2. Стратегії одержання знань
- •2.3. Теоретичні аспекти видобування знань
- •2.3.1. Психологічний аспект
- •2.3.2. Лінгвістичний аспект
- •2.3.3. Гносеологічний аспект видобування знань
- •2.4. Теоретичні аспекти структурування знань
- •2.4.1. Історична довідка
- •2.4.2. Ієрархічний підхід
- •2.4.3. Традиційні методології структуризації
- •2.4.4. Об’єктно-структурний підхід (осп)
- •Стратифікація знань предметної області
- •Матриця об’єктно-структурного аналізу
- •Запитання для повторення та контролю знань
- •Розділ 3 технології менеджменту та інженерії знань
- •3.1. Класифікація методів практичного видобування знань
- •3.2. Комунікативні методи
- •3.2.1. Пасивні методи
- •Порівняльні характеристики пасивних методів видобування знань
- •3.2.2. Активні індивідуальні методи
- •Порівняльні характеристики активних індивідуальних методів видобування
- •3.2.3. Активні групові методи
- •3.3. Текстологічні методи
- •3.3.1. Методи структурування
- •Дані концептуалізації
- •3.3.2. Еволюція систем одержання знань
- •Запитання для повторення та контролю знань
- •Завдання для самостійного розв’язування
- •Розділ 4 прикладні аспекти менеджменту та інженерії знань
- •4.1. Латентні структури знань і психосемантика
- •4.1.1. Семантичні простори і психологічне градуювання
- •Опис зв’язку між поняттями
- •4.1.2. Методи багатовимірного градуювання
- •4.1.3. Використання метафор для виявлення “прихованих” структур знань
- •4.2. Метод репертуарних решіток
- •4.2.1. Основні поняття
- •4.2.2. Методи виявлення конструктів. Метод мінімального контексту
- •4.2.3. Аналіз репертуарних решіток
- •4.2.4. Автоматизовані методи
- •4.3. Керування знаннями
- •4.3.1. Що таке “керування знаннями”?
- •4.3.2. Керування знаннями і корпоративна пам’ять
- •4.3.3. Системи omis
- •4.3.4. Особливості розроблення омis
- •4.4. Візуальне проектування баз знань як інструмент пізнання
- •4.4.1. Від понятійних карт до семантичних мереж
- •4.4.2. База знань як пізнавальний інструмент
- •4.5. Проектування гіпермедіа бд і адаптивних навчальних систем
- •4.5.1. Гіпертекстові системи
- •4.5.2. Від мультимедіа до гіпермедіа
- •4.5.3. На шляху до адаптивних навчальних систем
- •Запитання для повторення та контролю знань
- •Розділ 5 Класифікація даних та знань
- •5.1. Важливість правильної класифікації
- •5.1.1. Класифікація й об’єктно-орієнтовне проектування
- •5.1.2. Труднощі класифікації
- •5.2. Ідентифікація класів і об’єктів
- •5.2.1. Класичний і сучасний підходи
- •5.2.2. Об’єктно-орієнтований аналіз
- •5.3. Ключові абстракції й механізми
- •5.3.1. Ключові абстракції
- •5.3.2. Ідентифікація механізмів
- •5.4. Висновки
- •Запитання для повторення та контролю знань
- •Розділ 6 онтології й онтологічні системи
- •6.1. Поняття онтології
- •6.2. Моделі онтології й онтологічної системи
- •Класифікація моделей онтології
- •6.3. Методології створення і “життєвий цикл”онтології
- •6.4. Мови опису онтологій
- •6.4.1. Види owl
- •6.4.2. Структура онтологій
- •Запитання для повторення та контролю знань
- •Розділ 7 Програмні засоби побудови онтологій
- •7.1. Онтологія як засіб формалізації та алгоритмізації знань в інтелектуальній системі
- •7.1.1. Аналіз підходів до навчання онтологій
- •7.1.2. Загальні принципи проектування онтологій
- •7.1.3. Формати та стандарти подання інформації
- •7.1.4. Засоби для створення онтології
- •7.2. Технологія розроблення онтологій в редакторі Protégé
- •7.2.1. Еволюція Protégé
- •7.2.2. Protégé-owl. Мова Web онтологій owl
- •7.2.3. Основні терміни та поняття у Protégé-owl
- •Терміни та їх синоніми
- •7.2.4. Методика розроблення онтології засобами Protégé
- •Створення й експлуатація онтології
- •7.2.5. Створення онтології
- •Запитання для повторення та контролю знань
- •Завдання для самостійного розв’язування
- •Література
- •Литвин Василь Володимирович технології менеджменту знань
- •V lp.Com.Ua, ел. Пошта: vmr@vlp.Com.Ua
3.3.2. Еволюція систем одержання знань
Перше покоління таких систем з’явилося в середині 80-х років XX ст. – системи одержання знань (СОЗ). Це засіб наповнення “порожніх” ЕС, тобто систем, з БЗ яких вилучені знання (наприклад, EMYCIN – EMPTY MYCIN, спустошена медична ЕС MYCIN зі спеціальною діалоговою системою заповнення бази знань TEIRESIAS). Їхні автори вважали, що прямий діалог експерта з комп’ютером через СОЗ допоможе скоротити життєвий цикл розроблення. Однак досвід створення та впровадження СОЗ засвідчив недосконалість такого підходу. Основні недоліки СОЗ першого покоління:
слабке опрацювання методів вилучення та структурування знань;
жорсткість моделі подання знань, вбудованої в СОЗ і прив’язаної до програмної реалізації;
обмеження на предметну область.
Отже, традиційна схема розроблення СОЗ I покоління (створення конкретної ЕС спустошення БЗ розроблення СОЗ для нових наповнень БЗ формування нової БЗ для іншої ЕС) виявилась непридатною для промислового застосування.
Друге покоління СОЗ з’явилося наприкінці 80-х років минулого століття і було орієнтоване на ширший модельний підхід з наголосом на попередньому детальному аналізі предметної області. Так, у Європі широке застосування одержала методологія KADS (Knowledge Acquisition and Documentation Structuring), в основі якої лежить поняття інтерпретаційної моделі, яка дає змогу процеси вилучення, структурування та формалізації знань розглядати як “інтерпретацію” лінгвістичних знань в інші подання та структури.
KADS-методологія
Рис. 3.9 демонструє перетворення знань за методологією KADS через специфікацію п’ятьох кроків аналізу “ідентифікація – концептуалізація – гносеологічний рівень – рівень аналізу виконання” та стадії чи простору проектування. Результатом аналізу є концептуальна модель експертизи, що складається з чотирьох рівнів (рівня області – рівня виведення – рівня задачі – стратегічного рівня), яка згодом вводиться в простір проектування. Розв’язуючи реальні задачі KADS використовує бібліотеку інтерпретаційних моделей, що описують загальні експертні задачі, такі як діагностика, моніторинг тощо, без конкретного наповнення об’єктами предметної області. Інтерпретаційна модель – це концептуальна модель без рівня області. На основі вилучених лінгвістичних даних відбувається відбір, комбінація та вкладення верхніх рівнів моделі, тобто рівнів виведення та задачі, які наповнюються конкретними об’єктами й атрибутами з рівня області, та відображають у результаті концептуальну модель задачі, яку розглядають. На рис. 3.9 подано модель життєвого циклу KADS.
Рис. 3.9. Модель життєвого циклу KADS
Перші системи програмної підтримки KADS-методології зображені набором інструментальних засобів KADS Роwer Tools. У цей набір входять такі системи: редактор протоколів РЕD (Ргоtocol Editor); редактор систем понять (Соnсерt Editor); редактор концептуальних моделей СМЕ (Соnсерtual Моdel Еditог) та ІМ-бібліотекар IML (Interpretation Model Librarian).
Редактор протоколів – програмний засіб, що допомагає інженеру зі знань у здійсненні аналізу знань про предметну область на лінгвістичному рівні. Працюючи зі знаннями на цьому рівні, вихідним матеріалом є тексти (протоколи) – записи інтерв’ю з експертом, протоколи “думок вголос” та будь-які інші тексти, корисні з погляду інженера зі знань. Редактор протоколів реалізований як гіпертекстова система, що забезпечує виділення фрагментів у тексті, який аналізують, встановлення зв’язків між фрагментами, групування фрагментів, анотування фрагментів. Фрагменти можуть мати будь-яку довжину – від окремого слова до протоколу.
Рис. 3.10. Основні моделі KADS
Фрагменти можуть не перекривати один одного. Можливі такі типи зв’язків між фрагментами:
анотація (зв’язок між фрагментом протоколу та деяким текстом, введеним інженером зі знань для специфікації цього фрагмента);
член групи (зв’язок між фрагментом та назвою – ім’ям групи фрагментів; об’єднання фрагментів у групу дає змогу інженеру зі знань структурувати протоколи. Група фрагментів одержує унікальну назхву);
поіменований зв’язок (зв’язок між двома фрагментами, ім’я зв’язку обирає інженер зі знань);
понятійний зв’язок (поіменований зв’язок між фрагментом та поняттям, зазвичай використовується, якщо фрагмент містить визначення понять).
Редактор понять допомагає інженеру зі знань організувати предметні знання у вигляді набору понять і відношень, що їх поєднують. Кожне поняття має назву і може мати атрибути; кожен атрибут може мати значення. Які атрибути використовуються – це визначає інженер зі знань із урахуванням специфіки предметної області. За допомогою редактора понять інженер зі знань може вводити довільні відношення між поняттями і створювати ієрархічні структури з того чи іншого поняття. Існує єдине відношення (IS-A), семантика якого “вбудована” в редактор. Якщо інженер зі знань встановлює це відношення між двома поняттями, то має місце успадкування атрибутів. Обравши атрибут “визначення”, користувач зможе побачити на екрані графічне зображення структури виведення, елементами якої є джерела знань та метакласи. Як джерела знань, так і метакласи мають свої набори атрибутів; інженер зі знань може переглянути їх, вказуючи на відповідний елемент.
Психосемантика
Окрім ідеології KADS, на розроблення СОЗ II-го покоління значний вплив мали методи суміжних наук, зокрема психосемантики, одного з молодих напрямів прикладної психології, перспективного інструменту, що дає змогу реконструктурувати семантичний простір у пам’яті і тим самим моделювати глибинні структури знань експерта (див. наступний розділ). Уже перші вклади психосемантики в ШІ в середині 80-х років XX ст. дали змогу одержати достатньо наглядні результати. У подальшому розвиток цих методів відбувався по лінії розроблення зручних пакетів прикладних програм, основаних на методах багатомірного шкалювання, факторного аналізу, а також спеціалізованих методів опрацювання репертуарних решіток (див. наступний розділ). Прикладами СОЗ такого типу є системи КЕLLY, MEDIS. Специфіка конкретних додатків вимагала розвитку також “нечисельних” методів, які використовують парадигму логічного виведення. Прикладами систем цього напряму є системи ЕТS і AQUINAS. Успіхи СОЗ II-го покоління дали змогу значно розширити ринок ЕС, який до кінця 80-х років XX ст. оцінювався в 300 млн. доларів на рік. Однак і ці системи не були вільними від недоліків, до найважливіших з яких можна зарахувати:
недосконалість інтерфейсу, в результаті чого непідготовлені експерти не можуть оволодіти системою і відмовляються від неї;
важкість налаштування на конкретне професійне мовне середовище;
необхідність розроблення дорогих лінгвістичних процесорів для аналізу звичайних мовних повідомлень та текстів.
Третє покоління СОЗ – КЕАТS, МАСАО, NЕХРЕRТ-ОВJЕСТ – перенесло акцент у проектуванні з експерта на інженера зі знань. Нові СОЗ – це програмні засоби для аналітика, глибокі, а головне такі, що використовують графічні можливості сучасних робочих станцій та досягнення САSЕ-технологій (Соmputer-Aided Software Engineering). Ці системи дають змогу не задавати заздалегідь інтерпретаційну модель, а формувати структуру БЗ динамічно. Існують різні класифікації СОЗ – за виразністю та потужністю інструментальних засобів; за узагальненими характеристиками; в межах структурно-функціонального підходу.
Методологічні проблеми
Основна проблема, що постає перед розробниками, – відсутність теоретичного базису процесу вилучення та структурування знань – породжує дочірні вужчі питання та казуси на всіх етапах створення інтелектуальних систем. Навіть ретельно опрацьована методологія KADS, описана в попередньому розділі, страждає громіздкістю та явною надмірністю. Нижче перелічені найзагальніші проблеми, що виникають в послідовності, яка відповідає стадіям життєвого циклу:
розмитість критеріїв вибору задачі;
слабке опрацювання теоретичних аспектів процесів вилучення знань (філософські, лінгвістичні, психологічні, педагогічні, дидактичні та інші аспекти), а також відсутність обґрунтованої класифікації методів вилучення знань та розкиданість термінології;
відсутність єдиного теоретичного базису процедури структурування знань;
жорсткість моделей подання знань, що змушує розробників зменшувати та урізати реальні знання експертів;
недосконалість математичного базису моделей подання знань (дескриптивний, а не конструктивний характер більшості наявних математичних моделей);
емпіричність процедури вибору програмного інструментарію та процесу тестування (відсутність критеріїв, розрізнені класифікації), тестування (відсутність критеріїв, різноманітність класифікації тощо).
Технологічні проблеми
Більша частина технологічних проблем є звичайним наслідком методологічних і спричинена ними. Найсерйознішими з технологічних проблем є:
відсутність концептуальної цілісності та узгодженості між окремими прийомами та методами інженерії знань;
недостатність чи відсутність кваліфікованих спеціалістів у галузі інженерії знань;
відсутність техніко-економічних показників оцінки ефективності ЕС;
явна неповнота та недостатність наявних методів структурування знань, відсутність класифікацій та рекомендацій з вибору належного методу;
незважаючи на багатство ринку програмних засобів, недостатність промислових систем підтримки розроблення та їх вузька спрямованість (залежність від платформи, мови реалізації, обмежень предметної області), розрив між мовами ПЗ та мовами, вбудованими в “оболонки” ЕС;
жорсткість програмних методів, їх низька адаптивність, відсутність індивідуальної спрямованості на користувача та предметну область;
слабкі графічні можливості програмних засобів, недостатнє врахування когнітивних та ергономічних факторів.