-
Відмінність знань від даних.
Поданню даних властивий пасивний аспект: книга, таблиця, заповнена інформацією пам'ять. У теорії штучного інтелекту особливо підкреслюється активний аспект подання знань: придбання знання повинне стати активною операцією, що дозволяє не тільки запам'ятовувати, але й застосовувати сприйняті (придбані, засвоєні) знання для міркувань на їхній основі.
Використання символічної мови, такої, як мови математичної логіки, дозволяє формулювати опис у формі, одночасно близькій і до звичайної мови, і до мови програмування. Втім, математична логіка дозволяє міркувати, базуючись на придбаних знаннях: логічні висновки дійсно є активними операціями одержання нових знань із уже засвоєних.
Складність поняття знання полягає в множинності його матеріальних носіїв. За цією ознакою можна виділити п’ять основних форм знань:
z1 - знання в пам’яті людини;
z2 - матеріальні знання (підручники, довідники, статті і т. і.);
z3 - поле знань
z4 - знання на мові представлення знань (формалізація z3);
z5 - база знань в комп’ютері (на машинних носіях інформації).
При створенні ЕС принциповим є етап розробки поля знань Z3, яке представляє собою деякий полуформалізований опис понять предметної області і зв’язків, що існують між ними.
Наприклад у вигляді малюнка, таблиці, схеми, діаграми, сітки... В подальшому поле знань переписується на деякій мові представлення знань, при цьому створюється модель знань Z4. Реалізація моделі за допомогою програмних засобів веде до виникнення п’ятої форми представлення знань Z5 - бази знань. Таким чином, приймемо в якості робочого таке визначення знань - знання, це основні закономірності предметної області, які дозволяють людині розв’язувати конкретні виробничі, наукові та інші задачі, тобто - факти, поняття, взаємозв’язки, оцінки, правила, евристики), а також стратегії прийняття рішень в цієї області.
Спробуємо виділити за аналогією п’ять форм даних:
Д1 - результат спостереження об’єкту, або дані в пам’яті;
Д2 - фіксація даних на матеріальному носії - таблиці, графіки, і т.д.;
Д3 - модель даних, деяка схема опису, яка пов’язує декілька об’єктів;
Д4 - дані на мові опису даних;
Д5 - база даних на машинному носії інформації.
Визначено п’ять властивостей, які відрізняють знання від даних:
-
Внутрішня інтерпретованість. Кожна інформаційна одиниця повинна мати унікальне ім’я, згідно якого ІС знаходить її, а також відповідає на запитання, які посилаються на це ім’я. Коли дані в пам’яті ЕОМ були позбавлені імен, то була відсутня і можливість їх ідентифікації системою. При цьому система не мала інформації про те, що криється за тими або іншими двійковими кодами машинного слова і не мала змоги без участі програміста відповісти на запитання типу «Що ти знаєш про механіка Іванова?». При використанні таких інформаційних одиниць як знання в пам’ять ЕОМ заноситься спеціальне машинне слово, в якому указано в яких комірках зберігаються відомості про прізвища, роки народження, спеціальності тощо. В пам’ять заносяться переліки всіх відповідних об’єктів, які можуть відігравати роль імен для тих машинних слів, які відповідають строкам таблиці.
Таблиця 2.1
-
Прізвище
Рік народження
Спеціальність
Стаж, число років
Сидоров
1965
Слюсар
5
Іванов
1925
Токар
30
Петров
1937
Сантехнік
25
Якщо, наприклад, в пам'ять ЕОМ потрібно було записати відомості про співробітників установи, представлені в табл. 1.1, то без внутрішньої інтерпретації в пам'ять ЕОМ була б занесена сукупність з чотирьох машинних слів, відповідних рядкам цієї таблиці. При цьому інформація про те, якими групами двійкових розрядів в цих машинних словах закодовані відомості про фахівців, у системи відсутні. Вони відомі лише програмісту, який використовує дані табл. 1.1 для вирішення виникаючих у нього задач. Система не в змозі відповісти на питання типу "Що тобі відомо про Петрова?" або чи "Є серед фахівців сантехнік?".
При переході до знань в пам'ять ЕОМ вводиться інформація про деяку протоструктуру інформаційних одиниць. В даному прикладі вона є спеціальним машинним словом, в якому вказано, в яких розрядах зберігаються відомості про прізвища, роках народження, спеціальностях і стажах. При цьому повинні бути задані спеціальні словники, в яких перераховані системи прізвища, року народження, спеціальності і тривалості стажу, що є в пам'яті. Всі ці атрибути можуть грати роль імен для тих машинних слів, які відповідають рядкам таблиці. По них можна здійснювати пошук потрібної інформації. Кожний рядок таблиці буде екземпляром протоструктури. В даний час СУБД забезпечують реалізацію внутрішньої інтерпретації всіх інформаційних одиниць, що зберігаються в базі даних.
-
Структурованість. Знання мають гнучку структуру типу «матрьошки», забезпечуючи рекурсивну вкладеність одних інформаційних одиниць в інші. Тобто для знань характерна можливість встановлення відношень типу «частина - ціле», «рід - вид», «елемент - клас».
При розв’язуванні структурованих проблем можна вирішувати спочатку менш складні. Най поширені типи проблем: лінійна, ієрархічна, рекурсивна. Лінійна поділяється на задачі, які розв’язуються послідовно одна за одною. Ієрархічна має вигляд дерева (кількість гілок, що входять у кожну вершину, дорівнює кількості підзадач у даній задачі). Рекурсивна застосовує повернення до раніше розв’язаних задач. Існують також задачі, які погано структуруються.
Мал. 2.2.Схеми проблем
-
Зв’язність. Можливість встановлення між інформаційними одиницями зв’язків різного типу, які можуть мати як декларативний («одночасно», «причина - наслідок»), так і процедурний характер («аргумент - функція»). Перераховані три особливості знань дозволили створити найбільш загальну модель представлення знань, яку називають семантичною сіткою.
-
Семантична метрика. Це відношення, яке характеризує ситуаційну відстань, або силу асоціативного зв’язку між інформаційними одиницями. Його називають також відношенням релевантності для інформаційних одиниць. Таке відношення дозволяє виділяти в інформаційній базі деякі типові ситуації (наприклад, «покупка»). Відношення релевантності дозволяє знаходити знання близькі до тих, які вже знайдені.
-
Активність. В традиційних системах всі інформаційні одиниці, які використовує комп’ютер підрозділяють на команди і дані. При цьому всі процеси ініціалізуються командами, дані ж є пасивними і використовуються командами тільки в разі необхідності. Інтелектуальні системи як і людина потребують для актуалізації своїх дій знання, яки вміщені в них. Виконання будь-якої програми в ІС викликається поточним станом інформаційної бази. При цьому джерелом активності може стати з’явлення в базі нових фактів, описів подій або встановлення нових зв’язків.
Існує ще один аспект, який відображує відмінність даних і знань. Будь яке поняття, яке використовує людина, має два боки - екстенсіонал та інтенсіонал.
Екстенсіонал - це набір конкретних фактів, що відповідають даному поняттю.
Інтенсіонал - це визначення, або опис поняття через його властивості. Наприклад, для поняття «поліклініка» інтенсіоналом буде набір типу: «поліклініка №2», «дитяча поліклініка», «обласна поліклініка» і т. і. Інтенсіонал же в цьому випадку можна визначити так: «медична установа для надання амбулаторної допомоги за місцем проживання і роботи». Наприклад, для реляційної бази даних екстенсіональними представленнями є конкретні факти про предметну область (рядок таблиці, або його стовпець).