Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекція 3. Класифікація та особливості знань.doc
Скачиваний:
23
Добавлен:
30.05.2020
Размер:
118.78 Кб
Скачать
  1. Відмінність знань від даних.

Поданню даних властивий пасивний аспект: книга, таблиця, заповнена інформацією пам'ять. У теорії штучного інтелекту особливо підкреслюється активний аспект подання знань: придбання знання повинне стати активною операцією, що дозволяє не тільки запам'ятовувати, але й застосовувати сприйняті (придбані, засвоєні) знання для міркувань на їхній основі.

Використання символічної мови, такої, як мови математичної логіки, дозволяє формулювати опис у формі, одночасно близькій і до звичайної мови, і до мови програмування. Втім, математична логіка дозволяє міркувати, базуючись на придбаних знаннях: логічні висновки дійсно є активними операціями одержання нових знань із уже засвоєних.

Складність поняття знання полягає в множинності його матеріальних носіїв. За цією ознакою можна виділити п’ять основних форм знань:

z1 - знання в пам’яті людини;

z2 - матеріальні знання (підручники, довідники, статті і т. і.);

z3 - поле знань

z4 - знання на мові представлення знань (формалізація z3);

z5 - база знань в комп’ютері (на машинних носіях інформації).

При створенні ЕС принциповим є етап розробки поля знань Z3, яке представляє собою деякий полуформалізований опис понять предметної області і зв’язків, що існують між ними.

Наприклад у вигляді малюнка, таблиці, схеми, діаграми, сітки... В подальшому поле знань переписується на деякій мові представлення знань, при цьому створюється модель знань Z4. Реалізація моделі за допомогою програмних засобів веде до виникнення п’ятої форми представлення знань Z5 - бази знань. Таким чином, приймемо в якості робочого таке визначення знань - знання, це основні закономірності предметної області, які дозволяють людині розв’язувати конкретні виробничі, наукові та інші задачі, тобто - факти, поняття, взаємозв’язки, оцінки, правила, евристики), а також стратегії прийняття рішень в цієї області.

Спробуємо виділити за аналогією п’ять форм даних:

Д1 - результат спостереження об’єкту, або дані в пам’яті;

Д2 - фіксація даних на матеріальному носії - таблиці, графіки, і т.д.;

Д3 - модель даних, деяка схема опису, яка пов’язує декілька об’єктів;

Д4 - дані на мові опису даних;

Д5 - база даних на машинному носії інформації.

Визначено п’ять властивостей, які відрізняють знання від даних:

  1. Внутрішня інтерпретованість. Кожна інформаційна одиниця повинна мати унікальне ім’я, згідно якого ІС знаходить її, а також відповідає на запитання, які посилаються на це ім’я. Коли дані в пам’яті ЕОМ були позбавлені імен, то була відсутня і можливість їх ідентифікації системою. При цьому система не мала інформації про те, що криється за тими або іншими двійковими кодами машинного слова і не мала змоги без участі програміста відповісти на запитання типу «Що ти знаєш про механіка Іванова?». При використанні таких інформаційних одиниць як знання в пам’ять ЕОМ заноситься спеціальне машинне слово, в якому указано в яких комірках зберігаються відомості про прізвища, роки народження, спеціальності тощо. В пам’ять заносяться переліки всіх відповідних об’єктів, які можуть відігравати роль імен для тих машинних слів, які відповідають строкам таблиці.

Таблиця 2.1

Прізвище

Рік народження

Спеціальність

Стаж, число років

Сидоров

1965

Слюсар

5

Іванов

1925

Токар

30

Петров

1937

Сантехнік

25

Якщо, наприклад, в пам'ять ЕОМ потрібно було записати відомості про співробітників установи, представлені в табл. 1.1, то без внутрішньої інтерпретації в пам'ять ЕОМ була б занесена сукупність з чотирьох машинних слів, відповідних рядкам цієї таблиці. При цьому інформація про те, якими групами двійкових розрядів в цих машинних словах закодовані відомості про фахівців, у системи відсутні. Вони відомі лише програмісту, який використовує дані табл. 1.1 для вирішення виникаючих у нього задач. Система не в змозі відповісти на питання типу "Що тобі відомо про Петрова?" або чи "Є серед фахівців сантехнік?".

При переході до знань в пам'ять ЕОМ вводиться інформація про деяку протоструктуру інформаційних одиниць. В даному прикладі вона є спеціальним машинним словом, в якому вказано, в яких розрядах зберігаються відомості про прізвища, роках народження, спеціальностях і стажах. При цьому повинні бути задані спеціальні словники, в яких перераховані системи прізвища, року народження, спеціальності і тривалості стажу, що є в пам'яті. Всі ці атрибути можуть грати роль імен для тих машинних слів, які відповідають рядкам таблиці. По них можна здійснювати пошук потрібної інформації. Кожний рядок таблиці буде екземпляром протоструктури. В даний час СУБД забезпечують реалізацію внутрішньої інтерпретації всіх інформаційних одиниць, що зберігаються в базі даних.

  1. Структурованість. Знання мають гнучку структуру типу «матрьошки», забезпечуючи рекурсивну вкладеність одних інформаційних одиниць в інші. Тобто для знань характерна можливість встановлення відношень типу «частина - ціле», «рід - вид», «елемент - клас».

При розв’язуванні структурованих проблем можна вирішувати спочатку менш складні. Най поширені типи проблем: лінійна, ієрархічна, рекурсивна. Лінійна поділяється на задачі, які розв’язуються послідовно одна за одною. Ієрархічна має вигляд дерева (кількість гілок, що входять у кожну вершину, дорівнює кількості підзадач у даній задачі). Рекурсивна застосовує повернення до раніше розв’язаних задач. Існують також задачі, які погано структуруються.

Мал. 2.2.Схеми проблем

  1. Зв’язність. Можливість встановлення між інформаційними одиницями зв’язків різного типу, які можуть мати як декларативний («одночасно», «причина - наслідок»), так і процедурний характер («аргумент - функція»). Перераховані три особливості знань дозволили створити найбільш загальну модель представлення знань, яку називають семантичною сіткою.

  2. Семантична метрика. Це відношення, яке характеризує ситуаційну відстань, або силу асоціативного зв’язку між інформаційними одиницями. Його називають також відношенням релевантності для інформаційних одиниць. Таке відношення дозволяє виділяти в інформаційній базі деякі типові ситуації (наприклад, «покупка»). Відношення релевантності дозволяє знаходити знання близькі до тих, які вже знайдені.

  3. Активність. В традиційних системах всі інформаційні одиниці, які використовує комп’ютер підрозділяють на команди і дані. При цьому всі процеси ініціалізуються командами, дані ж є пасивними і використовуються командами тільки в разі необхідності. Інтелектуальні системи як і людина потребують для актуалізації своїх дій знання, яки вміщені в них. Виконання будь-якої програми в ІС викликається поточним станом інформаційної бази. При цьому джерелом активності може стати з’явлення в базі нових фактів, описів подій або встановлення нових зв’язків.

Існує ще один аспект, який відображує відмінність даних і знань. Будь яке поняття, яке використовує людина, має два боки - екстенсіонал та інтенсіонал.

Екстенсіонал - це набір конкретних фактів, що відповідають даному поняттю.

Інтенсіонал - це визначення, або опис поняття через його властивості. Наприклад, для поняття «поліклініка» інтенсіоналом буде набір типу: «поліклініка №2», «дитяча поліклініка», «обласна поліклініка» і т. і. Інтенсіонал же в цьому випадку можна визначити так: «медична установа для надання амбулаторної допомоги за місцем проживання і роботи». Наприклад, для реляційної бази даних екстенсіональними представленнями є конкретні факти про предметну область (рядок таблиці, або його стовпець).