Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лачинов В.М., Поляков А.О. Інформодинаміка [укр.язык].doc
Скачиваний:
31
Добавлен:
02.05.2014
Размер:
5.23 Mб
Скачать

2.4. Інформаційна база

Якщо Ви знаєте, що Вам потрібно – зверніться до бази даних,

якщо не знаєте – Вам потрібна база знань”.

У зв’язку з тими, що в літературі зустрічаються достатньо некоректні твердження про дані і знання і їх співвідношення, приведемо узагальнений приклад такого роду викладу матеріалу.

Зазвичай можна зустріти приблизно наступне.

Роль знань в інтелектуальній діяльності визначає необхідність наявності в комп’ютері блоку подання знань (БПЗ). Це блок пов’язаний із зовнішнім світом двома блоками перетворювачів (БП1 і БП2), які перетворюють знання про предметну галузь (у тому числі і запити) із зовнішнього подання (ЗШП) у внутрішнє (ВТП), – блок БП1 і, навпаки, з внутрішнього подання в зовнішнє – БП2, зрозуміле для користувача (рис. 2.1). Інформаційна модель блоку подання знань у загальному випадку складається з блоку інтерпретацій (БІ), блоку навчання (БН), блоку виведення рішень (БВР) і інтелектуального банку даних (ІБД) (рис. 2.2). ІБД, у свою чергу, підрозділяють на базу знань (БЗ) і базу даних (БД).

База знань містить відомості, що відображають закономірності даної предметної галузі і дозволяють прогнозувати і виводити нові факти, не відображені в базі даних.

База даних включає фактографічні, кількісні дані, що характеризують предметну галузь.

Ми вважаємо, що цей матеріал достатній для самостійної оцінки такого виду побудов. Основні неприємності, що забезпечуються цим підходом, зводяться до структурної тотожності бази знань і бази даних, відсутності якого-небудь механізму розділення “даних” і “відомостей” і використання поняття інформаційної моделі знань (і моделі зовнішнього світу), що є відгомоном “інформаційної точки зору” і в реальних системах не веде ні до яких конструктивних, інженерних рішень, що реалізуються.

Часто використовувані для подолання цих труднощів поняття екстенсіонального і інтенсіонального знання також не ведуть до радикальної зміни ситуації. Вони тільки на найзагальнішому рівні свідчать про потенційну необхідність розділення конкретного “екстенсіонального знання” (під цим пропонується розуміти “дані”) і абстрактного “інтенсіонального знання” (його, за відсутністю кращого терміну, називають “відомості”) при стандартному логічному чи мережевому підході до подання інформації в комп’ютері.

У зв’язку із зайвою свободою трактування в літературі цих понять як описувачів знань, дамо для довідки про них ряд визначень і відповідний коментар.

Екстенсіонал знаку (обсяг знаку) визначає конкретний клас всіх його допустимих денотатов, тобто об’єктів, що позначаються даним знайомий.

Інтенсіонал знаку (сенс знаку) визначає пов’язане з ним поняття.

Інтенсіональні дані (узагальнювальні дані, старші угрупування в ієрархії даних) описують абстрактні об’єкти, події тощо.

Екстенсіональні дані (молодші, щодо виділеного інтенсіонального рівня) є дані, що характеризують конкретні об’єкти чи їх молодші угрупування (щодо інтенсіональних) по класифікації, що існує в даній предметній галузі.

У різних контекстах деякий знак може виступати і як інтенсіонал і як екстенсіонал.

Поняття екстенсіоналу і інтенсіоналу зазвичай присутні у всіх міркуваннях, пов’язаних з тими чи іншими класифікуючими відносинами між деякими термінами.

Узагальнювальний сенс інтенсіоналу часто веде до глибоко невірного трактування інтенсіональних даних як знань в інтелектуальній системі. При цьому підході весь словник предметної галузі фактично повинен бути розділений на два зафіксовані рівні ієрархічних відношень між термінами. Абсолютно зрозуміло, що це ще один спосіб просто позбутися від контекстної залежності мови і забезпечити роботу з лінгвістичним описом об’єкта на рівні його кібернетичної моделі, видаючи за знання ієрархію термінів.

Введення поняття екстенсіоналу і інтенсіоналу, екстенсіональних даних і інтенсіонального знання в міркування про інтелектуальні системи відображає спроби деяких дослідників трактувати знання через обсяг поняття.

Розглянемо інший підхід (рис. 2.3).

Не торкаючись тут рівня фізичної організації роботи з сукупністю даних-знання, на логічному рівні виділимо поняття “Інформаційної бази”, тобто бази, в якій дані зберігаються в сукупності зі своїми всілякими зв’язками. Для нас це означає, що інформаційна база може бути розділена на логічному рівні на дві складові: базу даних – формальне сховище записів і базу знань – формальне сховище адрес і типів (імен) біжучих зв’язків даних.

Не має сенсу питання про старшинство бази даних і бази знань чи їх порівняльний аналіз. Це логічні об’єкти різної природи, взаємно доповнюючі один одного. В принципі, їх можна вважати деякими еквівалентами фактографічної і семантичної складових інформаційної посилки.

На логічному рівні подання інформаційної бази складається із зв’язаних баз даних, знань і інструменту (системи) її розробки і управління. У певних умовах така конструкція може виступати і як суб’єкт, і як об’єкт. Природно, що поки що це ще тільки інженерна реалізація “половинки” інтелектуальної системи.

У разі цілеспрямованої роботи зі структурами даних на контекстно-залежному рівні, включається процес СУО, тобто організація взаємодії не менше двох таких інформаційних баз. У цьому випадку сума інформаційних баз стає базою інтелектуальною за інженерним визначенням інтелектуальної системи.

Зрозуміло, що інструмент створення і управління такою інформаційною базою є сама ІСУ, що містить цю базу, оскільки одним з її завдань якраз і є накопичення, структуризація і використання даних і їх контекстних зв’язків для прийняття рішень, що управляють, вже на зовнішньому рівні. Так само зрозуміло, що неможливо говорити про базу, що існує зовні ІСУ, бо впорядкування даних без зовнішньої, щодо інформаційної бази, мети, ІСУ, що задається, логічно безглузде.

Структурну схему ІСУ як сукупність деякої кількості інформаційних, а в повному вигляді – вже як сукупність інтелектуальних баз ми розглянемо в р. 4. Поки ж необхідно відзначити, що в даному визначенні база нарешті набуває свого нормального логічного значення – основа, простір подання інформації (середовище для виникнення “інформаційних резонансів” – див. частина III), а зовсім не банк і не склад для даних.

Чи можемо ми уявити собі знання даних? Так, це можливо. Будь-яка незаповнена таблиця є тут прикладом. Прикладом тут є і звичайний резонансний фільтр. А ось чи можемо ми уявити собі дані без структури? Це маловірогідно, окрім як для якого-небудь виродженого випадку, бо дані впорядковані вже тому, що належать системі, виділені з неї з якоюсь певною метою, впорядковані вже тому, що будь-яка їх структура або послідовність є впорядкуванням, а погано впорядковані дані зберігають можливість їх, хай і невірною, інтерпретації.

Взагалі кажучи, поняття “правильної” чи “об’єктивної” інтерпретації даних (“правильного зв’язку даних”) у визначення знань вводити не можна з простої причини – їх упорядкування чи структура зв’язків постійно міняються залежно від контексту вхідного інформаційного потоку і, в цьому сенсі, будь-яке впорядкування даних може бути правильним в деякому поточному контексті {51.Уважний читач вже відзначив, що звідси випливає необхідність відповідної корекції загальноприйнятого підходу до об’єктно-орієнтованого опису і подання масивів даних. В принципі, ми хочемо написати на цю тему окрему книгу, а поки деякі важливі моменти наголошуватимуться в необхідних місцях у міру викладу матеріалу.

Той же уважний читач вже готовий пред’явити нам зауваження про порушення обіцянки працювати тільки з відкритими системами – дані це вже модель. Пояснимо для цього розділу і всіх подальших. Як буде видно з подальшого (хоч і на основі наявного матеріалу вже можна зробити такий висновок), всі складні системи, також як і інтелект, існують тільки як процес. У багатьох випадках доцільний розгляд цього процесу при зафіксованому значенні часу, точніше поза часовою віссю. Такого роду “модель” до тих пір, поки вона не буде поширена на часову вісь, є не замиканням системи, а її “фотографією”, поточним зрізом її стану. Головне в дослідженнях – не поширювати таке “модельне” подання системи на те, що вимагає її розгляду в динаміці її зовнішніх зв’язків. Ми постараємося надалі, при явній і неявній згадці чи використанні моделей, не порушувати цих угод.}.

Зробимо деякі висновки.

Відрив знань від даних можливий і представляє інтерес для самостійного дослідження структур його організації, наприклад, з погляду оцінок їх стабільності під поточним потоком контекстних змін.

Відрив даних від їх зв’язку з якою-небудь (нехай навіть імовірнісною) структурою (від інтерпретації) неможливий, але і це представляє інтерес для наукового дослідження, проблемою якого може бути, наприклад, відновлення контексту по поточній структурі і передісторії зв’язків даних.

Достатньо зрозуміло, що повинен існувати і деякий механізм роботи з даними і їх структурою (семантичною складовою, знаннями). Його завданням є створення послідовностей станів інформаційної бази в різні моменти часу, співвідношення цих станів із відповідними їм запитами і їх контекстами, що у свою чергу може вести не до послідовної корекції бази, а до вельми складної структури станів при одночасному інформаційному обміні з декількома джерелами і багато чого іншого.

Тут ми вважаємо за доцільне зробити екскурс у проблему мов і мовних моделей для управління, якому ми присвятимо цілий р. 3, після чого серед інших питань р. 4, присвяченому складності відкритих систем, розглянемо проблему переходу від бази інформаційної до бази інтелектуальної, такої, що реалізує структуру СУО.

Чіткість і надмірна строгість мови

веде до інтелектуальних судом”.

Геллнер Е. “Слова і речі”.

Цитується за В.В. Налімовим