Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lekcija_04.doc
Скачиваний:
17
Добавлен:
14.11.2018
Размер:
455.17 Кб
Скачать

4.1.2. Оцінювання Математичні методи

Оцінювання кількості алгоритмічної інформації2. Цей метод оцінювання кількості інформації встановлює, що відображення кібернетичною системою певних дій (операцій, кроків, процедур) також несе певну кількість інформації. Зрозуміло, що ці дії можуть бути описані певним алгоритмом і, відповідно, закодовані в певній комп’ютерній програмі. Таким чином, при алгоритмічному методі оцінювання кількість інформації дорівнює довжині алгоритма (програми), виміряної в бітах, яка перетворює один об’єкт в інший.

Для допитливих. Оцінюють кількості інформації за алгоритмічним методом як довжину програми, що дає змогу перетворити об'єкт A в об'єкт B, тобто

= L[G(A,B)], (6)

де L – функція отримання довжини програми, а G – програма перетворення, біти.

У поданому вище прикладі на с. ХХХ застосування алгоритмічного методу дасть цілком інший результат. Згідно з цим методом оцінка кількості інформації в літері Ф стосовно Р буде дорівнювати кількості байтів програми, яка перетворює літеру Ф в Р (від літери Р зліва потрібно забрати півколо).

Вадами цього методу оцінювання є те, що він:

а) залежить від кількості “будівельних елементів”, що дають змогу перетворити один об’єкт в інший (чим дрібніші “будівельні елементи”, тим довшою виявляється програма перетворення для однієї й тієї ж пари об’єктів);

б) не дає змоги виміряти кількість інформації в одному об’єкті, оскільки для вимірювання їх завжди потрібно як мінімум два;

в) не враховує, що одна й та ж програма може бути призначена для перетворення не одного, а цілого класу однотипних об’єктів; при цьому для різних об’єктів певного класу кількість виконаних команд може бути різною, оскільки в програмах є цикли, хоча згідно формули 5 кількість інформації в цих об’єктах буде однаковою, адже програма перетворення має сталу довжину.

Оцінювання кількості семантичної інформації. Семантичний метод оцінювання встановлює, що, по-перше, повідомленнях повинні мати структуру ланцюжка, кожна ланка якого може розгалужуватися (наприклад, текст), а, по-друге, кожне наступне випробовування залежить від завершення попереднього. У математиці такі процеси називають марковськими (за прізвищем їх першого дослідника — відомого російського математика А. Маркова).

Таким чином, при семантичному методі оцінювання кількість інформації в кожній наступній ланці ланцюжка дорівнює логарифмові при основі 2 від кількості варіантів вибору цієї позиції при умові її оцінювання з позиції поточної ланки ланцюжка.

Для допитливих. Оцінювання кількості семантичної інформації відбувається стосовно кожної i-ї позиції тексту за формулою3

Ii = log2 (Si), (7)

де Si – кількість варіантів вибору в i-й позиції ланцюжка сигналів.

Приклад. Припустімо, отримувачу дають перше слово повідомлення Жили і пропонують спрогнозувати, яким буде наступне слово, тобто в другій позиції речення. Такими словами отримувач може назвати такі: були, дід, собі, король тощо. Якщо таких слів, як у нас, чотири, то тоді кількість інформації в другій позиції за формулою (1) буде рівною I = log2 4 = 2 біти. Вибравши слово для другої позиції, процедуру за такою самою методикою повторюють для третьої позиції й так само далі. При потребі визначити кількість інформації в реченні кількість інформації для всіх позицій речення підсумовують.

Такий самий спосіб можна застосувати і для відгадування літер у словах. Цей спосіб часто використовують у розважальних програмах телебачення, де переможцям, що послідовно відгадали всі літери слова, вручають призи.

Приклад. В семантичній концепції оцінити кількість інформації в літері Р або в значенні окремого слова мама взагалі неможливо, оскільки літера чи слово подані окремо, поза межами ланцюжка літер чи слів.

Вадами цього методу є те, що він:

а) не дає можливості оцінити кількість інформації за межами ланцюжка сигналів повідомлення (наприклад, як в алгоритмічному методі стосовно літери Р );

б) не дає можливості оцінити кількість інформації в образах, зокрема й семантичної інформації в словах4.

Оцінювання кількості образної інформації5. Метод оцінювання кількості образної інформації (тобто інформації в образах) є різновидом алгоритмічного. Він базується на такому розділі кібернетики як теорія розпізнавання образів. Прикладом такого процесу може служити розпізнавання людиною знайомої мелодії, обличчя батьків чи друзів, відомої картини, літер чи слів тексту тощо. Таким чином, при образному методі оцінювання кількість інформації дорівнює довжині розгорнутого алгоритма (програми), виміряної в бітах, яка розпізнає відображений образ на основі еталонного з урахуванням імовірності правильного розпізнавання цього образу.

Для допитливих. Згідно з цим методом у будь-якому відображеному образі O1 кількість інформації (I) оцінюють за формулою:

I = q-1 L[G(O1, O2)], (8)

де q — ймовірність правильного розпізнавання відображеного кібернетичною системою образу O1 (визначається апостеріорно, за допомогою багаторазових експериментів);

L — функція отримання довжини розгорнутої програми;

G — програма розпізнавання образу, біти;

O2 — еталонний образ кібернетичної системи, на основі якого розпізнають відображений образ O1.

Функція L передбачає розгортання в пам’яті скануючого пристрою всіх команд, які виконала кібернетична система для розпізнавання образу O1, в пряму лінію6. У результаті отримаємо програму-розпізнавач завдовжки Q біт. Тому для простішого оперування у формулі (8) величину L[G(O1,O2)] позначимо просто як Q, тобто приймемо, що L[G(O1,O2)] = Q. Тоді формулу (8) можна скорочено записати як

Io = q-1 Q. (9)

Приклад. Зразком комп’ютерної системи розпізнавання образів можуть служити системи оптичного читання, які перетворюють зображення літер у їх цифрові коди (так, у результаті розпізнавання графічне накреслення кириличної літери Р за міжнародним стандартом ANSI заміняється її цифровим кодом 208). Розпізнавання відображеного кібернетичною системою образу відбувається на основі зразка цього образу (його називають еталонним), який зберігається в пам’яті системи. Наприклад: є злочинець Іваненко, є його відображений образ (фотографія) і є його еталонний образ — фоторобот.

Приклад. Можливі випадки, коли кібернетична система не має еталонних образів, а тому не може розпізнати відповідні відображені образи. Подамо приклад з дитячої літератури: „…Далі в книзі він [Тарзан. — П. З.] знайшов кілька маленьких мавп… Спочатку Тарзан намагався зняти пальцями маленькі фігури зі сторінок, але швидко зрозумів, що вони не справжні… Пароплави, потяги, корови і коні не мали для нього ніякого змісту, вони ковзали повз його увагу і не хвилювали його…”7. У такому випадку, оскільки розпізнавання не відбулося (має місце лише відображення), кількість сприйнятої інформації рівна нулю.

Оскільки цей метод дає змогу оцінювати кількість інформації в образах, то це забезпечує можливість оцінювати кількість семантичної інформації, наприклад, у значеннях слів, зокрема тих, що позначають предмети реального світу.

Порівняльний аналіз методів вимірювання й оцінювання. Якщо порівняти описані вище методи вимірювання кількості інформації й математичні методи оцінювання її кількості, то можна сказати таке:

  • метод вимірювання, що базується на класичній імовірнісній теорії інформації дає змогу виміряти кількість інформації у фактах, повністю абстрагуючись від того, в чому вони полягають;

  • алгоритмічний метод дає змогу оцінити кількість інформації у діях, виконуваних кібернетичною системою;

  • семантичний метод дає змогу оцінити кількість інформації в ланцюжках подій, кожна ланка якого залежить від свого попереднього стану;

  • образний метод оцінювання кількості інформації дає змогу оцінити кількість інформації в образах, зокрема і в значеннях тих слів, що позначають об’єкти реального світу.

Як бачимо, всі ці методи дають змогу говорити про те, що інформація має різні види, для кожного з яких використовують свої методи обчислення її кількості. Крім того, стає зрозумілим, що одного спільного методу вимірювання кількості інформації поки що не створено, а, можливо, його й просто не існує через різноманітність видів самої інформації.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]