Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
БОГУШ,ЮДИН.doc
Скачиваний:
1486
Добавлен:
19.02.2016
Размер:
3.5 Mб
Скачать

6.1.3 Міри інформації

Класифікація мір

Для вимірювання інформації вводяться два параметри: кіль­кість інформації і об'єм даних VD.

Ці параметри мають різні вирази й інтерпретацію залежно від форми адекватності. Кожній формі адекватності відповідає своя мі­ра кількості інформації і об'єм даних (рис. 6.2).

Синтаксична міра інформації

Ця міра кількості інформації оперує із знеособленою інформаці­єю, яка не виражає смислового відношення до об'єкта.

202

Розділ 6 Інформаційні системи та технології як об'єкти безпеки

Рис. 6.2.Міри інформації

Об’єм даних VD у повідомленні вимірюється кількістю символів (розрядів) у цьому повідомленні. У різних системах числення один розряд має різну вагу й відповідно міняється одиниця вимірювання даних:

• у двійковій системі числення [binary notation, binary system] одиниця вимірювання — біт (bit — binary digit — двійковий роз-

ряд);

• у десятковій системі числення [decimal notation, decimal numeration system] одиниця вимірювання — діт [dit] (десятковий

203

Частина II Основи безпеки інформаційних технологій

розряд).

Кількість інформації [amount of information, information content] І на синтаксичному рівні неможливо визначити без розгля­ду поняття невизначеності стану системи (ентропії системи). Дійсно, одержання інформації про будь-яку систему завжди зв'язане зі змі­ною ступеня необізнаності одержувача про стан цієї системи. Роз­глянемо це поняття.

Нехай до одержання інформації одержувач має деякі попередні (апріорні) відомості про систему а. Мірою його необізнаності є фун­кція Η(α), яка в цей же час служить і мірою невизначеності стану системи.

Після одержання деякого повідомлення β одержувач здобув де­яку додаткову інформацію Іβ(α), що зменшила його апріорну нео­бізнаність так, що апостеріорна (після одержання повідомлення β невизначеність системи стала Ηβ(α).

Тоді кількість інформації Іβ(α) про систему, одержаної в пові­домленні β, визначається так

,

тобто кількість інформації вимірюється зміною (зменшенням) неви­значеності стану системи.

Якщо кінцева невизначеність Ηβ(α) стане рівною нулю, то пер­винне неповне знання заміниться повним знанням і кількість інфор­мації Ιβ) = Η(α). Іншими словами, ентропія системи Η(α) може розглядатися як міра відсутньої інформації.

Ентропія системи Η(α), що має N можливих станів, відповідно до формули Шенона, дорівнює

.

де Рі — ймовірність того, що система знаходиться в i-му стані.

Для випадку, коли всі стани системи рівноймовірні, тобто їхні ймовірності рівні Рі = 1/N, її ентропія визначається співвідношенням

.

Часто інформація кодується числовими кодами в цій чи іншій си­стемі числення, особливо це актуально при представленні інформації

204

Розділ 6 Інформаційні системи та технології як об'єкти безпеки

вкомп'ютері. Природно, що одна й та ж кількість розрядів у різнихсистемах числення може передавати різне число станів відображу­ваного об'єкта, що можна представити у вигляді співвідношення

,

де N — число можливих відображуваних станів;

m — основа системи числення (різноманіття символів, що засто­совується в алфавіті;

n — число розрядів (символів) в повідомлення.

Найбільш часто використовуються двійкові й десяткові логари­фми. Одиницями вимірювання будуть відповідно біт і діт.

Коефіцієнт (ступінь) інформативності (лаконічність) повідомле­ння визначається відношенням кількості інформації до об'єму даних, тобто

,

причому 0 < Υ < 1.

Із збільшенням Υ зменшуються об'єми роботи з перетворення ін­формації (даних) в системі. Тому прагнуть до підвищення інформа­тивності, для чого розробляються спеціальні методи оптимального кодування інформації.

Семантична міра інформації

Для вимірювання смислового змісту інформації, тобто її кілько­сті на семантичному рівні, найбільше визнання одержала тезаурусна міра, яка зв'язує семантичні властивості інформації зі здатністю ко­ристувача сприймати повідомлення, що надійшли. Для цього вико­ристовується поняття тезаурус користувача.

Тезаурус [thesaurus] — це сукупність відомостей, якими володіє користувач або система.

Залежно від співвідношення між смисловим змістом інформації S і тезаурусом користувача Sp змінюється кількість семантичної ін­формації Іс, що сприймається користувачем і включається ним у подальшому у свій тезаурус.

Характер такої залежності показаний на рис. 6.3 .

Розглянемо два граничних випадки, коли кількість семантичної інформації Іс дорівнює нулю:

205

Частина II Основи безпеки інформаційних технологій

Рис. 6.3.Залежність кількості семантичної інформації, що сприйма­ється споживачем, від його тезаурусу

  • при Sp ≈ 0 користувач не сприймає, не розуміє інформації, що надійшла;

  • при Sp →∞ користувач усе знає й інформація, що надійшла, йому не потрібна.

Максимальна кількість семантичної інформації Іс користувач здобуває при узгодження її смислового змісту S зі своїм тезауру­сом Sp (Sp = Sp opt), коли інформація, що надходить є зрозумілою користувачеві й несе йому раніше невідомі (відсутні у його тезаурусі) відомості.

Таким чином, кількість семантичної інформації в повідомлення, кількість нових знань, одержаних користувачем, є величиною від­носною. Одне й те ж повідомлення може мати смисловий зміст для компетентного користувача й бути безглуздим (семантичний шум) для користувача некомпетентного.

При оцінюванні семантичного (змістовного) аспекту інформації необхідно прагнути до узгодження величин S і Sp.

Відносною мірою кількості семантичної інформації може правити коефіцієнт змістовності С, який визначається як відношення кілько­сті семантичної інформації до її об'єму:

.

206

Розділ 6 Інформаційні системи та технології як об'єкти безпеки

Прагматична міра інформації

Ця міра визначає корисність інформації (цінність) для досягнен­ня користувачем поставленої мети. Ця міра також відносна, зумов­лена особливостями використання цієї інформації в цій чи іншій си­стемі. Цінність інформації доцільно вимірювати в тих же самих оди­ницях (або близьких до них), в яких вимірюється цільова функція.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]