
- •Номінативна інформація 64
- •Номінативна інформація 73
- •Від автора
- •1. Вступ
- •2. Інформація та її теорії
- •2.1. Імовірнісна теорія інформації
- •2.2. Алгоритмічна теорія інформації
- •2.3. Семантична теорія інформації
- •3. Образи та інформація в кібернетичних системах
- •3.1. Кібернетичні системи
- •3.2. Образи та їх види
- •3.3. Інформація як образ
- •3.5. Види інформації
- •3.4. Одиниці вимірювання кількості інформації
- •4. Інформаційна структура повідомлення
- •4.1. Загальна структура повідомлення
- •4.2. Структура знакового (вербального) повідомлення
- •4.2.1. Інформаційні одиниці й рівні
- •4.2.2. Структура номена
- •4.2.3. Структура сентенції
- •4.2.4. Структура сюжету
- •4.3. Структура незнакового повідомлення
- •5. Вимірювання кількості інформації
- •5.1. Принципи вимірювання
- •5.2. Загальна методика вимірювання
- •5.3. Вимірювання кількості інформації у знакових (вербальних) повідомленнях
- •5.3.1. Номінативна інформація
- •5.3.2. Сентенційна інформація
- •5.3.3. Сюжетна інформація
- •5.3.4. Повна кількість інформації
- •5.4.1. Методика вимірювання
- •5.4.2. Типові програми розпізнавання
- •5.4.3. Надлишкова інформація
- •5.5. Ескпериментальна перевірка методу вимірювання
- •5.7. Ентропія повідомлення
- •5.8. Наслідки
- •5.9. Практичне застосування
- •6.2. Оцінювання кількості знакової (вербальної) інформації
- •6.2.1. Номінативна інформація
- •6.2.2. Сентенційна інформація
- •6.2.3. Сюжетна інформація
- •6.3. Оцінювання кількості незнакової інформації
- •7.1. Поняття новизни інформації
- •7.2. Інструменти оцінювання новизни інформації
- •7.3. Види нової інформації
- •7.4.2. Сентенційна інформація
- •7.4.3. Контекстна інформація
- •7.4.4. Реципієнтська інформація
- •7.4.5. Суспільна інформація
- •7.5. Оцінювання новизни незнакової інформації
- •7.6. Практичне застосування
- •8.1. Реальна, нереальна й невизначена інформація
- •8.2. Псевдоінформація, параінформація та метаінформація1
- •9.1. Поняття цінності інформації
- •9.4. Інформаційний шум
- •9.5. Практичне застосування
- •10.1. Сутність компресування
- •10.3. Компресування знакової (вербальної) інформації
- •10.5. Ступінь компресування інформації
- •10.4. Компресування незнакової інформації
- •10.6. Практичне застосування
- •12. Висновки
5.3. Вимірювання кількості інформації у знакових (вербальних) повідомленнях
5.3.1. Номінативна інформація
Вимірювання кількості кодової інформації. Перенумеруємо всі сентенції повідомлення М від першої до останньої та позначимо їх через S, деу = 1,2, 3 ... т. У межах кожної сентенції перенумеруємо всі номени від першого до останнього й позначимо їх через ЖІ,, де і = 1,2,3 ... п. Тоді кількість кодової інформації (7^.) в г’-му номеніу’-ї сентенції (Ж) повідомлення М становить:
IKfl=f’flQfl-‘ (12)
Таким чином, для визначення кількості кодової інформації для будь-якого номена слід взяти, наприклад, із системи оптичного читання дані про довжину розгорнутої програми розпізнавання, дані про ймовірність правильного розпізнавання, підставити їх у формулу (12) й виконати зазначені дії.
Вимірювання кількості значеннєвої інформації. Так само, як може бути виміряна кількість інформації у кодовому образі номена, може бути виміряна й кількість інформації в його значенні, тобто еталонному образі (ІЕ). Для цього слід дати розпізнати цей еталонний образ тій самій кібернетичній системі, а далі скористатися формулою (12), тобто:
V»'^ (13)
де й..— імовірність правильного розпізнавання еталонного образу номена Ж про-грамою-розпізнавачем, a U.. — довжина розгорнутої програми-розпізнавача, що розпізнає еталонний образ, який входить у склад номена AL
У словнику значеннєва інформація (еталонні образи) складає основну частину інформації будь-якого слова, оскільки інформація, наявна у відображених образах, в словнику відсутня (див. рис. 1).
Вимірювання кількості відображеної інформації. За аналогією до (12) встановимо, що кількість відображеної інформації (IR..) в г’-му номеніу’-ї сентенції буде дорівнювати:
r’..Z.., якщо повідомлення описує реальний світ;
О, якщо повідомлення описує нереальні світи,
де z.. — імовірність правильного розпізнавання відображеного образу фрагмента світу програмою-розпізнавачем, a Z..—довжина розгорнутої програми-розпізна-вача, що розпізнає відображений образ фрагмента світу, позначений номеном N...
Оскільки для випадку, коли повідомлення описує нереальний світ, кількість відображеної інформації в його номенах не визначають (вона рівна 0), то далі говоритимемо лише про номени, що описують реальний світ.
Розглянемо особливості застосування цієї формули стосовно конкрет-них_слів, збірних_слів та абстрактних_ слів.
Для визначення кількості інформації у конкретному_слові достатньо використовувати лише наведену вище формулу (12): сканером відповідного типу слід просканувати й на основі наявних еталонів із заданою ймовірністю розпізнати образ цього фрагмента світу, а далі підставити у формулу (12) два параметри (довжину в бітах розгорнутої в пам’яті послідовності команд та ймовірність розпізнавання потрібного фрагмента) й виконати над ними вказані математичні дії.
Визначити кількість інформації в конкретних номенах, що позначають стани (прикметниках), доволі просто (наприклад, для назв кольорів). Складнішою є проблема визначення кількості інформації в номенах, що позначають процеси (дієсловах). У зв’язку з цим можемо лише зауважити, що тут суттєву роль відіграватимуть валентності дієслів (детальніший виклад цього питання виходить за межі роботи).
Для визначення кількості інформації в номенах, що позначають квантори (світ, місце, час, кількість тощо), сканер повинен розпізнати образи слів, зображених у вигляді дескрипторів, тобто описувачів значень кванторів, зафіксованих на одномірних шкалах (дискретних або недискретних; рівномірних чи логарифмічних) або в дво-, три- чи и-мірних системах координат. Найпростішим прикладом шкали номенів можуть служити дескриптори (прийменники та прислівники), що позначають просторові відношення (над, під, зліва, справа, збоку, біля тощо) або час (до, після, потім, одночасно тощо).
Оскільки збірні_слова позначають спільні ознаки конкретних_слів, то висунемо гіпотезу щодо наявної в них кількості інформації.
Гіпотеза 1. Кількість інформації в збірному_слові дорівнює сумі довжин розгорнутих програм, які потрібні для розпізнавання відображених образів усіх позначених цим збірним_словом конкретних_слів, поділена на кількість цих конкрет-них_слів (К), піднесену до степеня b (b > I)1, тобто:
A=l
де А — порядковий номер конкретного_слова, яке відносять до складу збірного_сло-
Це означає, що чим загальніше слово, тим менше в ньому відображеної інформації. Наприклад, кількість інформації в номені фрукт більша, ніж кількість інформації у номені предмет, а в номені фрукт — менша, ніж у номені яблуко.
Ще складнішим є спосіб визначення кількості інформації в абстракт-них_словах. Тут доводиться враховувати, що відображеними образами абстракт-них_слів є лише їх означення в тлумачних словниках.
Гіпотеза 2. Кількість інформації в абстрактних_словах дорівнює довжині програми, що розпізнає його означення в тлумачному словнику, помноженій на ймовірність правильного розпізнавання та кількість асоціативних зв’язків1 (К) цього означення в степені2 b (b > 1):
V«W> (І6)
де P.. — довжина розгорнутої програма, що виконує, наприклад, такі операції:
шукає слово в тлумачному словнику;
опрацьовує означення слова (наприклад, проводить його лінгвістичний аналіз — морфологічний, синтаксичний, семантичний, стилістичний тощо);
визначає кількість асоціативних зв ‘язків (&) між самостійними словами в означенні цього абстрактного_слова та іншими словами цього ж тлумач ного словника; при цьому повинна бути встановлена „глибина” пошуку асоціативних зв’язків.
Як бачимо, чим з більшою кількістю інших номенів семантичне пов’язаний цей номен, тим більшою є кількість наявної в ньому відображеної інформації.
множинності номена І, якщо нема суперечностей, присвоїти Індикатору множинності отримане значення.
Коли номен описує нереальний світ, інформацію про множинність для значення слід брати з кодового образу номена (на підставі його морфологічного аналізу).
Визначення сумарної кількості номінативної інформації. Загальна кількість номінативної інформації в номені становитиме:
(17)
/„ =/„ +L + L =сг’ Q +и~’ U. +z-‘ Z,
Nji Kji Eji Rji „ ji *~-fi ji ji ji jr>
Визначення кількості номінативної інформації для „надщерблених” та комплексних образів. Щодо відображених „надщерблених” образів (пів ‘яблука), то для визначення в них кількості інформації слід підрахувати довжину програми в кібернетичній системі, яка виконує дві відносно незалежні дії: по-перше, розпізнає, що це образ саме цього фрагмента світу — саме яблука (перший образ), а, по-друге, розпізнає, що це лише частина фрагмента світу — половина яблука (другий образ).
Гіпотеза 3. Кількість відображеної інформації в номенах, що позначають „надщерблені” образи, дорівнює сумі кількостей інформації у двох простих образах, що входять у складний.
Розглядаючи комплексні образи, бачимо, що яблуко має не лише певну візуальну форму (про неї йшла мова вище), ай—для людини, наприклад, — певний смаковий, тактильний та нюховий образи (аудіальний образ — відсутній).
Гіпотеза 4. Кількість відображеної інформації в номенах, що позначають комплексні образи, дорівнює сумі кількостей відображеної інформації простих образів, що належить до складу комплексного.