
- •Номінативна інформація 64
- •Номінативна інформація 73
- •Від автора
- •1. Вступ
- •2. Інформація та її теорії
- •2.1. Імовірнісна теорія інформації
- •2.2. Алгоритмічна теорія інформації
- •2.3. Семантична теорія інформації
- •3. Образи та інформація в кібернетичних системах
- •3.1. Кібернетичні системи
- •3.2. Образи та їх види
- •3.3. Інформація як образ
- •3.5. Види інформації
- •3.4. Одиниці вимірювання кількості інформації
- •4. Інформаційна структура повідомлення
- •4.1. Загальна структура повідомлення
- •4.2. Структура знакового (вербального) повідомлення
- •4.2.1. Інформаційні одиниці й рівні
- •4.2.2. Структура номена
- •4.2.3. Структура сентенції
- •4.2.4. Структура сюжету
- •4.3. Структура незнакового повідомлення
- •5. Вимірювання кількості інформації
- •5.1. Принципи вимірювання
- •5.2. Загальна методика вимірювання
- •5.3. Вимірювання кількості інформації у знакових (вербальних) повідомленнях
- •5.3.1. Номінативна інформація
- •5.3.2. Сентенційна інформація
- •5.3.3. Сюжетна інформація
- •5.3.4. Повна кількість інформації
- •5.4.1. Методика вимірювання
- •5.4.2. Типові програми розпізнавання
- •5.4.3. Надлишкова інформація
- •5.5. Ескпериментальна перевірка методу вимірювання
- •5.7. Ентропія повідомлення
- •5.8. Наслідки
- •5.9. Практичне застосування
- •6.2. Оцінювання кількості знакової (вербальної) інформації
- •6.2.1. Номінативна інформація
- •6.2.2. Сентенційна інформація
- •6.2.3. Сюжетна інформація
- •6.3. Оцінювання кількості незнакової інформації
- •7.1. Поняття новизни інформації
- •7.2. Інструменти оцінювання новизни інформації
- •7.3. Види нової інформації
- •7.4.2. Сентенційна інформація
- •7.4.3. Контекстна інформація
- •7.4.4. Реципієнтська інформація
- •7.4.5. Суспільна інформація
- •7.5. Оцінювання новизни незнакової інформації
- •7.6. Практичне застосування
- •8.1. Реальна, нереальна й невизначена інформація
- •8.2. Псевдоінформація, параінформація та метаінформація1
- •9.1. Поняття цінності інформації
- •9.4. Інформаційний шум
- •9.5. Практичне застосування
- •10.1. Сутність компресування
- •10.3. Компресування знакової (вербальної) інформації
- •10.5. Ступінь компресування інформації
- •10.4. Компресування незнакової інформації
- •10.6. Практичне застосування
- •12. Висновки
5.3.2. Сентенційна інформація
Кількість сентенційної інформації (/s,.) визначається на основі довжини розгорнутої програми, потрібної для розпізнавання орієнтованого графа синтаксичної будови (див. рис. 2) сентенціїS, тобто графа синтаксичних залежностей між номенами:
Коли повідомлення описує реальний світ, програми розпізнавання, які розпізнають відображені образи, повинні розпізнавати також множинність3 фрагмента світу (один чи більше одного), зіставити це з можливими значеннями індикатора
1 Два слова вважають асоціативне зв’язаними, якщо вони мають в своїх означеннях одне й те ж повнозначне слово або одне з них є в означенні іншого. Таким чином, кількість асоціативних зв’язків може бути рівною 0, 1, 2 ....
2 Питання про конкретне значення степеня b залишаємо за межами цієї роботи. Як ілю страцію можна прийняти b = 1.
3 У мовознавстві цю граматичну категорію, як відомо, називають „числом”.
(18)
L,=b-‘ В,
S] 1 f
де b— імовірність правильного розпізнавання кібернетичною системою синтаксичної структури сентенції S; В — довжина розгонутої програми-розпізнавача синтаксичної структури сентенції S, яку використала кібернетична система.
Повна кількість інформації в сентенції S (/s.), що враховує кількість як номінативної, так і сентенційної інформації, становитиме:
(19)
40
41
5.3.3. Сюжетна інформація
Сюжетну інформацію можна означити як таку, що закладена на границях між сентенціями.
Кількість сюжетної інформації для кожної пари сусідніх сентенційу тау+7 (/м,) будемо визначати на основі довжини програми, потрібної для розпізнавання їх границі та виявлення наявності й виду номенів-сполучників, що їх з’єднують. Таким чином:
(20)
/„, =d~> D,
M’j j f
де d — імовірність правильного розпізнавання програмою-розпізнавачем границь сентенційу тау+7 і номенів-сполучників, які з’єднують їх; D—довжина розгорнутої програми-розпізнавача, яку використала кібернетична система для розпізнавання границь сентенцій у’ тау+7 і розташованих на цій границі номенів-сполучників.
Кількість повідомленнєвої інформації для всіх пар сентенцій цілого повідомлення становитиме: і=т і=т
/„ = £/„, =£«;•*>„
Тут враховуємо, що після сентенці’ї/ програма-розпізнавач повинна виявити останній сполучник, що вказує на кінець повідомлення.
5.3.4. Повна кількість інформації
Повна кількість інформації в повідомленні М, що враховує номінативну, сентенційну та сюжетну інформації, становитиме:
(22)
42
5.4. Вимірювання кількості інформації в незнакових повідомленнях
5.4.1. Методика вимірювання
Незнакова інформація (наприклад, передача каналами телевізійного зв’язку зображення будь-якого фрагмента дійсності, припустімо, оцифрованого зображення — ілюстрації—того ж яблука) відрізняється від вербальної тим, що не містить значеннєвої, відображеної, сентенційної та сюжетної інформації. Вона несе лише кодову інформацію, тобто є кодом самої себе і нічим більше.
Враховуючи сказане, для вимірювання кількості інформації (7) в будь-якому невербальному повідомленні М згідно з методикою розділу 5.2 слід застосовувати формулу:
I=q-‘Q, (23)
де q — імовірність правильного розпізнавання коду повідомлення програмою-розпізнавачем, a Q — довжина розгорнутої програми-розпізнавача, що розпізнає повідомленням, у бітах.
Таким чином, для вимірювання кількості інформації в невербальному повідомленні слід:
запам’ятати передане повідомлення;
створити програму його розпізнавання;
розпізнати отримане повідомлення за допомогою розробленої програми;
визначити довжину розгорнутої програми розпізнавання Q;
визначити ймовірність q правильного розпізнавання повідомлення;
на основі отриманих величин </ і 6 за формулою (23) підрахувати кількість інформації в отриманому невербальному повідомленні.
Кількість інформації в незнаковому повідомленні, виміряна за такою методикою, буде в кілька разів більша, ніж довжина самого повідомлення, виміряна в бітах чи байтах. Цей результат показує, що таке повідомлення несе ще й параінфор-мацію (див. про неї розділ 8.2). Так, передана на екран телевізора чи комп’ютера фотографія людини це не лише певна послідовність бітів, перетворених на екрані в піксели різного кольору, а й інформація про стать людини, її вік, колір очей, волосся, риси обличчя, одяг і т. д.
Тут може виникнути запитання: чи коректно говорити про вимірювання кількості інформації в ілюстрації, коли в різних форматах вона займає різну кількість байт? Відповідаючи на це запитання, не слід забувати, що будь-який формат—це спосіб компресування інформації (її формат). Що ж до самої кількості інформації, то в ілюстрації вона залежить лише від роздільної здатності скануючого пристрою
43
і в цих межах завжди є константною. Таку інформацію зберігають у файлах, що зараз для ілюстрацій мають тип BMP. Аналогічні міркування стосуються й інших видів інформації (звукової, відео тощо).