
- •Номінативна інформація 64
- •Номінативна інформація 73
- •Від автора
- •1. Вступ
- •2. Інформація та її теорії
- •2.1. Імовірнісна теорія інформації
- •2.2. Алгоритмічна теорія інформації
- •2.3. Семантична теорія інформації
- •3. Образи та інформація в кібернетичних системах
- •3.1. Кібернетичні системи
- •3.2. Образи та їх види
- •3.3. Інформація як образ
- •3.5. Види інформації
- •3.4. Одиниці вимірювання кількості інформації
- •4. Інформаційна структура повідомлення
- •4.1. Загальна структура повідомлення
- •4.2. Структура знакового (вербального) повідомлення
- •4.2.1. Інформаційні одиниці й рівні
- •4.2.2. Структура номена
- •4.2.3. Структура сентенції
- •4.2.4. Структура сюжету
- •4.3. Структура незнакового повідомлення
- •5. Вимірювання кількості інформації
- •5.1. Принципи вимірювання
- •5.2. Загальна методика вимірювання
- •5.3. Вимірювання кількості інформації у знакових (вербальних) повідомленнях
- •5.3.1. Номінативна інформація
- •5.3.2. Сентенційна інформація
- •5.3.3. Сюжетна інформація
- •5.3.4. Повна кількість інформації
- •5.4.1. Методика вимірювання
- •5.4.2. Типові програми розпізнавання
- •5.4.3. Надлишкова інформація
- •5.5. Ескпериментальна перевірка методу вимірювання
- •5.7. Ентропія повідомлення
- •5.8. Наслідки
- •5.9. Практичне застосування
- •6.2. Оцінювання кількості знакової (вербальної) інформації
- •6.2.1. Номінативна інформація
- •6.2.2. Сентенційна інформація
- •6.2.3. Сюжетна інформація
- •6.3. Оцінювання кількості незнакової інформації
- •7.1. Поняття новизни інформації
- •7.2. Інструменти оцінювання новизни інформації
- •7.3. Види нової інформації
- •7.4.2. Сентенційна інформація
- •7.4.3. Контекстна інформація
- •7.4.4. Реципієнтська інформація
- •7.4.5. Суспільна інформація
- •7.5. Оцінювання новизни незнакової інформації
- •7.6. Практичне застосування
- •8.1. Реальна, нереальна й невизначена інформація
- •8.2. Псевдоінформація, параінформація та метаінформація1
- •9.1. Поняття цінності інформації
- •9.4. Інформаційний шум
- •9.5. Практичне застосування
- •10.1. Сутність компресування
- •10.3. Компресування знакової (вербальної) інформації
- •10.5. Ступінь компресування інформації
- •10.4. Компресування незнакової інформації
- •10.6. Практичне застосування
- •12. Висновки
10.3. Компресування знакової (вербальної) інформації
Розглянемо, як у меншому за обсягом тексті (відносно оригіналу) подати ту саму кількість інформації.
Приклад. Повернемося до репортажу з роману Марка Твена (див. розділ 7.4.3). На першому етапі його текст можна скомпресувати в такий спосіб:
У понеділок, вівторок, середу, четвер, п’ятницю, суботу й неділю
король прогулювався верхи в парку.
Таке речення матиме вже 13 одиниць нової контекстної інформації, що може бути явно забагато для реципієнтів низького рівня кваліфікації. Тому на другому етапі це речення можна скомпресувати в такий спосіб:
Увесь тиждень король прогулювався верхи в парку.
Тут кількість нової контекстної інформації залишилася такою ж, як у тексті оригіналу (7), проте з’явилися два нових слова: увесь і тиждень. При цьому зросла кількість кванторної інформації (з’явився квантор кількості увесь), а кількість семантичної інформації в одному зі слів зменшилася (у слові тиждень), оскільки воно є збірною назвою (позначає сім об’єктів — сім днів тижня).
1 Тут під публіцистичною анотацією розуміємо те, що в англомовній літературі позначають терміном „lead”. Іноді цей термін у такому вигляді використовують і в україномовній літературі (лід). На нашу думку, за усталеною традицією для позначення цього поняття краще використовувати слово „анотація”. 91
У науковій літературі використовують інші способи компресування, зокрема
такі:
а) замість довгого вербального тексту ті самі дані подають у вигляді таблиці;
б) замість вербального тексту чи таблиці дані подають в аналітичному вигляді — формулою;
в) «запаковують» інформацію в спеціальні шаблони (наприклад, інформацію про видання — у шаблон бібліографічного опису).
Для подання того самого за обсягом тексту на меншій площі чи на меншій кількості сторінок використовують інші способи. Так, для ущільнення інформації застосовують шрифти спеціальних гарнітур, економлячи таким чином близько 10% площі паперу, а також вживаючи спеціальні сорти паперу, які мають меншу, ніж звичайно, товщину. Така потреба в компресуванні іноді виникає при виданні однотомних довідників (енциклопедій, словників тощо). Інколи для конкретного видання навіть розробляють спеціальні гарнітури шрифтів і спеціальні сорти паперу, призначені лише для цього видання. Проте такі методи компресування мають свої обмеження: вони можуть бути використані лише для деяких видів літератури (наприклад, довідкової), розрахованих лише на вибіркове, а не наскрізне читання.
10.5. Ступінь компресування інформації
Для оцінки ущільненості використовують такий критерій як ступінь компресування інформації(С). Його можна вираховувати як відношення значення вибраного показника (кількості знаків, площі, об’єму, часу, пам’яті) після компресування до значення того самого показника перед компресуванням, тобто
(34)
r = P;/P2-100%,
де pj — значення показника до компресування, а Р2 — значення показника після компресування.
Приклад. Подана вище цитата з роману Марка Твена (див. розділ 7.4.3) має обсяг 308 знаків (із врахуванням пробілів і розділових знаків). Скомпресована інформація (У понеділок, вівторок, середу, четвер, п’ятницю, суботу й неділю король прогулювався верхи в парку.) містить 99 знаків, а ще більше скомпресована (Увесь тиждень король прогулювався верхи в парку.) — 48 знаків. Таким чином, для першого варіанта С = 308 / 99 = 311 %, а для другого С = 308 / 48 = 642%.