
21. Компресованість тексту
Компресованість інформації
Виділяють компресування (ущільнення) інформації та її розширення.
Сутність компресування.
Під час готування й передачі повідомлень часто виникає таке завдання: скомпресувати (ущільнити) інформацію повідомлення так, щоби вона була в меншому, ніж це є, об’ємі носія інформації або щоб її можна було передати за коротший відрізок часу. Зменшення об’ємів веде до розроблення досконаліших носіїв інформації, а зменшення тривалості часу передачі — до вибору оптимальніших способів кодування інформації.
Розрізняють два загальні способи компресування інформації: перший — без втрати інформації (як для знакових, так і для незнакових повідомлень; наприклад під час архівування файлів на комп’ютерних носіях інформації); другий — із втратою частини інформації (наприклад, під час готування повідомлень у ЗМІ для знакових повідомлень залишають тільки цінну інформацію і видаляють інформаційний шум).
Компресування незнакової інформації.
Найширше використовують ті носії й ті канали, які за співвідношенням “кількість інформації в одиниці об’єму / ціна” і “кількість інформації за одиницю часу / ціна” мають оптимальне значення.
Для компресування в комп’ютерах використовують програми-ущільнювачі — архіватори. Залежно від особливостей опрацьовуваної інформації, способу архівування та деяких менш важливих параметрів ці програми можуть ущільнювати інформацію в кілька разів. У наш час типовими і найрозповсюдженішими програмами-архіваторами є ZIP, RAR, ARJ, LHA та деякі ін.
Що стосується подання для реципієнтів тієї самої аудіальної чи візуальної інформації за менший відрізок часу, то тут існують чіткі обмеження — це час, за який людина може сприйняти й розпізнати інформацію. Зменшення часу сприймання може призвести лише до того, що інформацію не сприймуть чи не розпізнають взагалі. Тому такі ущільнення, загалом, неприйнятні.
Компресування знакової (вербальної) інформації.
Розглянемо, як у меншому за обсягом тексті (відносно оригіналу) подати ту саму кількість інформації.
Для знакових повідомлень компресування має конкретизовані формулювання вказаної загальної задачі — подати: (а) повідомлення в меншій, ніж це є, кількості байтів; (б) в меншому за обсягом тексті ту саму кількість інформації; (в) подати той самий текст на меншій площі носія інформації (паперу тощо); (г) подати той самий текст у виданні меншого обсягу; (ґ) подати ту саму аудіальну чи візуальну інформацію за менший відрізок часу; е) видалити з повідомлення інформаційний шум, що, звісно, може призвести до певного зниження ступеня його зрозумілості.
Приклад. Повернемося до репортажу з роману Марка Твена. На першому етапі його текст можна скомпресувати в такий спосіб:
У понеділок, вівторок, середу, четвер, п’ятницю, суботу й неділю король прогулювався верхи в парку.
Таке речення матиме вже 13 одиниць нової контекстної інформації, що може бути явно забагато для реципієнтів низького рівня кваліфікації. Тому на другому етапі це речення можна скомпресувати в такий спосіб:
Увесь тиждень король прогулювався верхи в парку.
У науковій літературі можуть використовувати інші способи компресування, зокрема такі: а) замість довгого вербального тексту ті самі дані подають у вигляді таблиці; б) замість вербального тексту чи таблиці дані подають в аналітичному вигляді — формулою; в) «запаковують» інформацію в спеціальні шаблони (наприклад, інформацію про видання — у шаблон бібліографічного опису).
Для подання того самого за обсягом тексту на меншій площі чи на меншій кількості сторінок використовують інші способи. Так, для ущільнення інформації застосовують шрифти спеціальних гарнітур, які дають змогу зекономити близько 10% площі паперу, а також спеціальні сорти паперу, які мають меншу, ніж звичайно, товщину. Така потреба в компресуванні іноді виникає при виданні однотомних довідників (енциклопедій, словників тощо). Інколи для конкретного видання навіть розробляють спеціальні гарнітури шрифтів і спеціальні сорти паперу, призначені лише для цього видання. Проте такі методи компресування мають свої обмеження: вони можуть бути використані лише для деяких видів літератури (наприклад, довідкової), що розраховані лише на вибіркове, а не наскрізне читання.
Для компресування повідомлень, призначених для передачі ЗМІ, найчастіше використовують скорочення, тобто один із методів виправлення (редагування) тексту. Існують типові алгоритми такого скорочення.
Сутність розширення інформації.
Значно рідше виникає протилежна потреба — розширити наявну кількість інформації. Наприклад, заповнити залишок (30 с чи 1 хв. 15 с) ефірного часу або певну площу сторінки друкованого видання (наприклад, доповнити матеріал двома абзацами чи дев’ятьма рядками).
Алгоритмом розширення інформації для знакового повідомлення може слугувати: — деталізація інформації (додавання нових подробиць до наявного повідомлення — аудіального, відео чи знакового); — збільшення кегля літер, віддалей між літерами чи рядками, збільшення величини абзацного відступу тощо.
Прикладом „злоякісного” розширення незнакової інформації можуть служити програми-віруси, які самокопіюються („розмножуються”) і в такий спосіб заповнують носій інформації, внаслідок чого комп’ютер може вийти з ладу.
Практичне застосування.
● Якщо в повідомленні існує можливість компресувати інформацію без втрати її кількості, то її компресують незалежно від виду літератури, використовуючи найнижчий ступінь компресування.
● У довідковій, інформаційній і рекламній літературі інформацію подають лише в скомпресованому вигляді з найвищим ступенем компресування.
● У публіцистичній літературі інформацію треба подавати з середнім ступенем компресування.
● Ступінь скомпресованості повинен бути таким, щоби не блокувати і не сповільнювати сприйняття реципієнтською аудиторією поданої інформації.
Якщо компресування інформації унеможливлює її сприйняття, ступінь компресування слід зменшити.
● У ЗМІ розширення інформації слід уникат