Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
tmi ekzamen.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
259.35 Кб
Скачать

45. Компресування знакової (вербальної) інформації та незнакової інформації. Ступінь компресованості інформації.

Компресування знакової (вербальної) інформації

Розглянемо, як у меншому за обсягом тексті (відносно оригіналу) подати ту саму кількість інформації.

Для знакових повідомлень компресування має конкретизовані формулювання вказаної загальної задачі — подати: (а) повідомлення в меншій, ніж це є, кількості байтів; (б) в меншому за обсягом тексті ту саму кількість інформації; (в) подати той самий текст на меншій площі носія інформації (паперу тощо); (г) подати той самий текст у виданні меншого обсягу; (ґ) подати ту саму аудіальну чи візуальну інформацію за менший відрізок часу; е) видалити з повідомлення інформаційний шум, що, звісно, може призвести до певного зниження ступеня його зрозумілості.

Приклад. Повернемося до репортажу з роману Марка Твена. На першому етапі його текст можна скомпресувати в такий спосіб:

У понеділок, вівторок, середу, четвер, п’ятницю, суботу й неділю король прогулювався верхи в парку.

Таке речення матиме вже 13 одиниць нової контекстної інформації, що може бути явно забагато для реципієнтів низького рівня кваліфікації. Тому на другому етапі це речення можна скомпресувати в такий спосіб:

Увесь тиждень король прогулювався верхи в парку.

У науковій літературі можуть використовувати інші способи компресування, зокрема такі: а) замість довгого вербального тексту ті самі дані подають у вигляді таблиці; б) замість вербального тексту чи таблиці дані подають в аналітичному вигляді — формулою; в) «запаковують» інформацію в спеціальні шаблони (наприклад, інформацію про видання — у шаблон бібліографічного опису).

Для подання того самого за обсягом тексту на меншій площі чи на меншій кількості сторінок використовують інші способи. Так, для ущільнення інформації застосовують шрифти спеціальних гарнітур, які дають змогу зекономити близько 10% площі паперу, а також спеціальні сорти паперу, які мають меншу, ніж звичайно, товщину. Така потреба в компресуванні іноді виникає при виданні однотомних довідників (енциклопедій, словників тощо). Інколи для конкретного видання навіть розробляють спеціальні гарнітури шрифтів і спеціальні сорти паперу, призначені лише для цього видання. Проте такі методи компресування мають свої обмеження: вони можуть бути використані лише для деяких видів літератури (наприклад, довідкової), що розраховані лише на вибіркове, а не наскрізне читання.

Компресування — це також і анотування, і реферування інформації. Існують комп’ютерні системи реферування. Іноді такі системи реферування включають у вигляді функцій в склад текстових процесорів (наприклад, у Microsoft Word це Сервис / Автореферат…).

Для компресування повідомлень, призначених для передачі ЗМІ, найчастіше використовують скорочення, тобто один із методів виправлення (редагування) тексту. Існують типові алгоритми такого скорочення.

Скорочення найефективніше виконувати в такий спосіб:

— визначити рівень, на якому слід провести скорочення (наприклад, на рівні слів, речень чи надфразових єдностей —абзаців);

— вибрати шкалу для експертних оцінок (наприклад, шкалу з трьох оцінок: 1, 2 і 3);

— біля всіх компонентів визначеного рівня поставити експертні оцінки, що вказують на ступінь відповідності компонента основній темі чи меті повідомлення (наприклад, найвища оцінка “3” відповідає найбільшій відповідності, а найменша “1” — найменшій);

— видалити з повідомлення компоненти, оцінки яких свідчать про те, що вони найменше стосуються основної теми чи мети повідомлення.

Компресування незнакової інформації.

Найширше використовують ті носії й ті канали, які за співвідношенням “кількість інформації в одиниці об’єму / ціна” і “кількість інформації за одиницю часу / ціна” мають оптимальне значення.

Для компресування в комп’ютерах використовують програми-ущільнювачі — архіватори. Залежно від особливостей опрацьовуваної інформації, способу архівування та деяких менш важливих параметрів ці програми можуть ущільнювати інформацію в кілька разів. У наш час типовими і найрозповсюдженішими програмами-архіваторами є ZIP, RAR, ARJ, LHA та деякі ін.

Що стосується подання для реципієнтів тієї самої аудіальної чи візуальної інформації за менший відрізок часу, то тут існують чіткі обмеження — це час, за який людина може сприйняти й розпізнати інформацію. Зменшення часу сприймання може призвести лише до того, що інформацію не сприймуть чи не розпізнають взагалі. Тому такі ущільнення, загалом, неприйнятні.

Визначення ступеня компресування інформації.

Для оцінки ущільненості використовують такий критерій як ступінь компресування інформації (C). Його можна вираховувати як відношення значення вибраного показника (кількості знаків, площі, об’єму, часу, пам’яті) перед компресування до значення того самого показника після компресування, тобто.

C = P1 / P2 • 100%, (34)

де P1 — значення показника до компресування, а P2 — значення показника після компресування.

Приклад. Подана вище цитата з роману Марка Твена (див. вище) має обсяг 308 знаків (із врахуванням пробілів і розділових знаків). Скомпресована інформація (У понеділок, вівторок, середу, четвер, п’ятницю, суботу й неділю король прогулювався верхи в парку.) містить 99 знаків, а ще більше скомпресована (Увесь тиждень король прогулювався верхи в парку.) — 48 знаків. Таким чином, для першого варіанта C = 308 / 99 = 311%, а для другого C = 308 / 48 = 642%.

Ступінь розширення інформації можна розраховувати за іншою формулою:

U = P1 / P2 • 100%, (34)

де U1 — значення показника після розширення, а U2 — значення показника перед розширенням.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]