
Лабораторна робота № 3
ТЕМА: „Дослідження процесу стиснення різнотипної інформації”
Мета роботи:
вивчити особливості роботи з архіватором WinRAR;
навчитися проводити архівацію даних для створення різних типів архівів;
навчитися проводити розархівацію даних;
навчитися проводити тестування архівів з метою виявлення у них помилок;
навчитися оцінювати коефіцієнт можливого стиснення файлів.
Теоретичні відомості
Стиснення даних – це процедура перекодування даних з метою зменшення їх об’єму (розміру). Вона застосовується для раціональнішого використання пристроїв зберігання та передавання даних.
Стиснення буває без втрат (коли можливе відновлення початкових даних без спотворень) або з втратами (відновлення можливе із спотвореннями, неістот-ними з точки зору подальшого використання відновлених даних). Стиснення без втрат зазвичай використовується при обробці комп’ютерних програм і даних, рідше – для зменшення об’єму звукової, фото- та відеоінформації. Стиснення із втратами застосовується при зменшенні об’єму звукової, фото- та відеоінформації і воно значно ефективніше від стиснення без втрат.
Принцип стиснення даних базується на усуненні надлишковості інформації, що міститься у початкових даних. Прикладом надлишковості є повторення у тексті фрагментів (наприклад, слів натуральної або машинної мов). Подібна надлишковість зазвичай усувається заміною послідовності, що повторюється, коротшим значенням (кодом). Інший вид надлишковості пов’язаний із тим, що деякі значення в даних, що стискаються, зустрічаються частіше від інших, при цьому можливо замінювати дані, що часто зустрічаються, коротшими кодами, а рідкісні дані – довшими (імовірнісне стиснення). Стиснення даних, що не володіють властивістю надлишковості (наприклад, випадковий сигнал або шум), неможливе без втрат. Також, зазвичай неможливе стиснення зашифрованої інформації.
Стиснення даних із втратами – це метод стиснення даних, коли розпа-кований файл відрізняється від оригінального, але «достатньо близький» до нього. Цей тип компресії часто використовується в Інтернеті, особливо в потоковій передачі звукової, фото- та відеоінформації.
Стиснення із втратами проти стиснення без втрат
Перевага методів стиснення із втратами над методами стиснення без втрат полягає в тому, що перші істотно перевищують по ступеню стиску другі, задовольняючи при цьому певним поставленим вимогам.
Методи стиснення із втратами часто використовуються для стиснення звуку або зображення. У таких випадках розпакований файл може дуже сильно відрізнятися від оригіналу на рівні порівняння «біт в біт», але практично непомітний для людського вуха або ока у більшості практичних застосувань.
Багато методів зосереджуються на особливостях будови органів чуття людини. Наприклад, психоакустична модель визначає те, як сильно звук може бути стиснутий без погіршення сприйманої якості звуку. Недоліки, заподіяні стисненням із втратами, які помітні для людського вуха або ока, відомі як артефакти стиснення.
Стиснення без втрат (англ. Lossless data compression) – метод стиснення інформації, при використанні якого закодована інформація може бути відновлена з точністю до біта. При цьому оригінальні дані повністю віднов-люються із стиснутого стану. Цей тип стиснення принципово відрізняється від стиснення даних із втратами. Для кожного з типів цифрової інформації, як правило, існують свої оптимальні алгоритми стиснення без втрат. Метод стиснення без втрат використовується, коли важлива ідентичність стиснутих даних оригіналу.
Техніка стиснення без втрат
Багатоцільові алгоритми стиснення відрізняються тим, що здатні зменшувати широкий діапазон даних – виконавчі файли, файли даних, тексти, графіку і т.д., та застосовуються в архіваторах. Спеціалізовані ж алгоритми розраховані на деякий тип файлів (текст, графіку, звук і т. д.), зате стискають такі файли набагато сильніше. Більшість спеціалізованих алгоритмів мало-придатні для файлів «чужих» типів – так, звукові дані погано стискаються алгоритмом, розрахованим на текстові файли.