Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
34
Добавлен:
30.03.2015
Размер:
634.88 Кб
Скачать

Министерство образования Российской Федерации

ОМСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ (ОмГТУ)

Кафедра «Автоматизированные системы обработки информации и управления»

ОТЧЕТ ПО ЛАБОРАТОРНОЙ РАБОТЕ

по дисциплине «Информационные технологии»

УНИВЕРСАЛЬНОЕ КОДИРОВАНИЕ. СЛОВАРНОЕ МОДЕЛИРОВАНИЕ. АНАЛИЗ ОПТИМАЛЬНОСТИ КОДОВ ХАФФМАНА

Принял:

преподаватель Юдин Е.Б.

______________________

подпись, дата

Выполнил:

студент гр. АС-530 Юдин Е. Б.

______________________

подпись, дата

Омск 2005

Реферат

Отчет по лабораторной работе 12 с., 2 части, 4 рис., 4 таб., 2 источника, 2 прил.

КОД ХАФФМАНА, ДИСКРЕТНЫЙ ИСТОЧНИК, ССЛОВАРНОЕ МОДЕЛИРОВАНИЕ, КОДИРОВАНИЕ, ЭНТРОПИЯ, ДЛИНА КОДА.

Предметом исследования лабораторной работы являлся принцип универсального кодирования, методы словарного моделирования дискретных источников и кодирование методом Д.А. Хаффмана.

Цель работы – универсальное кодирование дискретного нестационарного источника на примере словарного моделирования и оценка оптимальности кодов Хаффмана.

В ходе работы был сгенерирован псевдотекст (около 150 символов) с использованием четырёх букв и знака подчёркивания в качестве разделителя слов, Был проведён анализ первой трети текста на основании которого построен словарь подстрок, который использовался при кодировании оставшихся двух третей текста.

Были сделаны выводы

Содержание

Введение 4

1 Словарное моделирование 5

2Генерация псевдотекста 5

3Построение словаря повторяющихся подстрок 5

4Сравнительные характеристики энтропии 5

5 Кодирование на основе словарного моделирования 7

6Построение двоичных кодов Хаффмана 7

7Анализ графиков оптимальной длины кода и длины кода Хаффмана 8

Заключение 9

Список использованных источников 10

Приложение А Дерево подстрок псевдотекста 11

Приложение Б Таблицы для кодирования по методу Хаффмана 12

Введение

В 1981г. Й.Й. Риссанен и Г.Г. Лангдон предложили принцип универсального кодирования, разделяющий задачу кодирования источника на две составляющих: моделирование и кодирование. Задачей моделирования является получение распределения вероятностей текущего состояния источника. Результатом моделирования источника в момент времени k после получения сообщения sk является множество вероятностей Pk = {pk1, pk2, … pkN} того, какое значение из множества возможных сообщений X = {x1, x2, … xN} выберет ожидаемое sk+1.

После получения сообщения sk+1, которое, например, приняло значение xi, требуется построить для него как можно более короткий код из сообщений выходного алфавита Y = {y1, y2, … yM} (чаще всего двоичного), что является задачей кодирования. Оптимальной длиной кода для sk+1 будет величина

 logM p(xi), (1)

где M – мощность выходного алфавита, p(xi) – объективная вероятность появления сообщения xi. Поскольку объективные вероятности априорно неизвестны, для построения кода используется значение pki, полученное на этапе моделирования. Таким образом, эффективность универсального кодирования зависит и от точности оценки вероятностей при моделировании, и от оптимальности построения кода при кодировании.

Суть словарного моделирования заключается в использовании расширенного алфавита источника – словаря D = {d1, d2, … dN+C}, состоящего из комбинаций элементарных сообщений алфавита X и называются подстроками. При кодировании источника элементарные сообщения принимаются до тех пор, пока не сформируют подстроку словаря D, которая кодируется на основе распределения вероятностей подстрок P = {p1, p2, … pN+С}.

Для эффективного кодирования сообщений алфавита любой мощности может быть использован метод Д.А. Хаффмана, который позволяет построить для каждого сообщения уникальный префиксный код длины (), округлённой до большего целого [, 2].

Цель работы являлось универсальное кодирование дискретного нестационарного источника на примере словарного моделирования и оценка оптимальности кодов Хаффмана.

Соседние файлы в папке Лабораторная 2