Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный технологический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Билеты ОИТ.docx

Скачиваний:

192

Добавлен:

26.03.2015

Размер:

807.27 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 4011 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

17 Сжатие и распаковка информации по методу Шеннона-Фано.

Относится к статистическим (вероятностным) методам. Имеет две разновидности:

– статический; – динамический.

Статический предусматривает (вне зависим. от V сжимаемого документа или файла) использование априорной информации о вероятностных свойствах всех символов алфавита, на основе кот. м. б. создан произвольный документ. Символы этого документа сортируются в порядке убывания вероятности. Отсортированный массив символов исходного алфавита заменен бинарными последовательностями различной длины. Эти бинарные последовательности замещают каждый символ сж. текста и, наоборот, при распаковке. Т. о. важная задача – генерация (выработка) бинар. посл-ти.

Алгоритм генерации последовательностей (прямое преобразование) заключается в замене каждого символа соответствующим бинарным кодом:

1. Весь массив делится на 2 подмассива таким образом, чтобы сумма вероятностей в каждом подмассиве имела наименьшую разность. Каждому из символов обоих подмассивов приписываются старшие символы бинарного кода: 1 – первый подмассив, 0 – второй.

2. Делению подвергается каждый из подмассивов с приписыванием очередных символов бинарного кода, как и на предыдущем шаге. Деление продолжается до тех пор, пока каждый из конечных подмассивов не будет содержать только 1 символ алфавита.

Пример:

Сортировка
	1	1
	1	0	1
	1	0	0
	0	1	1
	0	1	0
	0	0	1	1
	0	0	1	0
	0	0	0	1
	0	0	0	0	1
	0	0	0	0	0

Как видно символам с наименьшей вероятностью соответствуют коды наибольшей длины, а с наибольшей вероятностью – наименьшие.

Сформированные бинарные коды должны отвечать следующим условиям:

1) все коды должны быть уникальными;

2) должно выполняться свойство префикса: ни один произвольный код меньшей длины не может быть началом произвольного кода большей длины.

Как видно, могут существовать различные (равнозначные) варианты разделения массива. Различные разделения будут соответствовать различные варианты кодов. Наилучший из возможных является тот вариант, которому соответствует наименьшее значение интегрального коэффициента С:

, где – вероятн. в соотв. с таблицей;l_i – длина кода.

Коэффициент С показывает среднее кол-во bit в сформировавшихся бинар. последовательностях, приходящихся на один символ алфавита А.

Алгоритм обратного преобразования (распаковки) наоборот, т.е. компрессор и декомпрессор должны пользоваться одинаковой таблицей код-символов и наоборот.

В этом процессе на выходе должны быть символы сообщения на основе исходного алфавита А. при этом важны два параметра: l_min, l_max.

Первый шаг: анализируется l_min первых символов в последовательности Y_n₂ на предмет их соответствия каких-либо из комбинаций в таблице. Если соответствие найдено, то на выходе преобразователя будет символ а_i. Если не найдено – второй шаг: кол-во анализируемых символов увеличивается на 1 и выполняется процедура первого шага. Если на каком-либо шаге находится соответствие, то анализу подвергаются следующая l_min символов. Если ни на каком из шагов не найдено соответствие, то производится анализ последовательности: l_min+(i-1) = l_max. Если на этом i-том шаге не найдено соответствие, то либо работа преобразования закончена и принято решение, либо принято какое-либо другое решение.

Динамический метод или адаптивный метод: частота появления символов все время меняется и по мере считывания нового блока данных происходит перерасчет начальных значений частот.

Статические методы характеризуются хорошим быстродействием и не требуют значительных ресурсов оперативной памяти. Они нашли широкое применение в многочисленных программах-архиваторах, например ARC, PKZIP и др., но для сжатия передаваемых модемами данных используются редко — предпочтение отдается арифметическому кодированию и методу словарей, обеспечивающим большую степень сжатия.

17 Сжатие и распаковка информации по методу Шеннона-Фано. (а/в)

1. статические (д/ любого произвольн. док-та исп-ся неизмен. статистич. св-ва символов алфавита): а) метод Хафмона; б) мет. Шеннона-Фано (все символы алф. сортируются в порядке ↓ вероятности. Сортирован массив дел-ся на 2 части так, чтобы Σ вер-тей в кажд. из образован. подмассивов была max возможно близкой (0,5). Символам из каждого подмассива присваив-ся старшие символы бинарн. кода: один подмассив – 1, другой – 0. Кажд. из 2 подмасс. дел-ся опять на 2 на том же усл-ии. Процесс разделения массивов продолж. до те пор, пока массив не б. состоять т. из 1 симв. исходн. алфавита. Т.обр. созд. бинарн. коды, соотв. кажд. символу исходн. алфавита. Осн. цель — приписать символам с > вер-ю коды < длины и наоборот). Прямое преобраз-е — замена симв. сообщ-я х_к соотв. бинарн. кодом. Обратное — обратная замена. Коды д. соотв. 2 требованиям: 1. они все д. б. различны; 2. любая кодовая комбинация < длины не м.б. началом любой комбинации > длины; 2. динамические (адаптивные) (предполаг. опред-е статист. св-в символов алф. д/ групп док-тов или д/ кадого док-та). Напр., х_k= ‘информационный’, Σ=14 симв., N_и=2, P_и=2/14, N_н=3, P_н= 3/14. Р всех остальн. символов, не € в это сооб., = 0.

Пример исп-я мет. Шен.-Фано д/ сжатия данных

Пусть задан алф. р (а_i), А={а_i}, i=1,8, N=8. Σ р (а_i)=1.

1. р (а₁)=0,10

р (а₂)=0,15

р (а₃)=0,08

р (а₄)=0,30

р (а₅)=0,06

р (а₆)=0,14

р (а₇)=0,09

р (а₈)=0,08

2. Сортируем от max к min

р (а₄)=0,30	0,45	1	1
р (а₂)=0,15	0,45	1	0
р (а₆)=0,14	0,55	0	1	1
р (а₁)=0,10		0	1	0
р (а₇)=0,09		0	0	1	1
р (а₈)=0,08		0	0	1	0
р (а₃)=0,08		0	0	0	1
р (а₅)=0,06		0	0	0	0

Эта табл. д.б. известна передающ. и принимающ. сторонам и д.б. неизмен.

3. Мет. Хаф. и Шен.-Фано после сортировки предусматривают генерацию бинарных последовательностей, кот. будут замещать символы исходн. алф. в сообщ. х_к. Мет. Шен.-Фано предусм. генерацию бинарн. послед-тей на осн. след. алгоритма: отсортирован. множество символов дел-ся на 2 подмножества так, чтобы Σ вер-тей в кажд. из подмножеств отлич. на min возможн. величину.

Обратн. преобраз. предусматр. замену. l_min=2, l_max=4. На 1 шаге осущ. анализ первых l_min символов — 00. Если совпад. найдено, то на вых. формир-ся соотв. символ исходн. алфавита а; если не найдено — l_min + 1 из первых символов анализир-ся. Совпад. м.б. и найдено, и нет. Если нет — ещё +1 и т.д. Анализ — до тех пор, пока группу анализа не б. составл. интервал длиной l_max. Если совпад. найдено — замена этих 01 на символ и тд. Если в конце концов нет → ошибка в составлении кодировки.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 4011 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
26.03.2015163.77 Кб61белшина.docx
#
18.11.2019118.62 Кб15Бетоны.docx
#
11.11.2019391.17 Кб5Бизнес-план_методические указания.doc
#
25.12.20182.32 Mб18Билет 11 новый.docx
#
03.05.201986.02 Кб4билеты 9 часть 3.doc
#
26.03.2015807.27 Кб192Билеты ОИТ.docx
#
23.09.2019184.96 Кб4билеты по крутько.docx
#
26.03.2015174.08 Кб17Билеты по электричеству 2011нов.doc
#
26.03.2015312.32 Кб46БиМ ГЛАВА 44.doc
#
26.03.2015421.89 Кб207БиМ ГЛАВА 55.doc
#
26.03.2015262.14 Кб65БиМ ГЛАВА 66.doc