1.2 Характеристики алгоритмов сжатия и их применимость

1.2.1 Коэффициент сжатия

Коэффициент сжатия — основная характеристика алгоритма сжатия. Она определяется как отношение объёма исходных несжатых данных к объёму сжатых, то есть:

где k — коэффициент сжатия, S_o — объём исходных данных, а S_c — объём сжатых.

Таким образом, чем выше коэффициент сжатия, тем алгоритм эффективнее. Следует отметить:

если k = 1, то алгоритм не производит сжатия, то есть выходное сообщение оказывается по объёму равным входному;
если k < 1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Ситуация с k < 1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что поскольку число различных сообщений длиной n бит составляет ровно 2ⁿ, число различных сообщений с длиной меньшей или равной n (при наличии хотя бы одного сообщения меньшей длины) будет меньше 2ⁿ. Это значит, что невозможно однозначно сопоставить все исходные сообщения сжатым: либо некоторые исходные сообщения не будут иметь сжатого представления, либо нескольким исходным сообщениям будет соответствовать одно и то же сжатое, а значит их нельзя отличить. Однако даже когда алгоритм сжатия увеличивает размер исходных данных, легко добиться того, чтобы их объём гарантировано не мог увеличиться более, чем на 1 бит. Тогда даже в самом худшем случае будет иметь место неравенство:

Делается это следующим образом: если объём сжатых данных меньше объёма исходных, возвращаем сжатые данные, добавив к ним «1», иначе возвращаем исходные данные, добавив к ним «0»).

Пример того, как это реализуется на псевдо-C++, показан ниже:

bin_data_t __compess(bin_data_t input) // bin_data_t - тип данных, означающий произвольную последовательность бит переменной длины

{

bin_data_t output = arch(input); // функция bin_data_t arch(bin_data_t input) реализует некий алгоритм сжатия данных

if (output.size()<input.size()) // если объём сжатых данных меньше объёма исходных, функция bin_data_t::size() возвращает размер данных

{

output.add_begin(1); // функция bin_data_t::add_begin(bool __bit__) добавляет бит, равный __bit__ в начало последовательности

return output; // возвращаем сжатую последовательность с добавленной «1»

}

else // иначе (если объём сжатых данных больше или равен объёму исходных)

{

input.add_begin(0); // добавляем «0» к исходной последовательности

return input; // возвращаем исходный файл с добавленным «0»

}

Коэффициент сжатия может быть как постоянным (некоторые алгоритмы сжатия звука, изображения и т. п., например А-закон, μ-закон, ADPCM, усечённое блочное кодирование), так и переменным. Во втором случае он может быть определён либо для каждого конкретного сообщения, либо оценён по некоторым критериям:

средний (обычно по некоторому тестовому набору данных);
максимальный (случай наилучшего сжатия);
минимальный (случай наихудшего сжатия);

или каким-либо другим. Коэффициент сжатия с потерями при этом сильно зависит от допустимой погрешности сжатия или качества, которое обычно выступает как параметр алгоритма. В общем случае постоянный коэффициент сжатия способны обеспечить только методы сжатия данных с потерями.

<<< < Предыдущая 12 / 62 3 4 5 6 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.2025393.73 Кб3Raschet_rasseivania_tekhnogennykh_pollyutantov_...doc
#
16.09.201971.17 Кб8referatbank-7832.doc
#
01.03.202581.92 Кб0referat_istoricheskie_lichnosti_vasil3.doc
#
01.03.202599.65 Кб0Referat_po_filosofii.docx
#
22.04.2019624.13 Кб21Rescue.asd.doc
#
01.03.202561.85 Кб1RGR1 saod.docx
#
01.03.2025154.4 Кб2RGR2 saod.docx
#
14.11.2019188.42 Кб2RGR4_Linii_i_ploskosti.doc
#
06.05.2019145.41 Кб4Risk-MNT_investitsii_bankrotstvo_RED.doc
#
26.09.2019103.42 Кб7RLB_L1.DOC
#
26.09.2019225.79 Кб14RLB_L10.DOC