Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ZI-LR&PZ / Steganograf / 467941_68B54_horoshko_v_a_chekody_i_sredstva_zashity_informa 461

.pdf
Скачиваний:
13
Добавлен:
02.02.2015
Размер:
237.9 Кб
Скачать
делена.

Текстовые стеганографы 461

Регулярные функции имитации можно смоделировать с помощью схемы кодирования по Хаффману. Известно, что любой язык обладает некоторыми статистическими свойствами. Этот факт используется многими методами сжатия данных. Если на алфавите Σ задано распределение вероятностей A, то можно воспользоваться схемой кодирования по Хаффману для создания функции сжатия с минимальной избыточностью fA:Σ→{0,1}*, где символ * используется в смысле Σ*= i0{x1…xi|x1,…,xi Σ}. Такую

функцию можно построить на основе функции сжатия Хаффмана: G(x)=fBОшибка! Закладка

не определена.(fA(x)).

Таким образом, секретный файл можно сжать по схеме Хаффмана с распределением A, в результате чего получится файл двоичных строк, которые могут интерпретироваться как результат операции сжатия некоторого файла с распределением B. Этот файл мо-

жет быть восстановлен с применением инверсной функции сжатия fBОшибка! Закладка не опре- к файлу двоичных строк и использоваться в дальнейшем как стеганограмма. Если

функции fA и fBОшибка! Закладка не определена. являются взаимно однозначными, то и созданная функция имитации будет также взаимно однозначна. Доказано, что построенная таким

образом функция подобия оптимальна в том смысле, что если функция сжатия Хаффмана fA является теоретически оптимальной и файл x состоит из случайных бит, то взаим-

но однозначная функция fAОшибкаA ! Закладка не определена.(X) имеет наилучшую статистическую эквивалентность к А.

Регулярные функции имитации создают стеганограммы, которые имеют заданное статистическое распределение символов, однако при этом игнорируется семантика полученного текста. Для человека такие тексты выглядят полной бессмыслицей с грамматическими ошибками и опечатками. Для генерирования более осмысленных текстов используются контекстно-свободные грамматики (КСГ).

Контекстно-свободная грамматика определяется упорядоченной четверткой <V, Σ V, П, S V\Σ>, где V и Σ — соответственно множества переменных и терминальных символов, П — набор продукций (правил вывода), а S — начальный символ. Продукции подобны правилам подстановки, они преобразуют переменную в строку, состоящую из терминальных или переменных символов. Если с помощью правил вывода из стартового символа можно получить последовательность терминальных символов, то говорят, что последовательность получена грамматикой. Такие грамматики называются контекстносвободными, т.к. любой символ можно заменить последовательностью символов, не обращая внимания на контекст, в котором он встретился. Если для каждой строки s существует только один путь, по которому s может быть порождена из начального символа, то такая грамматика называется однозначной.

Однозначные грамматики могут использоваться в качестве апарата для стеганографических преобразований. Рассмотрим грамматику

<{S,A,B,C},{A,…,Z, a,…,z},П,S>,

где каждой возможной продукции приписана некоторая вероятность: П={S0.5 Alice B, S0.3 Bob B, S0.1 Eve B, S0.1 I A; A0.3 am working, A0.4 am lazy, A0.4