Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методы и средства защиты информации

.pdf
Скачиваний:
169
Добавлен:
03.03.2016
Размер:
5.1 Mб
Скачать

Сокрытиеданных в изображениии видео 481

Рассмотрим пример. Пусть секретное сообщение будет 11110. Тогда для указанной выше грамматики П на первом шаге просмотр дерева ПS с помощью трех первых битов сообщения достигнет листа I. Таким образом, начальный символ S будет заменен на I A. Затем, просматривая еще раз дерево, с помощью следующий двух секретных битов сообщения произойдет замена очередных символов на am working . В результате, конечная строка будет состоять только из терминальных символов. В итоге стеганограмме 11110 соответствует сообщение I am working.

Для извлечения скрытой информации необходимо провести анализ стеганограммы с использованием дерева разбора КСГ. Так как грамматика и продукции однозначны, то извлечение скрытого сообщения выполнимо.

Практический опыт показал, что использование современных методов лингвистической стеганографии позволяет создавать стеганограммы, которые трудно обнаружить при автоматизированном мониторинге сетей телекоммуникации, но обмануть с их помощью человека-цензора все же очень сложно. В связи с этим наибольшее развитие получили стеганографические методы защиты для других информационных сред.

Сокрытие данных в изображении и видео

Развитие мультимедийных средств сопровождается большим потоком графической информации в вычислительных сетях. При генерации изображения, как правило, используются значительное количество элементарных графических примитивов, что представляет особый интерес для стеганографических методов защиты. Визуальная среда (цифровые изображения и видео) обладают большой избыточностью различной природы:

кодовой избыточностью, возникающей при неоптимальном описании изображения;

межпиксельной избыточностью, которая обусловлена наличием сильной корреляционной зависимостью между пикселями реального изображения;

психовизуальной зависимостью, возникающей из-за того, что орган зрения человека не адаптирован для точного восприятия изображения пиксель за пикселем и воспринимает каждый участок с различной чувствительностью.

Информационным видеопотокам, которые состоят из последовательности отдельных кадров изображения, помимо указанных выше, присуща также избыточность, обусловленная информационной, технической, временной и функциональной (смысловой) зависимостью между кадрами.

В последнее время создано достаточное количество методов сокрытия информации в цифровых изображениях и видео, что позволило провести их систематизацию и выделить следующие группы:

методы замены во временной (пространственной) области;

методы сокрытия в частотной области изображения;

482 Глава 20. Стеганография

широкополосные методы;

статистические методы;

методы искажения;

структурные методы.

Рассмотрим некоторые особенности, которые характерны для каждой из выделенных групп стеганометодов.

Методы замены

Общий принцип данных методов заключается в замене избыточной, малозначимой части изображения битами секретного сообщения. Для извлечения сообщения необходимо знать место, где была размещена скрываемая информация.

Наиболее распространенным методом этого класса является метод замены наименьшего значащего бита (НЗБ).

Популярность метода НЗБ обусловлена его простотой и тем, что он позволяет скрывать в относительно небольших файлах довольно большие объемы информации. Данный метод обычно работает с растровыми изображениями, которые представлены в формате без сжатия (например, GIF и BMP). Основным его недостатком является сильная чувствительность к малейшим искажениям контейнера. Для ослабления этой чувствительности часто применяют помехоустойчивое кодирование.

Суть метода НЗБ заключается в замене наименее значащих битов пикселей изображения битами секретного сообщения. В простейшем случае проводится замена НЗБ всех последовательно расположенных пикселей изображения. Однако, так как длина секретного сообщения обычно меньше количества пикселей изображения, то после его внедрения в контейнере будут присутствовать две области с различными статистическими свойствами (область, в которой незначащие биты были изменены, и область, в которой они не менялись). Это может быть легко обнаружено с помощью статистических тестов. Для создания эквивалентного изменения вероятности всего контейнера секретное сообщение обычно дополняют случайными битами так, чтобы его длина в битах была равна количеству пикселей в исходном изображении.

Другой подход, метод случайного интервала, заключается в случайном распределении битов секретного сообщения по контейнеру, в результате чего расстояние между двумя встроенными битами определяется псевдослучайно. Эта методика наиболее эффективна при использовании потоковых контейнеров (видео).

Для контейнеров произвольного доступа (изображений) может использовать-

ся метод псевдослучайной перестановки.

Его суть заключается в том, что генератор псевдослучайных чисел производит последовательность индексов j1, ..., jl(m) и сохраняет k-й бит сообщения в

Сокрытиеданных в изображениии видео 483

пикселе с индексом jk. Однако в этом случае один индекс может появиться в последовательности более одного раза, т.е. может произойти “пересечение” — искажение уже встроенного бита. Если число битов сообщения намного меньше размера изображения, то вероятность пересечения незначительна, и поврежденные биты могут быть восстановлены с помощью корректирующих кодов. Вероятность, по крайней мере, одного пересечения оценивается как

æ

l(m)[l(m) – 1]ö

p ≈ 1 – expç

2l(c)

÷, при условии, что l(m)<< l(c).

è

ø

При увеличении l(m) и l(c)=const данная вероятность стремится к единице. Для предотвращения пересечений необходимо сохранять все индексы использованных элементов ji и перед сокрытием нового пикселя проводить проверку его на повторяемость.

Еще один подход в реализации метода замены ( метод блочного сокрытия) состоит в следующем. Исходное изображение-контейнер разбивается на l(m) непересекающихся блоков Ii произвольной конфигурации и для каждого из них вычисляется бит четности p(Ii):

p(I) = åНЗБ(cj) mod 2

j I

В каждом блоке проводится сокрытие одного секретного бита mi. Если бит четности p(Ii) блока Ii не совпадает с секретным битом mi, то происходит инвертирование одного из НЗБ блока Ii, в результате чего p(Ii) = mi. Выбор блока может производиться случайно с использованием стегоключа. Хотя этот метод обладает такой же устойчивостью к искажениям, как и все предыдущие, он имеет ряд преимуществ. Прежде всего, имеется возможность изменять значения такого пикселя в блоке, для которого статистика контейнера изменится минимально. Кроме того, влияние последствий встраивания секретных данных в контейнер можно уменьшить за счет увеличения размера блока.

Методы замены палитры. Для сокрытия данных можно также воспользоваться палитрой цветов, которая присутствует в формате изображения.

Палитра из N цветов определяется как список пар индексов (i, c i), который определяет соответствие между индексом i и его вектором цветности ci. В изображении каждому пикселю присваивается индекс в палитре. Так как цвета в палитре не всегда упорядочены, то скрываемую информацию можно кодировать последовательностью хранения цветов в палитре. Существует N! различных способов перестановки N-цветной палитры, что вполне достаточно для сокрытия небольшого сообщения. Однако методы сокрытия, в основе которых лежит порядок формирования палитры, также неустойчивы: любая атака, связанная с изменениями палитры, уничтожает секретное сообщение.

Зачастую соседние цвета в палитре не обязательно являются схожими, поэтому некоторые стеганометоды перед сокрытием данных проводят упорядочи-

484 Глава 20. Стеганография

вание палитры так, что смежные цвета становятся подобными. Например, значения цвета может быть упорядочено по расстоянию d в RGBпространстве, где d = R2 + G2 + B2. Так как орган зрения человека более чувствителен к изменениям яркости цвета, то намного лучше сортировать содержимое палитры по значениям яркости сигнала. После сортировки палитры можно изменять НЗБ индексов цвета без особого искажения изображения.

Некоторые стеганометоды предусматривают уменьшение общего количества значений цветов (до N/2) путем “размывания” изображения. При этом элементы палитры дублируются так, чтобы значения цветов для них различались незначительно. В итоге каждое значение цвета размытого изображения соответствует двум элементам палитры, которые выбираются в соответствии с битом секретного сообщения.

К методам замены можно также отнести метод квантования изображений. Данный метод основан на межпиксельной зависимости, которую можно описать некоторой функцией Q. В простейшем случае, можно рассчитать разность ei между смежными пикселями xi и xi+1 и задать ее в качестве параметра для функции Q: i = Q(xi – xi – 1), где i — дискретная аппроксимация разности сигналов xi – xi – 1. Так как i является целым числом, а реальная разность xi – xi – 1 — вещественным, то появляется ошибка квантования δi = i – ei. Для сильно коррелированных сигналов эта ошибка близка к нулю: δi ≈ 0. В данном методе сокрытие информации проводится путем корректирования разностного сигнала i. Стегок-

люч представляет собой таблицу,

которая каждому возможному значению i

ставит в соответствие определенный бит, например:

 

 

 

 

 

 

i

–4

–3

–2

 

–1

0

1

2

 

3

 

4

 

 

0

1

0

 

1

1

1

0

 

0

 

1

 

Для сокрытия i-го бита сообщения вычисляется

i. Если

 

i не соответствует

секретному биту, который необходимо скрыть, то его значение

 

i заменяется бли-

жайшим j, для которого это условие выполняется. Извлечение секретного сообщения проводитсяв соответствиис разностью между i и стегоключом.

Методы сокрытия в частотной области изображения

Как уже отмечалось, стеганографические методы замены неустойчивы к любым искажениям, а применение операции сжатия с потерями приводит к полному уничтожению всей секретной информации, скрытой методом НЗБ в изображении. Более устойчивыми к различным искажениям, в том числе сжатию, являются методы, которые используют для сокрытия данных не временную область, а частотную.

Существуют несколько способов представления изображения в частотной области. Например, с использованием дискретного косинусного преобразования (ДКП), быстрого преобразования Фурье или вейвлет-преобразования. Данные преобразования могут применяться как ко всему изображению, так и к некото-

Сокрытиеданных в изображениии видео 485

рым его частям. При цифровой обработке изображения часто используется двумерная версия дискретного косинусного преобразования:

 

2

 

N–1 N–1

æπu(2x + 1)ö

æπu(2y + 1)ö

S(u, v) =

 

C(u) C(v) å åS(x,y)cosç

2N

÷ cosç

2N

÷,

 

 

N

x=0 y=0

è

ø

è

ø

 

2N–1 N–1

æπu(2x + 1)ö

æπu(2y + 1)ö

 

 

S(x, y) =

 

å åC(u) C(v) S(u,v)cosç

2N

÷ cosç

2N

÷,

 

 

Nx=0 y=0

 

è

ø

è

ø

где C(u)=1/2, если u=0 и C(u)=1 в противном случае.

Один из наиболее популярных методов сокрытия секретной информации в частотной области изображения основан на относительном изменении величин коэффициентов ДКП. Для этого изображение разбивается на блоки размером 8×8 пикселей. Каждый блок предназначен для сокрытия одного бита секретного сообщения. Процесс сокрытия начинается со случайного выбора блока bi, предназначенного для кодирования i-го бита сообщения. Для выбранного блока изображения bi проводится ДКП: Bi = D{b i}. При организации секретного канала абоненты должны предварительно договориться о конкретных двух коэффициентах ДКП, которые будут использоваться для сокрытия секретных данных. Обозначим их как (u1, v1) и (u2, v2). Эти два коэффициента должны соответствовать косинус-функциям со средними частотами, что обеспечит сохранность информации в существенных областях сигнала, которая не будет уничтожаться при JPEG-сжатии. Так как коэффициенты ДКП-средних являются подобными, то процесс сокрытия не внесет заметных изменений в изображение.

Если для блока выполняется условие Bi(u1, v1) > B i(u2,v2), то считается, что блок кодирует значение 1, в противном случае — 0. На этапе встраивания информации выбранные коэффициенты меняют между собой значения, если их относительный размер не соответствует кодируемому биту. На шаге квантования JPEG-сжатие может воздействовать на относительные размеры коэффициентов, поэтому, прибавляя случайные значения к обеим величинам, алгоритм гарантирует что |Bi(u1, v1) – Bi(u2,v2)| > x, где x > 0. Чем больше x, тем алгоритм будет более устойчивым к сжатию, но при этом качество изображения ухудшается. После соответствующей корректировки коэффициентов выполняется обратное ДКП.

Извлечение скрытой информации проводится путем сравнения выбранных двух коэффициентов для каждого блока.

Широкополосные методы

Широкополосные методы передачи применяются в технике связи для обеспечения высокой помехоустойчивости и затруднения процесса перехвата. Суть широкополосных методов состоит в значительном расширении полосы частот сигнала, более чем это необходимо для передачи реальной информации. Расширение диапазона выполняется в основном посредством кода, который не за-

486 Глава 20. Стеганография

висит от передаваемых данных. Полезная информация распределяется по всему диапазону, поэтому при потере сигнала в некоторых полосах частот в других полосах присутствует достаточно информации для ее восстановления.

Таким образом, применение широкополосных методов в стеганографии затрудняет обнаружение скрытых данных и их удаление. Цель широкополосных методов подобна задачам, которые решает стегосистема: попытаться “ растворить” секретное сообщение в контейнере и сделать невозможным его обнаружение. Поскольку сигналы, распределенные по всей полосе спектра, трудно удалить, стеганографические методы, построенные на основе широкополосных методов, являются устойчивыми к случайным и преднамеренным искажениям.

Для сокрытия информации применяют два основных способа расширения спектра:

с помощью псевдослучайной последовательности, когда секретный сигнал, отличающийся на константу, модулируется псевдослучайным сигналом;

с помощью прыгающих частот, когда частота несущего сигнала изменяется по некоторому псевдослучайному закону.

Рассмотрим один из вариантов реализации широкополосного метода. В качестве контейнера используется полутоновое изображение размером N×М. Все пользователи скрытой связи имеют множество l(m) изображений ϕi размером N×М, которое используется в качестве стегоключа. Изображения ϕi ортогональны друг другу, т.е.

N

N

M

M

ϕi ϕj =åy=1åϕi(x,y)ϕj(x,y) = Giδij, где Gi = åy=1åϕi2(x,y), δij дельта-

x=1

x=1

функция.

Для сокрытия сообщения m необходимо сгенерировать стегосообщение E(x, y) в виде изображения, формируя взвешенную сумму

E(x, y) = åmiϕi(x, y)

i

Затем, путем формирования поэлементной суммы обоих изображений, встроить секретную информацию E в контейнер C: S(x, y)=C(x, y) + E(x, y).

В идеале, контейнерное изображение C должно быть ортогонально ко всем ϕi (т.е. <C,ϕi> =0), и получатель может извлечь i-й бит сообщения mi, проектируя стегоизображение S на базисное изображение ϕi:

<S,ϕi> = <C,ϕi> + <åj

mjϕj, ϕi>= åj mj<ϕjϕi> = Gi mi

(20.1)

Секретная информация может быть извлечена путем вычисления mi = <C,ϕi>/Gi. Заметим, что на этом этапе нет нужды в знании исходного контейне-

Сокрытиеданных в изображениии видео 487

ра C. Однако на практике контейнер C не будет полностью ортогонален ко всем изображениям ϕi, поэтому в соотношение (20.1) должна быть введена величина погрешности (C, ϕi) = Ci, т.е. (C, ϕi) = Ci + Gimi.

Покажем, что при некоторых допущениях, математическое ожидание Ci равно нулю. Пусть C и ϕi две независимые случайные величины размером N×M. Если предположить, что все базисы изображений не зависят от передаваемых сообщений, то:

 

N

 

 

M

Ci] = ååj=1

E[

E[C(x, y)] E[ ϕi(x, y)] = 0

i=1

Таким образом, математическое ожидание величины погрешности <C,ϕi> =0. Поэтому операция декодирования заключается в восстановлении секретного сообщения путем проектирования стегоизображения S на все функции ϕi: S i = <S,ϕi> = Ci + Gimi. Если математическое ожидание Ci равно нулю, то Si ≈ Gimi. Если секретные сообщения были закодированы как строки –1 и 1 (вместо простого использования двоичных строк), значения mi могут быть восстановлены с помощью функции:

ìï–1, при Si < 0

mi = sign(Si) = í 0, при Si = 0 , при условии, что Gi>>0 ïî 1, при Si > 0

Если mi = 0, то скрываемая информация будет утеряна. При некоторых условиях значение | Ci| может возрасти настолько (хотя его математическое ожидание равно нулю), что извлечение соответствующего бита станет невозможным. Однако это происходит редко, а возможные ошибки можно исправлять, применяя корректирующие коды.

Основное преимущество широкополосных стеганометодов — это сравнительно высокая устойчивость к искажениям изображения и разного вида атакам, так как скрываемая информация распределена в широкой полосе частот, и ее трудно удалить без полного разрушения контейнера. Искажения стегоизображения увеличивают значение Ci и, если | Ci| > | Gimi|, то скрытое сообщение не пострадает.

Статистические методы

Статистические методы скрывают информацию путем изменения некоторых статистических свойств изображения. Они основаны на проверке статистических гипотез. Суть метода заключается в таком изменении некоторых статистических характеристик контейнера, при котором получатель сможет отличить модифицированное изображение от не модифицированного.

{ p(i)

488 Глава 20. Стеганография

Данные методы относятся к “ однобитовым” схемам, т.е. ориентированы на сокрытие одного бита секретной информации. l(m)-разрядная статистическая стегосистема образуется из множества одноразрядных путем разбиения изображения на l(m) непересекающихся блоков B1, ..., Bl(m). При этом секретный бит сообщения mi встраивается в i-й блок контейнера. Обнаружение спрятанного бита в блоке производится с помощью проверочной функции, которая отличает модифицированный блок от немодифицированного:

ì1, если блок Bi был модифицирован f(Bi) = íî0, в противном случае

Основная задача при разработке статистического метода — это создание соответствующей функции f. Построение функции f делается на основе теории проверки статистических гипотез (например: основной гипотезы “блок Bi не изменен“ и альтернативной — “блок Bi изменен”). При извлечении скрытой информации необходимо последовательно применять функцию f ко всем блокам контейнера Bi. Предположим, что известна статистика распределения элементов немодифицированного блока изображения h(Bi). Тогда, используя стандартные процедуры, можно проверить, превышает ли статистика h(Bi) анализируемого блока некоторое пороговое значение. Если не превышает, то предполагается, что в блоке хранится бит 0, в противномслучае — 1.

Зачастую статистические методы стеганографии сложно применять на практике. Во-первых, необходимо иметь хорошую статистику h(Bi), на основе которой принимается решение о том, является ли анализируемый блок изображения измененным или нет. Во-вторых, распределение h(Bi) для “ нормального” контейнера должно быть заранее известно, что в большинстве случаев является довольно сложной задачей.

Рассмотрим пример статистического метода. Предположим, что каждый блок контейнера Bi представляет собой прямоугольник пикселей p(i)n,m. Пусть имеется псевдослучайная двоичная модель того же размера S = { S(i)n,m }, в которой количество единиц и нулей совпадает. Модель S в данном случае представляет

собой стегоключ. Для сокрытия информации каждый блок изображения Bi делится на два равных подмножества Ci и Di, где Ci = { p(i)n,m Bi | Sn,m = 1} и Di = n,m Bi | Sn,m = 0}. Затем ко всем пикселям множества Ci добавляется значе-

ние k > 0. Для извлечения сообщения необходимо реконструировать подмножества Ci и Di и найти различие между ними. Если блок содержит сообщение, то все значения подмножества Ci будут больше, чем соответствующие значения на этапе встраивания сообщения. Если предположить, что все пиксели Ci и Di независимые, случайно распределенные величины, то можно применить статисти-

ческий тест:

 

 

 

 

 

— —

 

 

 

 

 

^

Var[Ci] – Var[Di]

 

 

Ci

– Di

 

qi =

 

^

, где σi =

|S|/2

,

 

 

σi

 

 

 

 

Сокрытиеданных в изображениии видео 489

где Ci — среднее значение всех пикселей множества Ci, а Var[Ci] — оценка дисперсии случайных переменных в Ci. В соответствии с центральной предельной теоремой, статистика q будет асимптотически стремиться к нормальному распределению N(0, 1). Если сообщение встроено в блок изображения Bi, то математическое ожидание q будет больше нуля. Таким образом, i-й бит секретного сообщения восстанавливается путем проверки статистики qi блока Bi на равенство нулю.

Методы искажения

Методы искажения, в отличие от предыдущих методов, требуют знания о первоначальном виде контейнера. Схема сокрытия заключается в последовательном проведении ряда модификаций контейнера, которые выбираются в соответствии с секретным сообщением. Для извлечения скрытых данных необходимо определить все различия между стеганограммой и исходным контейнером. По этим различиям восстанавливается последовательность модификаций, которые выполнялись при сокрытии секретной информации. В большинстве приложений такие системы бесполезны, поскольку для извлечения данных необходимо иметь доступ к набору первоначальных контейнеров: если противник также будет иметь доступ к этому набору, то он сможет легко обнаружить модификации контейнера и получить доказательства скрытой переписки. Таким образом, основным требованием при использовании таких методов является необходимость распространения набора исходных контейнеров между абонентами сети через секретный канал доставки.

Методы искажения легко применимы к цифровым изображениям. Как и в методах замены, для сокрытия данных выбирается l(m) различных пикселей контейнера, которые используются для сокрытия информации. Такой выбор можно произвести, используя датчик случайных чисел (или перестановок). При сокрытии бита 0 значение пикселя не изменяется, а при сокрытии 1 к цвету пикселя прибавляется случайное значение х. Хотя этот подход подобен методу замены, имеется одно существенное различие: в методе LSB значение выбранного цвета не обязательно равняется секретному биту сообщения, а в методах искажения при сокрытии нулевого бита не происходит никаких изменений. Помимо этого, значение х может быть выбрано так, что будут сохраняться статистические свойства контейнера. Для извлечения скрытых данных необходимо провести сравнение всех l(m) выбранных пикселей стеганограммы с соответствующими пикселями исходного контейнера. Если i-й пиксель будет отличаться, то это свидетельствует о том, что в скрытом сообщении был единичный бит, иначе — нулевой.

Существует еще один подход к реализации метода искажения изображения при сокрытии данных. В соответствии с данным методом при вставке скрываемых данных делается попытка скорее изменить порядок появления избыточной информации в контейнере, чем изменить его содержимое. При сокрытии данных

490 Глава 20. Стеганография

составляется определенный “список пар” пикселей, для которых отличие будет меньше порогового. Этот список играет роль стегоключа— без него нельзя восстановить секретное сообщение. Если абонент имеет доступ к “ списку пар”, он всегда сможет провести обратную процедуру.

Структурные методы

Рассмотренные выше методы в основном использовали информационную избыточность на уровне пикселей или же проводили преобразования в частотной области изображения. Ниже рассматривается метод, в котором сокрытие информации проводится на содержательном уровне с использованием структурных и информационных параметров изображения. По существу, он является развитием известной стеганографической технологии — семаграмм. Суть метода заключается в проведении последовательных преобразований фрагментов графического изображения, которые в конечном итоге приводят к формированию скрываемого текста.

Внастоящее время появилось множество графических пакетов программ и баз данных, с помощью которых можно создавать различные графические изображения, презентации, мультипликацию и пр. В каждом графическом изображении можно выделить отдельные компоненты, которые в соответствии с его областью интерпретации имеют свою информационную нагрузку. Визуальный образ S можно представить в виде цифровой последовательности, которая затем легко преобразуется в текстовое сообщение. Это возможно, например, в процессе покрытия образа некоторым графом, используя информационную интерпретацию его отдельных компонентов. В первом приближении вершинами такого графа могут служить отдельные компоненты рисунка, а ребрами — их соединения. При кодировании скрываемой информации полученный граф можно преобразовывать достаточно широким спектром известных в теории графов преобразованиями. В конечном итоге такой граф может быть размечен в соответствии с определенным алгоритмом и представлен в виде его числового инварианта. Простейшим инвариантом является матрица смежности графа ( последовательность нумерации вершин). Можно использовать несколько инвариантов, которые описываются в виде многочлена. Секретный ключ при таком подходе — это способ нумерации графа. Известно, что возможное количество перенумерованных графов для произвольного графа достаточно большое. Это обстоятельство делает предложенный способ сокрытия сообщений достаточно устойчивым против атак вскрытия.

Вструктурных методах можно выделить отдельные этапы стеганографического преобразования.

Первым этапом является преобразование защищаемого секретного сообщения m в цифровую форму CH. Это преобразование может быть, например, любым криптографическим преобразованием. Оно представляет собой шифрова-

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Оставленные комментарии видны всем.