
3-2 Стеганографія / Стеганография_основной_учебник
.pdf
Далі обчислюється сума добутків нульового сигналу, що змішує, і аудіосигналу із затримкою "нуль", а також одиничного сигналу, що змішує, і аудіосигналу із затримкою "одиниця". Інакше кажучи, коли в аудіосигнал необхідно впровадити "одиницю", на вихід подається сигнал із затримкою "одиниця", у противному випадку – сигнал із затримкою "нуль". Оскільки сума двох сигналів, що змішують, завжди дорівнює одиниці, то забезпечується гладкий перехід між ділянками аудіосигналу, у які впроваджені різні біти. Блок-схема стеганокодера показана на рис. 3.7.
|
Одиничний |
|
перемикаючий сигнал |
|
Одиниця |
Вихідний |
Стегакодований |
сигнал |
сигнал |
|
Нуль |
Нульовий перемикаючий сигнал
Рис. 3.7. Блок-схема стегакодера
Декодування. Декодування впровадженої інформації є визначенням проміжку часу між сигналом і ехо. Для цього необхідно розглянути амплітуду (у двох точках) автокореляційної функції дискретного косинусного перетворення логарифму спектра потужності (кепстра). У результаті обчислення кепстра вийде послідовність імпульсів (ехо, дубльована кожні секунд) (рис. 3.8).
Рис. 3.8. Результат обчислення кепстра
Для визначення проміжку часу між сигналом і його ехо необхідно розрахувати автокореляційну функцію кепстра.
Сплеск автокореляційної функції буде мати місце через 1 або 0 секунд після вихідного сигналу (рис. 3.9). Правило декодування засноване на визначенні проміжку часу між вихідним сигналом і сплеском
121

автокореляції. При декодуванні "одиниця" приймається, якщо значення автокореляційної функці через 1 секунд більше, ніж через 0 секунд, у противному випадку – "нуль".
Автокореляційна функція кепстра Кепстр
а) Нуль |
Час (с) |
|
Автокореляційна функція кепстра Кепстр
б) Одиниця |
Час (с) |
|
Рис. 3.9. Поводження автокореляційної функції при різній
впровадженій інформації
За дослідженнями В. Бендера й Н. Моримото дана схема дозволяє впроваджувати 16 бітів в одну секунду аудіозапису непомітно, без втрати його якості.
3.4. Приховування даних у частотній множині аудіосигналу (фазове кодування)
Метод, що пропонує використовувати слабку чутливість системи слуху людини до незначних змін фази сигналу, був запропонований В. Бендером, Н. Моримото та ін.
Упровадження інформації модифікацією фази аудіосигналу – це метод, при якому фаза початкового сегмента аудіосигналу модифікується
122
залежно від упроваджуваних даних. Фаза наступних сегментів узгоджується з ним для збереження різниці фаз. Це необхідно тому, що до різниці фаз людське вухо більш відчутне. Фазове кодування, коли воно може бути застосовано, є одним з найбільш ефективних способів кодування за критерієм відношення сигнал – шум.
Процедура фазового кодування полягає в такому:
1.Звуковий сигнал s i ,(0 i I 1) розбивається на серію N коротких сегментів sn i (0 n N 1) .
2.До n-го сегмента сигнала sn i застосовується k-точкове дискретне перетворення Фур’є, де = I/N, і створюються матриці фаз
n (wk ) і амплітуд An (wk ) для (0 k K 1).
3. Запам’ятовується різниця фаз між кожними двома сусідніми сегментами (0 n N 1).
|
n 1(wk ) n 1(wk ) n (wk ). |
(3.1) |
|
4. Бінарна послідовність даних представляється як / 2 |
і - / 2 , |
/ |
/ . |
|
0 |
data |
|
5. З урахуванням різниці фаз створюється нова матриця фаз для n>0:
( |
/ |
(w |
|
) / |
(w |
|
) (w |
|
)) |
|
|
|
|
|
||||||||
1 |
|
k |
0 |
|
|
k |
|
|
|
1 |
|
|
|
k |
|
|
|
|
|
|
|
|
... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( |
/ |
(w |
k |
) / |
|
(w |
k |
) |
n |
(w |
k |
)) |
|
(3.2) |
||||||||
|
n |
|
n 1 |
|
|
|
|
|
|
|
|
|
|
|
||||||||
... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/ |
|
|
) / |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( |
(w |
k |
|
(w |
k |
) |
N |
(w |
k |
)) |
|
|||||||||||
|
0 |
|
N 1 |
|
|
|
|
|
|
|
|
|
|
|
6. Стеганокодований сигнал виходить шляхом застосування зворотного дискретного перетворення Фур’є до вихідної матриці амлітуд і модифікованої матриці фаз.
Одержувачі повинні бути відомі: довжина сегмента і точки ДПФ. Перед декодуванням послідовність повинна бути синхронізована.
Недоліком цієї схеми є її низька пропускна здатність. В експериментах В. Бендера й Н. Моримото пропускна здатність каналу варіювалася від 8 до 32 бітів у секунду.
123
3.5. Приховування даних в аудіосигналах за допомогою методів розширення спектра
Запропонований алгоритм задовольняє більшості із пропонованих вимог, викладених вище [22]. ЦВДЗ впроваджується в аудіосигнали (послідовність 8×8-бітних або 16-бітних відліків) шляхом незначної зміни амплітуди кожного відліку. Для виявлення ЦВДЗ не потрібно вихідного аудіосигналу.
Нехай аудіосигнал складається з N відліків x(i), i = 1, ..., N, де значення N не менше 88200 (відповідно 1 секунда для стереоаудіосигналу, дискретизованого на частоті 44,1 кГц). Для того щоб вмонтувати ЦВДЗ, використовується функція f(x(i), w(i)), де w(i) – відлік ЦВДЗ. Функція f повинна брати до уваги особливості системи слуху людини, щоб уникнути відчутних перекручувань вихідного сигналу. Відлік результуючого сигналу виходить у такий спосіб:
y(i) = x(i) + f(x(i),w(i)). |
(3.3) |
|
Відношення сигнал – шум у цьому випадку обчислюється як: |
|
|
|
x2 (n) |
(3.4) |
SNR = 10 log10 x(n) y(n) 2 . |
||
|
n |
|
n
Важливо відзначити, що застосовуваний у схемі генератор випадкових чисел повинен мати рівномірний розподіл. Стійкість ЦВДЗ, у загальному випадку, підвищується зі збільшенням енергії ЦВДЗ, але це збільшення обмежується зверху припустимим відношенням сигнал – шум.
Виявлення ЦВДЗ відбувається в такий спосіб. Позначимо через S таку суму:
N |
|
S y(i )w(i ). |
(3.5) |
i 1 |
|
Комбінуючи (3.3) і (3.5), одержуємо: |
|
N |
|
S x(i )w(i ) f (x(i ),w(i ))w(i ) . |
(3.6) |
i 1
124
Перша сума в (3.6) дорівнює нулю, якщо числа на виході ГВЧ розподілене рівномірно й математичне очікування значення сигналу дорівнює нулю. У більшості ж випадків спостерігається деяка відмінність, позначувана w , котру необхідно також ураховувати.
Отже, (3.6) приймає вигляд:
N w |
w |
N |
|
S x(i )w(i ) |
x(i )w(i ) f (x(i ),w(i ))w(i ) . |
(3.7) |
|
i 1 |
i 1 |
i 1 |
|
N w |
|
|
|
Сума x(i )w(i ), як |
показано |
вище, приблизно дорівнює |
нулю. |
i 1
Якщо в аудіосигнал не був впроваджений ЦВДЗ, то S буде приблизно
|
N |
|
дорівнювати |
w x(i )w(i ) . |
З іншого боку, якщо в аудіосигнал був |
|
N i 1 |
|
впроваджений ЦВДЗ, то S буде приблизно дорівнювати: |
||
|
N |
N |
|
w x(i )w(i ) f (x(i ),w(i ))w(i ) . |
|
|
N i 1 |
i 1 |
Однак x i – це вихідний сигнал, що за умовою не може бути використаний у процесі виявлення ЦВДЗ. Сигнал x i можна замінити на
w |
|
w S , помилка при цьому буде |
y i , це приведе до заміни x(i )w(i ) на |
||
i 1 |
|
N |
незначною. |
|
|
Отже, віднімаючи величину |
w S |
з S і ділячи результат на |
|
N |
|
N |
|
|
f (y(i ),w(i ))w(i ) , одержимо результат r, нормований до 1. Детектор |
||
i 1 |
|
|
ЦВДЗ, використовуваний у цьому методі, обчислює величину r, що задається формулою:
|
S |
w |
|
S |
|
|
|
|
|
|
|
|
|||
r |
|
N |
|
|
|
. |
(3.8) |
|
|
||||||
N |
|
|
|||||
ˆ |
|
|
|
|
|
|
|
|
f (y(i ),w(i ))w(i ) |
|
i 1
Гранична величина виявлення теоретично лежить між 0 і 1. Досвідченим шляхом установлено, що для того, щоб визначити, чи дійсно певний ЦВДЗ перебуває в сигналі, граничне значення ЦВДЗ повинне бути вище 0,7. Якщо потрібна більша вірогідність у визначенні наявності ЦВДЗ у сигналі, граничне значення необхідно збільшити. Робота кодера й декодера наведені на рис. 3.10 [12].
125

ГВЧ
|
|
|
|
|
|
стеганокодований |
|||
|
F(xi,wi) |
|
|||||||
|
|
|
|
|
|
|
сигнал |
||
|
|
||||||||
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Початковий сигнал
Блок-схема стеганокодера
ГВЧ |
F(xi,wi) |
Мультиплікативний |
|
|
оператор |
||
|
|
|
|
Суматор |
Облік |
Суматор |
|
|
|
статистики |
|
|
|
w |
|
Мультиплікативний |
|
Розділювач |
Пороговий |
оператор |
|
пристрій |
|
|
|
||
Блок-схема |
|
Вирішення про |
|
стеганодекодера |
наявність ЦВЗ |
Рис. 3.10. Блок-схеми стегакодера й стеганодекодера
На рис. 3.11 показана емпірична функція щільності ймовірності для аудіосигналу з ЦВДЗ і без ЦВДЗ. Емпірична функція щільності ймовірності аудіосигналу без ЦВДЗ показана безперервною кривою, пунктирна крива описує емпіричну функцію щільності ймовірності аудіосигналу з убудованим ЦВДЗ. Обидва розподіли були обчислені з використанням 1 000 різних значень ЦВДЗ при відношенні сигнал – шум 26 дб.
без ЦВЗ із ЦВЗ
ФЩР
Величина знаходження (відношення сигнал – шум – 26 дб)
Рис. 3.11. Функція щільності розподілу величини виявлення
для сигналів зі ЦВДЗ і без ЦВДЗ
126

Упровадження в один аудіосигнал великої кількості різних ЦВДЗ приводить до збільшення чутності перекручувань. Максимальна кількість ЦВДЗ обмежена енергією кожного з них. Декодер здатний правильно відновити кожний ЦВДЗ за умови використання кодером унікальних ключів. На рис. 3.12 показаний приклад виявлення ЦВДЗ із використанням 1 000 різних ключів, з яких тільки один – правильний [22].
При стиску аудіосигналу до 48 кб/с з’являються звукові ефекти, відчутно знижується якість сигналів зі ЦВДЗ. Стійкість алгоритму вбудовування ЦВДЗ до фільтрації перевірена застосуванням до нього ковзного фільтра середніх частот і фільтра нижніх частот. У роботі [22] перевірялася стійкість розглянутого методу впровадження інформації до стиску MPEG до швидкостей 80 кб/с і до 48 кб/с.
Спроба знаходження ЦВЗ із застосуванням різних ключів
Ключ ЦВЗ – 444
Різні ключи ЦВЗ (відношення сигнал – шум – 26 дб)
Рис. 3.12. Розпізнавання заданого ключа збудованих ЦВДЗ
Після відновлення при стиску до швидкості 80 кб/с можна спостерігати незначне зменшення граничної величини виявлення в аудіосигналах зі ЦВДЗ (рис. 3.13).
До і після здійснення MPEG
До MPEG
Після MPEG
Величина знаходження (відношення сигнал – шум – 26 дб)
Рис. 3.13. Вплив стиску даних на ЦВДЗ
127

Аудіофайли із впровадженим ЦВДЗ профільтровані ковзним фільтром середніх частот довжини 20, що вносить в аудіоінформацію значні перекручування.
На рис. 3.14 показано, як змінюється гранична величина виявлення при застосуванні описаного фільтра. Загалом, поріг виявлення збільшується у відфільтрованих сигналах. Це відбувається через те, що функція щільності розподілу сигналів після фільтрації зрушується вправо порівняно з відносною функцією розподілу сигналів, що не піддавалися фільтрації.
До і після фільтрації ФСЧ довжини 20
Нефільтрований
Фільтрований
Величина знаходження (відношення сигнал – шум – 26 дб)
Рис. 3.14. Вплив на ЦВДЗ застосування до аудіосигналу ковзного
фільтра середніх частот
ЦВДЗ зберігається й при застосуванні до аудіосигналу фільтра нижніх частот. Однак при фільтрації аудіосигналів зі ЦВДЗ фільтром нижніх частот Хемінга 25-го порядку із частотою зрізу 2205 Гц мало місце зменшення ймовірності виявлення наявності ЦВДЗ.
Для перевірки стійкості ЦВДЗ до передискретизації Р. Бассіа й І. Пітасом аудіосигнали були передискретизовані на частоти 22050 Гц і 11025 Гц і назад на початкову частоту. ЦВДЗ зберігався.
При переквантуванні аудиосигнала з 16-бітного в 8-бітний і назад впроваджений ЦВДЗ зберігається, незважаючи на часткову втрату інформації. На рис. 3.15 показано наскільки добре ЦВДЗ зберігається в 1000 аудиосигналах при їх переквантуванні в 8-бітні й назад в 16-бітні.
128

До і після переквантування
Непереквантований
Переквантований
Величина знаходження (відношення сигнал – шум – 26 дб)
Рис. 3.15. Вплив переквантування сигналу на ЦВДЗ
Девіація функції щільності розподілу переквантованого сигналу збільшується, як і у випадку застосування фільтра нижніх частот, отже, має місце зменшення ефективності виявлення.
Контрольні запитання
1.Назвіть особливості слухової системи людини (ССЛ). Назвіть основні властивості ССЛ, що використовуються при приховуванні даних
ваудіосигналах.
2.У чому полягає суть цифрового формату аудіосигналів WAV?
3.Охарактеризуйте сутність приховування даних у просторій множині аудіосигналу.
4.Охарактеризуйте сутність приховування в найменш значущому біті даних та за допомогою ехосигналів.
5.Охарактеризуйте сутність приховування даних у частотній множині аудіосигналу (фазове кодування).
6.Охарактеризуйте сутність приховування даних в аудіосигналах за допомогою методів розширення спектра.
7.У чому полягають особливості комп’ютерної обробки аудіосигналів?
8.Побудуйте блок-схему стеганокодера.
129
9. У чому полягає суть цифрового формату аудіосигналів OGG Vorbis?
10.Поводження автокореляційної функції при різній впровадженій інформації.
11.Побудуйте блок-схему стеганодекодера.
12.Охарактеризуйте функцію щільності розподілу величини виявлення для сигналів зі ЦВДЗ і без ЦВДЗ.
13.У чому полягає суть цифрового формату аудіосигналів MP3?
14.Охарактеризуйте суть впливу стиску даних на ЦВДЗ.
15.Охарактеризуйте суть впливу на ЦВДЗ застосування до аудіосигналу ковзного фільтра середніх частот.
16.У чому полягає суть цифрового формату аудіосигналів AAC?
17.Охарактеризуйте суть впливу переквантування сигналу на
ЦВДЗ.
18.У чому полягає суть цифрового формату аудіосигналів WMA?
19.Охарактеризуйте емпіричну функціу щільності ймовірності аудіосигналу без ЦВДЗ.
20.У чому полягає суть впливу переквантування сигналу на ЦВДЗ?
21.Охарактеризуйте девіацію функції щільності розподілу переквантованого сигналу.
Розділ 4. Приховування даних у текстових файлах
4.1. Методи текстової стеганографії
Стеганографія, що використовує текстові контейнери, називається текстовою (text steganography). Далі буде розглянуто, яким чином можна застосовувати текстові контейнери для зберігання стега. Досить повна класифікація подібних методів дана в роботах [5; 7; 20]. З автоматичних методів текстової стеганографії в цій роботі згадується тільки один –
форматування, тобто вирівнювання, тексту за допомогою пробілів.
Суть даного методу [20] полягає в розсуненні рядка шляхом збільшення пробілів між словами, коли один пробіл відповідає, наприклад, біту 0, два пробіли – біту 1. Однак пряме його застосування хоча й
130