
- •Вступ. Історія розвитку криптографії
- •Література
- •Розділ 1. Традиційні симетричні криптосистеми
- •1.1. Основні поняття та визначення
- •1.2. Шифрування методом переставляння
- •1.2.1. Шифр переставляння за описом Плутарха
- •1.2.2. Шифрувальні таблиці
- •1.2.3. Застосування магічних квадратів
- •1.3. Шифрування методом простої заміни
- •1.3.1. Полібіанський квадрат
- •1.3.2. Система шифрування Цезаря
- •1.3.3. Афінна система підставлянь Цезаря
- •1.3.4. Система шифрування Цезаря з ключовим словом
- •1.3.5. Шифрувальні таблиці Трісемуса
- •1.3.6. Біграмний шифр Плейфера
- •1.3.7. Криптографічна система Хілла
- •1.3.8. Система омофонів
- •1.4. Шифрування методом складної заміни
- •1.4.1. Система шифрування Віженера
- •1.4.2. Шифр Гронсфельда
- •1.4.3. Шифр "подвійний квадрат" Уїтстона
- •1.4.4. Одноразова система шифрування
- •1.4.5. Шифрування методом Вернама
- •1.4.6. Роторні машини
- •1.5. Шифрування методом гамування
- •1.5.1. Накладання гами шифру на вхідний текст
- •1.5.2. Методи генерування псевдовипадкових послідовностей чисел
1.3.8. Система омофонів
Система омофонів (homophones) [9] забезпечує простий захист інформації від криптоаналітичних атак, які базуються на підрахунку частот появи букв у зашифрованому тексті. Система омофонів є одноалфавітною, хоча при цьому букви початкового повідомлення мають декілька замін. Кількість замін береться пропорційною ймовірності появи букви у вхідному тексті.
Дані про розподіли ймовірностей появи букв в українському, російському і англійському текстах наведено в табл. 1, 2 і 3. Букви в таблицях вказані в порядку убування ймовірності їх появи в тексті. Наприклад, українська буква е трапляється в 13 разів частіше, ніж буква є, а англійська буква е трапляється в 123 рази частіше, ніж буква z.
Шифруючи букву початкового повідомлення, вибирають випадково одну з її замін. Заміни (часто їх називають омофонами) можуть бути представлені трирозрядними числами від 000 до 999. Наприклад, в українському алфавіті букві а присвоюються 86 випадкових номери, буквам е і р – по 47 номерів, а букві ф – всього 2 номери. Якщо омофони (заміни) присвоюються випадково різним появам однієї і тієї ж букви, тоді кожен омофон з'являється в зашифрованому тексті рівноймовірно.
Табл. 1. Розподіл ймовірностей появи букв у українських текстах
Буква |
Ймовірність |
Буква |
Ймовірність |
Буква |
Ймовірність |
Буква |
Ймовірність |
о |
0,104 |
с |
0,039 |
з |
0,020 |
х |
0,010 |
а |
0,086 |
л |
0,039 |
й |
0,020 |
щ |
0,009 |
і |
0,068 |
к |
0,037 |
б |
0,018 |
ж |
0,008 |
н |
0,061 |
у |
0,037 |
я |
0,017 |
ц |
0,007 |
в |
0,054 |
д |
0,030 |
г |
0,015 |
ю |
0,007 |
т |
0,051 |
п |
0,030 |
' |
0,015 |
ї |
0,007 |
е |
0,047 |
м |
0,027 |
ч |
0,014 |
є |
0,004 |
р |
0,047 |
ь |
0,025 |
ш |
0,011 |
ф |
0,002 |
Табл. 1. Розподіл ймовірностей появи букв у російських текстах
Буква |
Ймовірність |
Буква |
Ймовірність |
Буква |
Ймовірність |
Буква |
Ймовірність |
_ |
0,175 |
р |
0,040 |
я |
0,018 |
х |
0,009 |
о |
0,090 |
в |
0,038 |
ы |
0,016 |
ж |
0,007 |
е |
0,072 |
л |
0,035 |
з |
0,016 |
ю |
0,006 |
а |
0,062 |
к |
0,028 |
ъ |
0,014 |
ш |
0,006 |
и |
0,062 |
м |
0,026 |
б |
0,014 |
ц |
0,004 |
н |
0,053 |
д |
0,025 |
г |
0,013 |
щ |
0,003 |
т |
0,053 |
п |
0,023 |
ч |
0,012 |
э |
0,003 |
с |
0,045 |
у |
0,021 |
й |
0,010 |
ф |
0,002 |
Табл. 3. Розподіл ймовірностей появи букв у англійських текстах
Буква |
Ймовірність |
Буква |
Ймовірність |
Буква |
Ймовірність |
е |
0,123 |
l |
0,040 |
b |
0,016 |
т |
0,096 |
d |
0,036 |
g |
0,016 |
а |
0,081 |
c |
0,032 |
v |
0,009 |
o |
0,079 |
u |
0,031 |
k |
0,005 |
n |
0,072 |
р |
0,023 |
q |
0,002 |
i |
0,071 |
f |
0,023 |
x |
0,002 |
s |
0,066 |
м |
0,022 |
j |
0,001 |
r |
0,060 |
w |
0,020 |
z |
0,001 |
h |
0,051 |
y |
0,019 |
|
|
При такому підході до формування зашифрованого тексту простий підрахунок частот вже нічого не дає криптоаналітику. Проте в принципі корисна також інформація про розподіл пар і трійок букв у різних природних мовах. Якщо цю інформацію використовувати при криптоаналізі, то він буде проведений дещо успішніше.
Якість передачі мовлення – одна із головних характеристик каналу мовленевого зв'язку. Згідно з [6], головними критеріями якості каналів мовленевої комунікації є: розбірливість (зрозумілість, ясність); гучність (голосність); природність (натуральність). Розбірливість, безперечно, можна назвати головним параметром, оскільки вона відображає виконання системою прийому-передачі мови свого головного призначення – забезпечення того, щоб слухач правильно зрозумів зміст переданого. Гучність – визначає бажаний рівень прийнятих сигналів, який для оптимальних умов має бути таким, щоб не викликати стомленості та перенапруження слухового апарата. Цей параметр не є самодостатнім і використовується разом із першим, а в умовах використання спеціальної техніки, що регулює гучність, втрачає сенс. Природність – оцінює здатність системи відтворювати не тільки зміст мови, що передається, але й її індивідуальні особливості, притаманні різним мовцям. Цей параметр не такий важливий як розбірливість. Виключенням є випадки спеціальних систем зв'язку, наприклад систем, у яких потрібне визначення особи (ідентифікація) мовця за голосом, або для художнього відтворення мови та музики.
Усі відомі на цей час методи оцінки якості передачі мовлення можуть бути розділені на дві великі групи: суб'єктивні експертні методи і об'єктивні методи [2]. Артикуляційні випробування є суб'єктивним методом оцінки розбірливості – це найбільш прямий й очевидний, а іноді й єдиний, шлях дослідження якості каналу мовного зв'язку. Головними перевагами методу артикуляційних випробувань є його універсальність та відносна простота. Однак процедура організації суб'єктивних експертиз по оцінці розбірливості мови – справа громіздка, тривала й досить дорога.
Серйозною й самостійною складною проблемою методу артикуляційних випробувань є створення спеціальних артикуляційних таблиць. Як показує практика вимірювань, тип таблиць, що використовуються, істотно впливає на результати вимірювань. Артикуляційні таблиці складаються за певними правилами [6]. Ці правила враховують лінгвістичні (мовні) і технічні вимоги до таблиць. Лінгвістичні вимоги полягають у тому, щоб таблиці достатньою мірою відображали фонетичну структуру мови. Технічні вимоги передбачають забезпечення максимальної економності під час виконання вимірів, мінімальної надмірності із максимально можливою однорідністю для того, щоб зменшити розкид результатів одиночних вимірів. Поєднання в таблицях лінгвістичних і технічних вимог можливе тільки у разі розумного компромісу, оскільки вони взаємно суперечливі.
Для української мови не складено артикуляційних таблиць, їх складання є актуальною науково-прикладною задачею. Для забезпечення лінгвістичних вимог до артикуляційних таблиць для української мови необхідним є буквений та фонемний частотні аналізи.