Криптоанализ шифра простой однобуквенной замены
Задание: дешифровать шифр простой однобуквенной замены (используемый алфавит состоит из 32-х русских букв («ё» принимается за «е», прописные и строчные буквы не различаются), тексты по вариантам).
Теория
Пусть алфавит состоит из 32-х русских букв («ё» принимается за «е», прописные и строчные буквы не различаются):
Символ |
а |
б |
в |
г |
д |
е |
ж |
з |
и |
й |
к |
л |
м |
н |
о |
п |
р |
с |
т |
у |
ф |
х |
ц |
ч |
ш |
щ |
ъ |
ы |
ь |
э |
ю |
я |
№ |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
Шифрование заключается в выборе некоторой перестановки на множестве букв алфавита (перестановка является ключом шифра) и замене букв открытого текста с номером i на букву перестановки с тем же номером. Например, зашифруем фрагмент известного высказывания великого русского учёного Михаила Васильевича Ломоносова «Математику уже затем учить надо, что она ум в порядок приводит» перестановкой
Символ |
л |
о |
м |
н |
с |
в |
а |
б |
г |
д |
е |
ж |
з |
и |
й |
к |
п |
р |
т |
у |
ф |
х |
ц |
ч |
ш |
щ |
ъ |
ы |
ь |
э |
ю |
я |
№ |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
м |
а |
т |
е |
м |
а |
т |
и |
к |
у |
|
у |
ж |
е |
|
з |
а |
т |
е |
м |
|
у |
ч |
и |
т |
ь |
|
н |
а |
д |
о |
, |
|
ч |
т |
о |
… |
12 |
0 |
18 |
5 |
12 |
0 |
18 |
8 |
10 |
19 |
|
19 |
6 |
5 |
|
7 |
0 |
18 |
5 |
12 |
|
19 |
23 |
8 |
18 |
28 |
|
13 |
0 |
4 |
14 |
|
|
23 |
18 |
14 |
|
з |
л |
т |
в |
з |
л |
т |
г |
е |
у |
|
у |
а |
в |
|
б |
л |
т |
в |
з |
|
у |
ч |
г |
т |
ь |
|
и |
л |
с |
й |
, |
|
ч |
т |
й |
… |
Любой метод вскрытия шифра простой однобуквенной замены основан на том обстоятельстве, что с точностью до переобозначений частотные характеристики m-грамм шифртекста и открытого текста одинаковы. При этом существенно используются априорные частотные характеристики предполагаемого открытого текста, получаемые с учетом «характера переписки». Такие характеристики являются более «рельефными» для литературных текстов и менее «рельефными» для формализованных электронных текстов. Чем менее рельефно распределение знаков текста, тем сложнее задача вскрытия шифра простой замены. Для открытых текстов с «почти равномерным» распределением знаков эта задача становится практически не решаемой (см. Алферов и др. «Криптографические методы защиты информации», п. 5.2).
Далее мы будем решать задачу вскрытия простой замены лишь при условии, что предполагаемые открытые тексты — это литературные тексты. Кроме того, мы будем считать, что при дешифровании мы располагаем достаточно большим числом знаков шифртекста. чтобы опираться на «статистику».
Алгоритм вскрытия простой замены по тексту криптограммы достаточно сложно формализовать. При любой попытке формализации теряется какой-нибудь важный нюанс. Поэтому мы укажем лишь основные идеи, лежащие в основе такого алгоритма. Обычно выделяют следующие этапы алгоритма: