1.2 Описание лабораторного макета
Лабораторный макет представляет собой программный пакет обладающий следующими функциями:
- проводить оценку статистических и информационных характеристик дискретных источников информации (для источников с наличием и отсутствием зависимости между соседними символами);
- моделирование дискретного постоянного источника информации (ДПИ) и дискретного источника информации с помощью цепи Маркова первого, второго и третьего порядка;
- кодирование и декодирование сообщений источника неравномерным посимвольным кодом Шеннона-Фано, Хафмена
- кодирование и декодирование сообщений источника алгоритмом арифметического кодирования;
- кодирование и декодирование сообщений методами учитывающими взаимозависимость соседних символов («Стопка книг», LZ, LZW).
1.3 Порядок выполнения работы
Перед началом работы задайте программе каталог в который будут помещаться результаты работы.
Провести исследование дискретного источника с помощью модели ДПИ (не учитывающей взаимозависимость символов).
Загрузите заданный преподавателем анализируемый текстовый файл.
Приняв длину символов источника равной одной букве, оценить вероятности появления символов и информационный характеристики источника. Результат занести в отчет (таблица 1.2).
Повторить эксперимент п.п. 2.2 приняв длину символов источника равной двум, трем, четырем буквам. Результат занести в отчет, таблицу заполнить для 10-ти наиболее чаше встречаемых комбинаций.
Повторить эксперимент п.п. 2.2 приняв длину символов источника равной одному биту. Результат занести в отчет.
Сравнить результаты и сделать выводы.
Таблица 1.2
i |
xi |
Pi |
I(xi) |
1 |
|
|
|
2 |
|
|
|
.. |
|
|
|
H(X) =
H1(X) =
Hmax(X) = log(N) =
r= (Hmax(X) - H(X))/Hmax(X) =
Провести исследование дискретного источника с помощью модели учитывающей взаимозависимость символов (цепь Маркова 1-го и выше порядка).
Загрузите заданный преподавателем анализируемый текстовый файл.
Приняв связность цепи Маркова равной единице, оценить условные вероятности появления символов и информационный характеристики источника. Результат занести в отчет (таблица 1.3), таблицу заполнить для двух значений yj соответствующих наиболее чаше встречающимся символам.
Таблица 1.3
I |
xi |
yj= |
yj= |
||
P(xi|yj) |
I(xi|yj) |
P(xi|yj) |
I(xi|yj) |
||
1 |
|
|
|
|
|
2 |
|
|
|
|
|
.. |
|
|
|
|
|
H(X|yj) |
|
|
H(X|Y) =
H1(X|Y) =
Hmax(X|Y) = log(N) =
r = (Hmax(X|Y) - H(X|Y))/Hmax(X|Y) =
Повторить эксперимент п.п. 3.2 приняв связность цепи Маркова равной двум, трем. Результат занести в отчет заполнив таблицы 5.4 и 5.5 аналогично предыдущему пункту.
Таблица 1.4
i |
xi |
yz= |
yz= |
||
P(xi|yz) |
I(xi|yz) |
P(xi|yz) |
I(xi|yz) |
||
1 |
|
|
|
|
|
2 |
|
|
|
|
|
.. |
|
|
|
|
|
H(X|yz) |
|
|
H(X|YZ) =
H1(X|YZ) =
Hmax(X|YZ) = log(N) =
r = (Hmax(X|YZ) - H(X|YZ))/Hmax(X|YZ) =
Таблица 1.5
i |
xi |
yzw= |
yzw= |
||
P(xi|yzw) |
I(xi|yzw) |
P(xi|yzw) |
I(xi|yzw) |
||
1 |
|
|
|
|
|
2 |
|
|
|
|
|
.. |
|
|
|
|
|
H(X|yzw) |
|
|
H(X|YZW) =
H1(X|YZW) =
Hmax(X|YZW) = log(N) =
r = (Hmax(X|YZW) - H(X|YZW))/Hmax(X|YZW) =
Сравнить результаты и сделать выводы.
Моделирование дискретного постоянного источника информации (без учета взаимозависимости символов сообщения).
Загрузите файл с параметрами источника полученный в результате выполнения п.2.2.
Задайте длину сообщения, генерируемую источником равною 1 000 символов.
Получите три реализации сообщения с помощью модели источника, сохраните каждое из сообщений в отдельный файл.
Проанализируйте полученные сообщения согласно методике описанной в п.2.2.
Повторить эксперимент для других значений длины символов источника.
Моделирование дискретного источника информации с учетом взаимозависимости символов сообщения.
Загрузите файл с параметрами источника полученный в результате выполнения п.3.2.
Задайте длину сообщения, генерируемую источником равною 1 000 символов.
Получите три реализации сообщения с помощью модели источника, сохраните каждое из сообщений в отдельный файл.
Проанализируйте полученные сообщения согласно методике описанной в п.3.2.
Повторить эксперимент для других значений связности цепи Маркова.
Используя архиватор, заархивируйте исходный файл, заданный преподавателем и файлы с сообщениями полученный в п.4 и п.5 каждый в отдельный архив. Измерьте длину полученных файлов, определите коэффициент сжатия, результаты занесите в отчет, сделайте выводы.