Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Задания / Лаба_4

.docx
Скачиваний:
58
Добавлен:
09.05.2019
Размер:
342.14 Кб
Скачать

ЛАБОРАТОРНАЯ РАБОТА № 4

«ЗАДАЧИ КОДИРОВАНИЯ СООБЩЕНИЙ. КОД ШЕННОНА-ФАНО»

Цель лабораторной работы: приобрести навыки и умений применения кода Шеннона-Фано.

Методические указания к выполнению лабораторной работы.

Кодированием называют отображение состояние одной системы с помощью состояния некоторой другой. Наиболее простым способом кодирования является способ, когда обе системы X и Y (отображаемая и отображающая) имеют конечное число возможных состояний. С точки зрения теории информации кодирование есть процесс сопоставления элементов алфавита цифрам.

Коды различают по числу элементарных символов (сигналов), из которых формируются сигналы, т.е. по числу возможных состояний системы Y. В частности, в азбуке Морзе применяют следующие символы: точка, тире, короткая пауза, длинная пауза. Символы кодов могут переданы в различных формах: световые вспышки, электрические токи различной длительности, звуковые сигналы. Код с двумя элементарными символами (0,1) называют двоичным. Их широко применяют в современных информационных системах.

Русский алфавит может быть закодирован в десятичной позиционной системе счисления путем нумерации букв подряд. Пример такой нумерации приведен в таблице 1. В свою очередь каждое десятичное число может быть переведено в пятиразрядный двоичный код. Сформулированные рассмотренные простые правила возможны для кодирования текстовых сообщений на русском языке.

Таблица 1– Русский алфавит (азбука) со знаками препинания

Следующий шаг в решении задачи кодирования относится к поиску такого правила, чтобы на одну букву алфавита приходилось меньше элементарных символов кода. Например, чтобы часто встречающиеся буквы алфавита кодировались меньшим числом символов кода по сравнению с редко встречающимися буквами.

Частоты букв русского алфавита в тексте приведены в таблице 2. Используя данные таблицы можно составить такой наиболее экономичный код, у которого каждый элементарный символ передает максимальную информацию. Для этого необходимо, чтобы элементарные символы в закодированном тексте встречались в среднем одинаково часто.

Таблица 2 – Частоты букв в русском тексте

Такому требованию отвечает алгоритм кодирования Шеннона-Фано. Алгоритм Шеннона-Фано получения близкого к эффективному бинарного кода состоит в том, что расположенные в порядке убывания буквы алфавита делятся на две группы по возможности равной суммарной (в каждой группе) вероятности. Для первой группы символов на первом месте комбинации ставят 0 в качестве первой крайней слева позиции кодовых слов, а элементы второй – 1 .Далее каждая группа снова делится на подгруппы по тому же правилу примерно равных вероятностей и в каждой подгруппе заполняется вторая слева позиция кодового слова (0,1).

Процесс повторяется до кодирования всех элементов алфавита. Код Шеннона-Фано приведен в таблице 3. При кодировании нет необходимости отделять друг от друга буквы специальным символом, т.к. и без этого декодирование выполняется однозначно.

Таблица 3 – Код Шеннона-Фано

Порядок выполнения работы

  1. Перевести русский алфавит со знаками препинания в пятизначный двоичный код.

  2. Закодировать ФИО выполняющего лабораторную работу с помощью двоичного кода и пробелов.

  3. Закодировать ФИО выполняющего лабораторную работу с помощью кода Шеннона-Фано.

  4. С помощью кода Шеннона-Фано расшифровать сообщения:

– 10100001 100110010110110110;

– 01110100001101000110110110000

0110100011111111100110100

1100001011111110101100110;

– 10111010101111101001000111001.

  1.  Провести кодирование по методу Шеннона-Фано двухбуквенных комбинаций, когда алфавит состоит из двух букв А и Б, имеющих вероятности Р(А)=0,8 и Р(Б)=0,2.

  2. Оформить отчет и сдать его преподавателю.

Контрольные вопросы

  1. Для каких целей применяют кодирование информации?

  2. Укажите недостатки кода Шеннона-Фано.

  3. Чему равна энтропия на одну букву русского алфавита?

  4. Можно ли пропускную способность канала передачи информации характеризовать энтропией?

  5. Какое количество символов можно закодировать с помощью восьмиразрядного двоичного числа?

  6. Как называется универсальная система кодирования текстовых данных и какое число разрядов в ней применяется?

  7. Каким образом кодируется звуковая информация?

  8. Какие принципы применяются для кодирования графических данных?

Список использованных источников

  1. Душин В.К.Теоретические основы информационных процессов и систем: Учебник.-2-е изд. Издательско-торговая корпорация «Дашков и К°»,2006-348 с.

  2. Вентцель Е.С. Теория вероятностей. М.: Высшая школа,1969. – 576 с.

Соседние файлы в папке Задания