
Кодирование информации
Кодирование видеоинформации еще более сложная проблема, чем кодирование звуковой информации, так как нужно позаботиться не только о дискретизации непрерывных движений, но и о синхронизации изображения со звуковым сопровождением. В настоящее время для этого используется формат, которой называется AVI (Audio-Video Interleaved – чередующееся аудио и видео). Основные мультимедийные форматы AVI и WAV очень требовательны к памяти. Поэтому на практике применяются различные способы компрессии, то есть сжатия звуковых и видео- кодов. В настоящее время стандартными стали способы сжатия, предложенные MPEG (Moving Pictures Experts Group – группа экспертов по движущимся изображениям). В частности, стандарт MPEG описывает несколько популярных в настоящее время форматов записи звука. Так, например, при записи в формате МР3 при практически том же качестве звука требуется в десять раз меньше памяти, чем при использовании формата WAV. Существуют специальные программы, которые преобразуют записи звука из формата WAV в формат МР3. Совсем недавно был разработан стандарт MPEG-4, применение которого позволяет записать полнометражный цветной фильм со звуковым сопровождением на компакт-диск обычных размеров и качества.
Интерпретация, то есть истолкование смысла одного и того же машинного кода, может быть самой разной. Один и тот же код разными программами может рассматриваться и как число, и как текст, и как изображение, и как звук. Другими словами, как именно трактуется тот или иной машинный код, определяется обрабатывающей этот код программой.
Помехоустойчивое кодирование: блочные и непрерывные коды
Решение
задачи выбора (отыскания) кода,
оптимального по тому или иному критерию,
составляет суть
теории кодирования. Заметим, что
современные методы кодирования не
позволяют близко подойти к потенциальной
пропускной способности канала связи
при одновременно высокой верности
передачи. Однако грамотный выбор кода
позволяет, во многих случаях, значительно
снизить вероятность ошибочного приема
при скорости передачи порядка %
пропускной способности канала.
В настоящее время повышение достоверности передачи в каналах с помехами, осуществляется с помощью кодов, позволяющих обнаруживать или исправлять ошибки. Такое кодирование называется помехоустойчивым. При этом избыточность кодовой последовательности выше, чем избыточность источника сообщений. Благодаря этому и оказывается возможным обнаружение и исправление ошибок приема. Цифровая связь повсеместно используется также и для передачи аналоговых (непрерывных по уровню и времени, например речь, изображение) сигналов, которые для этой цели оцифровываются (дискретизируются). Такое преобразование всегда связано с потерями, т.е. аналоговый сигнал представляется в цифровом виде с некоторой неточностью.
Оборудование, осуществляющее формирование данных из пользовательской информации, а также представление данных в виде, понятном пользователю, называется терминальным оборудованием (ООД, оконечное оборудование данных). Оборудование, преобразующее данные в форму пригодную для передачи по линии связи и осуществляющее обратное преобразование, называется оконечным оборудованием линии связи (АКД, аппаратура канала данных). Терминальным оборудованием может служить компьютер, оконечным оборудованием обычно служит модем.
Передача сигнала осуществляется символами. Каждый символ представляет собой определённое состояние сигнала в линии, множество таких состояний конечно. Таким образом, символ передаёт некоторое количество информации, обычно один или несколько бит. Число передаваемых символов в единицу времени называется скоростью манипуляции или символьной скоростью (baud rate). Она измеряется в бодах (1 бод = 1 символ в секунду). Количество информации, передаваемое в единицу времени, называется скоростью передачи информации и измеряется в битах в секунду. Существует распространённое заблуждение, что бит в секунду и бод — это одно и то же, но это верно, только если каждый символ передаёт только один бит, что бывает не очень часто.
Преобразование данных в форму пригодную для передачи по линии/каналу связи называется модуляцией.
Код — правило (алгоритм) сопоставления каждому конкретному сообщению строго определённой комбинации символов (знаков) (или сигналов). Кодом также называется отдельная комбинация таких символов (знаков) — слово. Для различия этих терминов, код в последнем значении ещё называется кодовым словом.
Пре́фиксный код в теории кодирования — код со словом переменной длины, имеющий такое свойство (выполнение условия Фано): если в код входит слово a, то для любой непустой строки b слова ab в коде не существует. Хотя префиксный код состоит из слов разной длины, эти слова можно записывать без разделительного символа.
Например, код, состоящий из слов 0, 10 и 11, является префиксным, и сообщение 01001101110 можно разбить на слова единственным образом:
0 10 0 11 0 11 10
Код, состоящий из слов 0, 10, 11 и 100, префиксным не является, и то же сообщение можно трактовать несколькими способами.
0 10 0 11 0 11 10
0 100 11 0 11 10
Так называемые «префиксы» могут быть получены путём последовательного отбрасывания последнего знака кодовой комбинации. Например, для кодовой комбинации 11101101 префиксами будут 11101101, 1110110, 111011, 11101, 1110, 111, 11, 1.
Если промежутков или других знаков препинания между кодовыми комбинациями нет, то для однозначного декодирования комбинации 111011101 ни одна из кодовых комбинаций не может быть представлена перечисленными вариантами (префиксами). Код называется префиксным, если ни одна из его комбинаций не является префиксом другой комбинации того же кода. Часть кодовой комбинации, которая дополняет префикс до самой комбинации, называется суффиксом. Префиксные коды наглядно могут быть представлены с помощью кодовых деревьев. Если ни один узел кодового дерева не является вершиной данного кода, то он обладает свойствами префикса. Узлы дерева, которые не соединяются с другими, называются конечными. Комбинации, которые им соответствуют, являются кодовыми комбинациями префиксного кода.
Любой код со словом фиксированной длины, очевидно, является префиксным. Рассмотрим несколько нетривиальных примеров.
Телефонные номера в стационарных сетях.
UTF-8.