- •9.1 Примеры непрерывных и дискретных сообщений. Дискретизация по времени и по уровню
- •9.4 Первичное кодирование дискретизированных звуковых сообщений и изображений
- •10. 1 Структура и основные параметры модели информационной модели передачи непрерывных сообщений
- •10.2 Пропускная способность непрерывного канала с помехами и без помех
- •10.3 Трехмерная модель емкости канала и объема сигнала
- •11.1. Спектры периодических сигналов: одиночной гармоники, произвольного периодического сигнала, апериодического сигнала
- •11.5. Особенности восприятия звука человеком (ограниченность спектра, зависимость чувствительности от громкости, восприятие тишины и маскирование).
- •11.6 Основные приемы сжатия звука, используемые в методе сжатия mp3.
- •12.3 Препроцессинг изображений в рамках блочного метода jpeg: переход к цветоразностному представлению, разбиение на блоки, прореживание
- •12.4 Обработка изображения с использованием спектрального преобразования в рамках блочного метода jpeg: выполнение дкп, огрубление матрицы коэффициентов.
- •13.2 Обзор проблем передачи импульсных сигналов: затухание сигналов с уменьшением их длительности, межсигнальная интерференция, потеря синхронизации
- •13.3 Особенности импульсных сигналов, используемых для передачи: биполярный nrz-сигнал, биполярный rz-сигнал, манчестерский сигнал, псевдотроичный сигал
- •15.2 Особенности временного разделения: схема и основные понятия временного разделения, влияние на спектр сигналов, практическое применение
- •15.3 Особенности кодового разделения: примеры, требования к несущим последовательностям, матрицы Адамара, преимущества кодового разделения
9.4 Первичное кодирование дискретизированных звуковых сообщений и изображений
Первичное кодирование звука
Первичное кодирование звуковых сигналов предусматривает их дискретизацию по времени с выбором частоты дискретизации в зависимости от требований к качеству звучания и на основании правила Найквиста.
Так, при дискретизации музыки исходят из максимального частотного диапазона, который воспринимает человеческое ухо. Для fmax = 20 кГц частота дискретизации fd = 1,1 х 2 х fmax = 44 кГц. При более скромных требованиях к качеству воспроизведения звука используют меньшие значения fd – например, 22 и даже 11 кГц. Для дискретизации голосового сигнала в цифровой телефонии учитывают верхнюю границу диапазона частот, при котором человеческая речь гарантированно разборчива. Экспериментально установлено, что она составляет около 3 кГц. При этом в Европе принят стандарт fmax=3,4 кГц. С учетом этого частота дискретизации речевого сигнала составляет fd = 8 кГц (≈3.4х2х1,17).
Кодирование звуковых отсчетов также выполняется с учетом требований к качеству звучания. Для речевых сигналов используется 1 байт кода на отсчет. Для музыки соответствующая точность оказывается недостаточной. Поскольку первичный код по длине кратен байту, здесь используют явно избыточную длину 2 байта на отсчет.
В) Первичное кодирование изображений
Первичное кодирование изображений опирается на первоначальное представление изображения в виде матрицы цветных точек (пикселей). Такая матрица называется растром.
Разрешение растра (количество строк и столбцов) определяется как правило не столько требованиями к качеству, сколько техническими ограничениями: параметрами компьютерных мониторов, сканеров, фото- или видеокамер. В частности, - размерами фоточувствительных или цветопередающих элементов.
Кодирование цвета выполняется исходя из того, что любой оттенок можно создать наложением трех цветов: красного (Red), зеленого (Green) или голубого (Blue) при соответстующих пропорциях их яркости. Наиболее простой и распространенный способ заключается в том, что яркость каждой из трех цветовых составляющих кодируется одним байтом. При этом полное количество передаваемых оттенков составляет N=2 24 (около 16 миллионов). Такая точность цветопередачи безусловно достаточна для человеческого зрения.
10. 1 Структура и основные параметры модели информационной модели передачи непрерывных сообщений
Передача сигнала – это физический процесс, который по своей природе является непрерывным во времени. Поэтому для анализа информационных процессов на уровне сигналов уместно рассмотреть модель передачи непрерывных сообщений. Такая модель (разработанная Клодом Шенноном) основана на тех же подходах, что и знакомая нам информационная модель передачи дискретных сообщений (рис.13.1).
Рис.13.1. Информационная модель канала передачи непрерывных сообщений
Общность моделей Шеннона проявляется в том, что непрерывная зависимость X(t) представляется как предел дискретной последовательности значений xi, для которой шаг Δx дискретизации по уровню стремится к нулю. Cоответственно, объем алфавита n→∞ (в модели дискретного канала мы рассматривали случай, когда n=2).
При этом скорость передачи определяется шагом Δt дискретизации по времени (согласно правилу Найквиста vx = 2fm).
Напомним, что количество информации, приходящееся на один отсчет сигнала, в общем виде определяется формулой
Ixy = Hx - Hx/y (13.1)
При этом, если в канале отсутствуют помехи, max {Ixy} = log2n. Очевидно, что при n→∞ информационная емкость отсчета также неограниченно возрастает. Соответственно, пропускная способность непрерывного канала без помех C = vx max{ Ixy } оказывается бесконечно большой.
При наличии помех в формуле (13.1) возрастает одновременно энтропия источника Hx, и энтропия канала Hx/y. В результате пропускная способность канала оказывается ограниченной. Она определяется (в бит/c) формулой Шеннона:
C = fm [ 1+ log2(Px/ Pe)] (13.2)
Не вдаваясь в подробности вывода формулы, отметим, что она получена для случая помехи типа “белый шум”. Особенность этой помехи – равномерность распределения ее мощности во всей полосе частот канала. Такая помеха создает наибольшие трудности при распознавании сигналов и потому пропускная способность определяется именно по отношению к ней.
Как видно, пропускная способность непрерывного канала определяется двумя факторами: шириной fm полосы частот канала и превышением мощности полезного сигнала по отношению к мощности помехи Px/ Pe.
Увеличение fm позволяет пропорционально увеличивать скорость передачи отсчетов. Однако, в силу особенностей помехи “белый шум” мощность последней пропорциональна ширине полосы частот (Pe = pe fm, где pe – удельная мощность помехи в расчете на 1 Гц полосы частот). Таким образом, расширение полосы частот fm приводит к уменьшению Px/ Pe, что проявляется в росте количества ошибок и тем самым ограничивает рост пропускной способности канала.
