
- •Особенности изображения как типа данных
- •Классы изображений
- •Алгоритм rle
- •Характеристики алгоритма rle:
- •Алгоритм lzw
- •Характеристики алгоритма lzw:
- •Проблемы алгоритмов сжатия с потерями
- •Алгоритм jpeg
- •Алгоритм jpeg 2000
- •Характеристики фрактального алгоритма:
- •Рекурсивный (волновой) алгоритм
- •Общая схема алгоритма
- •16Cif и отдельно настраиваемые разрешения.
- •Подходы к сжатию звуковых сигналов. Форматы кодирования цифрового звука икм, дикм, адикм, дельта-модуляция.
- •Особенности восприятия звука человеком. Порог слышимости. Спецификация mpeg-1
Особенности восприятия звука человеком. Порог слышимости. Спецификация mpeg-1
Область слышимых человеком звуков в диапазоне 20-20000 Гц ограничивается по интенсивности порогами: снизу — слышимости и сверху — болевых ощущений.
Порог слышимости оценивается минимальным давлением, точнее, минимальным приращением давления относительно границы чувствителен к частотам 1000-5000 Гц — здесь порог слышимости самой низкий (звуковое давление около 2- 10 Па). В сторону низших и высших звуковых частот чувствительность слуха резко падает.
Порог болевых ощущений определяет верхнюю границу восприятия звуковой энергии и соответствует примерно интенсивности звука 10 Вт/м или 130 дБ (для опорного сигнала с частотой 1000 Гц).
При увеличении звукового давления увеличивается и интенсивность звука, причем слуховое ощущение нарастает скачками, называемыми порогом различения интенсивности. Число этих скачков на средних частотах примерно 250, на низких и высоких частотах оно уменьшается и в среднем по частотному диапазону составляет около 150.
Поскольку диапазон изменения интенсивностей 130 дБ, то элементарный скачок ощущений в среднем по диапазону амплитуд равен 0,8 дБ, что соответствует изменению интенсивности звука в 1,2 раза. При низких уровнях слуха эти скачки достигают 2-3 дБ, при высоких уровнях они уменьшаются до 0,5 дБ (в 1,1 раза). Увеличение мощности усилительного тракта меньше чем в 1,44 раза практически не фиксируется ухом человека. При более низком звуковом давлении, развиваемом громкоговорителем, даже двукратное увеличение мощности выходного каскада может не дать ощутимого результата.
Существование порога слышимости дает основу для построения методов сжатия звука с потерями. Можно удалять все сэмплы, величина которых лежит ниже этого порога. Поскольку порог слышимости зависит от частоты, кодер должен знать спектр сжимаемого звука в каждый момент времени. Для этого нужно хранить несколько предыдущих входных сэмплов (обозначим это число п — 1; оно или фиксировано, или задается пользователем). При вводе следующего сэмпла необходимо на первом шаге сделать преобразование п сэмплов в частотную область. Результатом служит вектор, состоящий из т числовых компонент, которые называются сигналами. Он определяет частотное разложение сигнала. Если сигнал для частоты / меньше порога слышимости этой частоты, то его следует отбросить.
Кроме того, для эффективного сжатия звука применяются еще два свойства органов слуха человека. Эти свойства называются частотное маскирование и временное маскирование.
Частотное маскирование (его еще называют слуховое маскирование) происходит тогда, когда нормально слышимый звук накрывается другим громким звуком с близкой частотой.
11:43:52
Временная маскировка: Это явление похоже на частотную маскировку, но здесь происходит маскировка во времени. При прекращении подачи маскирующего звука маскируемый некоторое время продолжает быть не слышимым. В обычных условиях эффект от временной маскировки длится значительно меньше. Время
маскировки зависит от частоты и амплитуды сигнала и может достигать 100 мс.
Временное маскирование происходит, когда громкому звуку А частоты / по времени предшествует или за ним следует более слабый звук В близкой частоты. Если интервал времени между этими звуками не велик, то звук В будет не слышен. Рис. 6.6 иллюстрирует пример временного маскирования. Порог временного маскирования от громкого звука в момент времени 0 идет вверх сначала круто, а потом полого. Более слабый звук в 30 дБ не будет слышен, если он раздастся за 10 млсек до или после громкого звука, но будет различим, если временной интервал между ними будет больше 20 мсек
MPEG-1 AudioLayer I (слой 1) рекомендуется для применения в профессиональной области, в системах записи-перезаписи с высоким студийным качеством с достаточной ёмкостью памяти. Он характеризуется небольшой сложностью и невысокой степенью редукции аудиоданных.
MPEG-1 layer I также использовался в Digital Compact Cassette, как часть аудиокодека PASC (англ. Precision Adaptive Sub-band Coding — прецизионное адаптивное полосное кодирование). В связи с необходимостью передачи постоянного потока отдельных блоков данных (кадров) на ленточный носитель, в PASC использовался дополнительный бит в MPEG заголовке для определения начала кадра. Битрейт всегда 384 кбит/с.[6]