- •1. Краткая история развития теории и техники цос
- •3. Дискретизация речевого сигнала
- •4. Прореживание и интерполяция дискретизированного сигнала.
- •5. Скалярное квантование речевого сигнала.
- •6. Векторное квантование речевого сигнала.
- •7. Гомоморфная обработка речи.
- •8. Дискретное косинус-преобразование
- •9 Виды избыточности речевого сигнала.
- •10. Структура кодера для компрессии звуковых сигналов.
- •11. Психоакустическая модель слуховой системы в частотной области
- •1.Спектральный анализ и нормализация уровня звукового давления сигнала.
- •12. Искажения звука при сжатии аудиоданных
- •13. Методы повышения качества и разборчивости речи
- •14 Сжатие аудиосигнала на основе стандарта mp3
- •15. Субъективные методы
- •16. Психоакустические методы оценки качества
- •17. Объективные методы оценивания качества воспроизведения речи
- •18. Типы изображений
- •19. Избыточность изображений
- •Статистическая избыточность изображений
- •Визуальная избыточность изображений
- •20. Дискретизация непрерывных изображений
- •21. Квантование изображений
- •22. Препарирование изображений
- •23. Фильтрация изображений. Оптимальная линейная фильтрация
- •24. Масочная фильтрация изображений
- •25. Медианная фильтрация изображений
- •26. Применение фильтра Винера для некаузальной двумерной фильтрации
- •27. Сглаживание цветных изображений
- •28. Особенности зрительного анализатора. Свойства системы зрения человека
- •29. Порядок операций при компрессии изображений
- •30. Двумерное дискретно-косинусное преобразование изображений
- •31. Стандарт сжатия jpeg 2000 и система roi.
- •32. Алгоритм сжатия jpeg 2000 и его отличия от jpeg
- •33. Особенности сжатия видеоданных в формате mpeg
- •34. Структура потока данных mpeg
- •36. Методы и средства компьютерной обработки звуков и изображений
- •37. Интегральноевейвлет-преобразование речи и изображений
- •38. Дискретноевейвлет-преобразование речи и изображений
- •39. Критерии оценивания качества воспроизведения изображений. Мультиразмерная ошибка
- •40. Критерии оценивания качества воспроизведения изображений. Индекс качества изображения
- •41. Критерии оценивания качества воспроизведения изображений. Мера качества видео на основе дискретного косинусного преобразования.
- •42. Критерии качества восстановления изображений
12. Искажения звука при сжатии аудиоданных
С практической точки зрения ни сигналы, ни реализуемые узкополосные фильтры не имеют строго ограниченной полосы. Следовательно, всегда имеет место некоторое перекрытие соседних частотных полос, что приведет к неизбежным искажениям при восстановлении непрерывного сигнала. Для устранения нежелаемого временного эффекта наложения, называемого aliasing (явление, являющееся результатом недостаточной частоты выборки и сопровождаемое появлением ложных частот), окна анализа задаются выражением
.
(6.30)
В типичных методах сжатия сигнала,
параметры преобразования улучшаются
использованием оконной функции wk
(k = 0, ..., 2n-1)
которая умножается на
и
в
формулах прямого и обратного преобразования,
надлежащим образом избегая разрывов
в точках k = 0 и k=2n
(границах кадра), делая функцию равномерно
сходящейся к нулю в этих точках. В
принципе, x иX
могут иметь разные оконные функции, и
оконная функция может меняться от кадра
к кадру (особенно когда комбинируются
кадры разных размеров), но для простоты
рассматривается одинаковая оконная
функция для одинаковых размеров кадров.
Преобразование остается инвертируемым
для симметричного окна
,
пока wудовлетворяет
условию Пирса-Бредли
.
Различные оконные функции используются,
например
используется в mp3 и MPEG-2
AAC, а
используется в Vorbis. AC-3
использует окно Кайзера-Бесселя и
производное окно (KBD), и
MPEG-4 AAC может
также использовать KBD
окно.
Отметим, что оконные функции, применяемые в MДКП, отличаются от оконных функций, применяемых в других типах разложения сигнала, тем что они должны удовлетворять условию Пирса-Бредли. Одна из причин такого различия заключается в том, что оконные функции для MДКП применяются дважды: в MДКП (разложение) и в ОMДКП (синтез).
13. Методы повышения качества и разборчивости речи
Речевые сигналы, с которыми приходится иметь дело на практике, всегда в той или иной степени зашумлены. В тех случаях, когда шум имеет значительную интенсивность, его наличие может существенно исказить результаты обработки, анализа или распознавания речи. В целом ряде других случаев, например, при анализе зашумленных записей в криминалистических целях или восстановлении аудиозаписей в архивах, задача очистки сигнала от шума носит самостоятельный характер и является единственной целью работы. Поэтому разработка методов очистки сигнала от шума является весьма актуальным направлением исследований. К настоящему времени разработано очень большое количество различных методов цифровой обработки зашумленных речевых сигналов.
Основным типом шумов, для методов, представленных в обзоре, является аддитивный шум. В целях упорядочения рассмотрения методов очистки сигнала от шума целесообразно произвести их классификациюС учетом сделанного замечания можно выделить следующие группы:
- методов цифровой обработки зашумленных речевых сигналов:
- методы адаптивной компенсации помех;
- методы, основанные на использовании математических моделей речевых сигналов во временной области (например, авторегресионная модель речевого сигнала и рекуррентные алгоритмы оценки параметров и речевого сигнала);
- методы, основанные на использовании математических моделей речевых сигналов в частотной области (оценивание минимальной среднеквадратической ошибки, марковские модели сигнала и шума);
- методы, основанные на использовании спектральных характеристик шума (вычитание амплитудных спектров, Винеровская фильтрация);
- методы, основанные на использовании моделей искусственных нейронных сетей;
- методы, основанные на моделях восприятия речи человеком.
