- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
TwinVq-кодирование
TwinVQ (Transform-domain Weighted Interleave Vector Quantization – векторное квантование с трансформными доменами и взвешенным чередованием) – новая технология компрессии звука, разработанная в NTT Human Interface Laboratories (Япония).
TwinVQ, также как и MP3, AAC или AC-3, является трансформным методом кодирования. Он использует некоторые инструменты AAC, такие, как межкадровое обратное предсказание, однако собственно кодирование музыки отличается в корне. В этом методе отдельные биты музыкальных данных не кодируются напрямую, а комбинируются в сегменты "шаблонов" (паттернов). Эти паттерны сравниваются со стандартными паттернами, генерирующимися в процессе кодирования/декодирования, затем выбирается наиболее близкий к оригиналу стандартный паттерн, и в качестве кода сжатия передается число, соответствующее этому паттерну. Искажения при кодировании минимальны даже при низких битовых диапазонах, что позволяет успешно регенерировать музыку и прочие звуки довольно близко к оригиналу. Технология TwinVQ должна была использоваться в разрабатываемом стандарте MPEG-4. Но тем не менее, для кодирования звука в стандарте MPEG-4 принят формат MP3.
TwinVQ был разработан для более мощных процессоров, чем MP3, поэтому для достижения такого сжатия он использует больших процессорных мощностей. Кодирование vqf-файла (это стандартное расширение для TwinVQ файлов) – достаточно медленный процесс. Даже если кодер является MMX-оптимизированным, при использовании максимального качества время кодирования примерно в 3 раза больше, чем кодирование MP3. Для достижения компрессии в реальном времени музыки с CD-качеством и максимальным качеством кодера требуется не меньше, чем P2-600! Процесс декодирования также немного более требователен к скорости процессора, чем MP3, однако проигрывание vqf в реальном времени вполне возможно на P-100. Но всё же желателен процессор не менее Pentium 233MMX.
Качество звука vqf-файла 96 Кбит/с в режиме высокого качества выше, чем качество MP3 128 Кбит/с, также в режиме высокого качества. Это означает, что в данном стандарте можно хранить высококачественные аудиофайлы со сжатием 1:15. Следовательно, на одном CD-ROM'е можно поместить 15 часов высококачественного стереозвука. Если вы хотите использовать высокие степени сжатия, TwinVQ действительно лучше, чем MP3. Как видно на иллюстрациях, в то время, как в mp3 присутствуют заметные издержки компрессии, звук vqf-файла "смягчен", то есть звучит он приятнее, чем MP3. Но при этом надо рассчитывать на то, что время кодирования в этот формат будет достаточно заметным даже на мощных компьютерах.
|
Частотное (параллельное) маскирование
Заключается в том, что постоянно звучащий синусоидальный сигнал маскирует или "заглушает" более тихие близко лежащие на оси частот сигналы и маскирует другие синусоидальные сигналы, имеющие близкие частоты и много меньшие амплитуды. Причем маскируются в основном близкие по частоте звуки.
Временное (последовательное) маскирование
Воспроизводим 1 kHz маскирующий тон на уровне 60 dB, и тестовый тон с частотой 1.1 kHz на уровне 40 dB. Тестовый тон не слышен (он замаскирован).
Отключаем маскирующий тон, затем, после небольшой задержки, отключаем тестовый тон.
Уменьшаем время задержки до тех пор, пока тестовый тон еще слышен (например, 5 ms).
Повторяем, используя различную громкость тестового тона, и получаем:
Общий эффект от частотного и временного маскирования:
