- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
Алгоритм кодирования mpeg
Использовать фильтры-свёртки для разделения аудиосигнала на 32 частотные подполосы – фильтрация подполос.
Определить объём маскируемых соседней полосой данных для каждой полосы, используя психоакустическую модель, описанную выше.
Если данные в полосе находятся ниже порога маскировки, не кодировать эту полосу.
Иначе, определить количество бит, необходимых для представления коэффициента, такого, чтобы шум, внесённый квантованием, был меньше влияния маскирования. (Необходимо помнить, что каждый бит, сэкономленный при квантовании, вносит примерно 6 дБ шума).
Формирование потока на выходе.
Рис. 11.16. Алгоритм кодирования MPEG
Уровни mpeg
MPEG определяет 3 уровня для кодирования аудио. Общая модель одна, но сложность кодека увеличивается с каждым уровнем.
Данные разделяются на кадры, каждый из которых состоит из 384 отсчётов, по 12 отсчётов в каждой из 32 отфильтрованных подполос, см. ниже.
Рис. 11.17. Группирование отсчётов в подполосах для уровней MPEG 1, 2 и 3
Уровень 1: Фильтр, использующий дискретное косинусное преобразование с одним кадром и одинаковой частотой рассеивания в полосе. Психоакустическая модель использует только частотное маскирование. Уровень 1 обладает наименьшей сложностью и специально предназначен для использования в приложениях, где скорость кодера играет важную роль.
Уровень 2: Фильтр использует 3 кадра (предыдущий, текущий, следующий, всего используется 1152 отсчёта). Таким образом частично используется временное маскирование. Уровень 2 требует более сложной процедуры кодирования и немного более сложной декодирующей процедуры. По сравнению с Уровнем 1 ,Уровень 2 более эффективно подавляет несущественные составляющие сигнала и более эффективно применяет психоакустическую модель.
Уровень 3: Используется улучшенный фильтр критических полос (учитываются различные частоты). Психоакустическая модель включает в себя эффекты временного маскирования, учитывает избыточность стереосигнала, использует кодирование по Хаффману. Используется битовый резерв. Часто определенные фрагменты музыкального произведения не могут быть закодированы в рамках данного битового потока (битрейта) без ощутимых потерь качества. В этом случае mp3 использует небольшой запас битов, как буфер, кодируя менее сложные фрагменты в меньший битовый диапазон. Т.о., Уровень 3 является еще более сложным и разработан для приложений, требующих меньших битовых диапазонов. Его отличительные особенности – подавление несущественных составляющих сигнала и улучшенное извлечение слабо слышимых частот.
Кодирование избыточной информации в стереосигнале:
Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
Middle/Side (MS) stereo coding – кодируется средний (общий; центральный) – сумма левого и правого каналов и разностный канал, содержащий информацию об отличиях левого и правого каналов.
