- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
2.3. Пиксели, разрешение, размер изображения
И
зображение
на экране состоит из маленьких ячеек.
Каждая из них может иметь определенный
цвет. Такая ячейка получила название
пикселя
(pixel
(от
PICture ELement)).
Совокупность пикселов составляет
матрицу
и образует изображение на экране. В
зависимости от модели монитора параметры
матрицы в пикселях могут изменяться:
640х480, 800х600, 1024х768, 1600х1200...
Величина матрицы не влияет на физический размер экрана и не зависит от него. Чем больше матрица на одном и том же экране, тем размер ячейки меньше, а, стало быть, качество изображения лучше.
Возьмём фотографию. Конечно, она тоже состоит из маленьких элементов, но будем считать, что отдельные элементы мы рассмотреть не можем и она представляется для нас, как реальная картина природы:
Теперь разобьём это изображение на маленькие квадратики и каждый закрасим цветом, преобладающем в нём (на самом деле программы при оцифровке генерируют некий "средний" цвет, то есть если у нас была одна чёрная точка и одна белая, то квадратик будет иметь серый цвет):
Изображение стало состоять из конечного числа квадратиков определённого цвета - пикселей. Занумеруем цвета так, что каждый пиксел на рисунке стал иметь определённый цвет, обозначенный цифрой. Теперь пойдём по порядку слева направо и сверху вниз и будем в строчку выписывать номера цветов встречающихся пикселов. Получится строка примерно следующего вида:
212 45 67 45 127 4 78 245 34 ...
Из таких строк и состоит матрица изображения - это и есть наши оцифрованные данные. Теперь этими данными графический редактор может манипулировать, их можно сжать и сохранить в файл.
2.4. Цветовая глубина
Изображение характеризуется максимальным числом цветов, которые могут быть в нем использованы, то есть иметь различную глубину цвета.
Есть ряд способов кодирования цвета, которые разделяются на 2 основные группы: индексированные (с палитрой) и полноцветные. Идея индексированных растров в том, что номер цвета на самом деле является номером "краски", которой закрашен данный пиксел. Поэтому кроме самих цветов пикселов программе необходимо также знать и "палитру" из которой эти цвета выбираются. Этот способ похож на методы настоящего художника, но не очень хорошо подходит для обработки на компьютере, так как программе кроме самих пикселов приходится мучаться ещё и с палитрой, подбирая наиболее подходящие цвета. И второй метод состоит в том, что по номеру цвета мы можем непосредственно определить сам цвет. Однако, и тут есть ветвление. Для этого был придуман ряд цветовых моделей - Grayscale, RGB, CMYK, L*a*b и другие (цветовые модели рассмотрим позже).
2.5. Типы изображений
Существуют типы изображений с различной глубиной цвета, некоторые типы изображений имеют одинаковую глубину цвета, но различаются по цветовой модели. Тип изображения определяется при создании документа.
Индексированные цвета
Чёрно-белое (бинарное) изображение. Вообще, это частный случай индексированного цвета. Но из-за особенностей выразительного характера его выделяют в отдельную группу. В подобном изображении могут быть только 2 цвета - чёрный и белый, кодируемые соответственно 0 и 1. Глубина изображения составляет в данном случае 1 бит. Эта глубина очень плохо подходит к представлению фотореалистичных образов и применяется лишь для специализированных изображений.
Индексированное (палитровое) изображение. Тут, в отличие от черно-белого режима палитра побогаче. Как правило, графические редакторы поддерживают палитру от 2 (необязательно чёрного и белого) до 256 цветов. Количество цветов в палитре определяет два взаимнопротивоположных параметра - качество изображения и его размер.
-
6 цветов
8 цветов
16 цветов
Приглядевшись к этим изображениям, Вы увидите, как постепенно улучшается качество, но и увеличивается размер - 9, 13 и 32 Кб соответственно. Глубина изображения при этом определяется двоичным логарифмом количества цветов в палитре, округлённым в сторону большего целого. Например, для 6 цветов - 3 бита, для 8 - тоже 3 бита, для 16 - 4 бита и для 256 - 8 бит.
Непрерывный цвет
Полутоновый ( в градациях серого, Grayscale). Тут мы берём чёрный цвет за 0, белый за 255, а промежуточные оттенки обозначаются соответствующими цифрами. Например - 68 этот цвет, более близкий к чёрному (тёмно серый). При этом уже намного удобнее проводить математические операции над изображением, так как по цвету можно напрямую определить его номер. Глубина изображения - 8 бит.
Полноцветный. Как известно, любой цвет можно представить в виде смешения основных трёх цветов - красного, синего и зелёного в различных пропорциях. Этим и пользуются при использовании полноцветных изображений. На каждый канал - R, G или B (Red, Green, Blue - Красный, Зелёный или Синий) имеется свой отдельный параметр, указывающий на количество соответствующей компоненты в конечном цвете. Например - (255,64, 23) - цвет содержащий сильный красный компонент, немного зелёного и совсем немного синего. Естественно, что этот режим наиболее подходит для передачи богатства красок окружающей природы:
Но он требует и больших расходов, так как глубина цвета тут наибольшая - 3 канала по 8 бит на каждый дают 24 бита.
