
- •1.Представление изображений в ис. Типы изображений, пикселы, разрешение, размер изображений, цветовые модели, форматы файлов.
- •2.Предварительная обработка изображений – точечные операции: соляризация, линейное контрастирование, препарирование, пороговая обработка.
- •3. Гистограммы и их преобразования (Преобразование гистограмм, эквализация).
- •4. Представление цвета в изображениях. Цветовые модели.
- •5. Линейные фильтры и свертки. Сглаживание через усреднение, сглаживание с помощью гауссиана.
- •6. Медианная фильтрация
- •7. Обнаружение границ. Градиент изображения, оператор Робертса, оператор Собела.
- •8. Методы сегментации изображений (зачем, как).
- •9. Машинный анализ и распознавание объектов. Выделение признаков. Типы признаков. Инвариантность признаков.
- •10. Распознавание изображений.
- •11. Методы сжатия изображений: классификация, метод rle, lzv.
- •12. Методы сжатия изображений: классификация метод Хаффмана.
- •13. Представление и сжатие изображений: пирамидальное представление, метод квадрантов, цепное кодирование.
- •15. Аппаратные средства мультимедиа технологий.
- •16. Кино и видео форматы изображения: форматы, принципы реализации.
11. Методы сжатия изображений: классификация, метод rle, lzv.
Алгоритмы сжатия можно разделить на две категории: симметричные и асимметричные. При симметричном сжатии время, затрачиваемое на кодирование и декодирование данных, примерно одинаково, а алгоритмы, применяемые при этом, достаточно близки. При асимметричном сжатии в одном направлении (обычно при кодировании) расходуется значительно больший объем машинного времени, чем в другом. Сжатие без потерь (lossless) подразумевает, что восстановленные после сжатия данные будут полностью (с точностью до бита) идентичны исходным. Сжатие с потерями (lossy) применяется только для сжатия мультимедийной информации (в основном, изображений и звуковых файлов) и означает, что восстановленные после сжатия данные не будут соответствовать исходным. LZW - метод сжатия (графических изображений), основанный на алгоритме поиска одинаковых последовательностей во всем файле. Сжатие в RLE происходит за счет замены цепочек одинаковых байт на пары "счетчик, значение".
12. Методы сжатия изображений: классификация метод Хаффмана.
Метод кодирования Хаффмана - метод сжатия данных, основанный на использовании относительной частоты встречаемости индивидуальных элементов. Часто встречающиеся элементы кодируются более короткой последовательностью битов. Кодирование Хаффмана имеет высокую эффективность при относительно равномерном распределении уровней пикселей.
13. Представление и сжатие изображений: пирамидальное представление, метод квадрантов, цепное кодирование.
Пирамидальная техника: Итерационная субдискретизация (блок пикселей заменяется одним пикселем с усредненным значением, получившееся изображение опять разбивается на блоки, заменяемые одним пикселом, и т.д.); в итоге, получаем одно значение (усредненный уровень серого). Получаемые (и хранимые) «разностные» изображения, в которых значение каждого пиксела равны разнице между реальным и усредненным по блоку значениями, позволяют восстановить оригинальное изображение. Своего рода обобщение иерархического блочного кодирования Естественный подход для постепенного (progressive) отображения (передачи) графики: сначала отображение в плохом разрешении, затем последовательно все в более лучшем.
14. Методы построения и принципы поиска информации в мультимедийных базах данных.
С помощью иерархической классификации изображений
При поиске пользователь использует иерархию, например:
Художественные произведения
Живопись
Россия
19-ый век
С помощью индекса признаков:
Изображения рассматриваются как документы с индексом терминов
Поиск по содержимому
Поиск по шаблону, возвращающий изображения похожие на заданное изображение, фигуру и т.д. а) Реляционное представление:
Представление изображения: идентификатор изображения и его основные свойства (атрибуты)
Представление объекта: объекты (сегменты, прямоугольники) внутри изображений; извлекаются вручную или автоматически
Атрибуты включают: id изображения, id объекта, координаты минимального ограничивающего прямоугольника, признаки
Обобщение: вероятностные отношения - объект x находится в изображении i с вероятностью p
Запросы: применять стандартную технику запросов, используя значения признаков в условиях запроса
б) Пространственное представление:
Например, с помощью R- или R*-деревьев
Построить одно R-дерево для всех изображений в базе данных
Страница, соответствующая листу, содержит близко-расположенные объекты (их MBR’ы) со списком указателей на исходные изображения
Также сохранены дополнительные свойства (признаки) объекта
Для не пространственных свойств объектов может быть построен отдельный индекс