- •Реферат
- •Введение
- •Постановка задачи
- •1 Аналитический обзор предметной области
- •Компьютерное зрение
- •Обзор методов детектирования объектов
- •Эмпирические методы
- •Методы характерных инвариантных признаков
- •Распознавание с помощью шаблонов, заданных разработчиком
- •Методы обнаружения лица по внешним признакам
- •Выбор алгоритма
- •Обзор методов детектирования движения
- •1.3.1 Межкадровая разность
- •1.3.2 Базовый кадр
- •1.3.3 Методы оптического потока
- •Обзор инструментальных средств для разработки программного продукта
- •Библиотека OpenCv
- •1.4.2 Среда разработки MathWorks matlab
- •1.5 Интерфейсы последовательной передачи данных
- •2 Оборудование и аппаратная реализация
- •2.1.1 Характеристики камеры
- •Передача команд по протоколу visca
- •Получение изображения с камеры
- •Работа с портом
- •3 Анализ видеоизображения. Детектор лица
- •3.1 Постановка задачи
- •3.2 Метод Виолы-Джонса
- •3.2.1 Описание алгоритма
- •3.2.2 Схема распознавания
- •3.2.3 Признаки класса
- •3.2.4 Схема обучения
- •3.2.5 Интегральное представление изображений
- •3.2.6 Обучение
- •3.2.7 Распознавание
- •3.3 Программная реализация
- •4 Анализ видеоизображения. Слежение за лицом
- •4.1Постановка задачи
- •4.2 Метод Лукаса-Канаде
- •4.2.2 Одномерный случай
- •4.2.2 Двумерный случай
- •4.2.3 Недостатки метода
- •4.3 Выбор оптимальных параметров
- •4.4 Программная реализация алгоритма
- •5 Управление поворотом камеры
- •5.1 Постановка задачи
- •5.2 Перенацеливание на заданную точку поверхности
- •5.3 Модель принятия решений
- •6 Исследование системы
- •6.1 Оценка точности перенацеливания
- •6.2 Проверка на устойчивость к смене освещения
- •6.3 Время задержки
- •6.4 Устойчивость при частичном перекрытии объекта
- •6.5 Анализ влияния шумов
- •Заключение
- •Список литературы
- •Приложение 1. Код программы
1.3.3 Методы оптического потока
Оптический
поток (ОП) – изображение видимого
движения, представляющее собой сдвиг
каждой точки между двумя изображениями.
По сути, он представляет собой поле
скоростей (т. к. сдвиг с точностью до
масштаба эквивалентен мгновенной
скорости). Суть ОП в том, что для каждой
точки изображения
находится
такой сдвиг (dx, dy), чтобы исходной точке
соответствовала точка на втором
изображении
.
Как определить соответствие точек –
отдельный вопрос. Для этого надо взять
какую-то функцию точки, которая не
изменяется в результате смещения. Обычно
считается, что у точки сохраняется
интенсивность (т. е. яркость или цвет
для цветных изображений), но можно
считать одинаковыми точки, у которых
сохраняется величина градиента, гессиан,
его величина или его определитель,
лапласиан, другие характеристики.
Очевидно, сохранение интенсивности
дает сбои, если меняется освещенность
или угол падения света. Тем не менее,
если речь идет о видеопотоке, то, скорее
всего, между двумя кадрами освещение
сильно не изменится, хотя бы потому, что
между ними проходит малый промежуток
времени. Поэтому часто используют
интенсивность в качестве функции,
сохраняющейся у точки.
Есть два варианта расчета оптического потока: плотный (dense) и выборочный (sparse). Sparse поток рассчитывает сдвиг отдельных заданных точек (например, точек, выделенных некоторым feature detector'ом), dense поток считает сдвиг всех точек изображения. Естественно, выборочный поток вычисляется быстрее, однако для некоторых алгоритмов разница не такая уж и большая, а для некоторых задач требуется нахождение потока во всех точках изображения.
Суть
оптического потока в том, что он не ищет
какие-то особенные точки, а по параметрам
изображений пытается определить, куда
сместилась произвольная точка.
В
основе всех дальнейших рассуждений
лежит одно очень важное и не очень
справедливое предположение: значения
пикселей переходят из одного кадра в
следующий без изменений.
Таким образом, мы делаем допущение, что
пиксели, относящиеся к одному и тому же
объекту, могут сместиться в какую либо
сторону, но их значение останется
неизменным. Конечно же это предположение
имеет мало общего с реальностью, потому
что от кадра к кадру могут меняться
глобальные условия освещения и
освещенность самого движущегося объекта.
Масса проблем связана с этим допущением,
но, как ни странно, вопреки всему оно
достаточно хорошо работает на практике.
На
математическом языке это допущение
можно записать так:
.
Где I — это функция яркости пикселей от
положения на кадре и времени. Другими
словами x и y — это координаты пикселя
в плоскости кадра,
и
—
это смещение, а t — это номер кадра в
последовательности.
В данной работе будет использоваться именно этот метод, так как он позволяет работать при нестационарном фоне.
Обзор инструментальных средств для разработки программного продукта
В настоящий момент существует большое количество специализированных программных библиотек компьютерного зрения как общего, так и специального назначения. Чтобы отобрать наилучшие из них, сформулирован набор предъявляемых требований:
разнообразие решаемых задач;
широкое распространение;
активное развитие и поддержка продукта компанией-разработчиком либо открытым сообществом;
высокое качество технической документации;
высокоуровневая иерархическая структура компонентов;
относительная простота использования;
стабильность и удовлетворительная скорость работы;
кроссплатформенность и переносимость.
Несмотря на упомянутое выше многообразие средств, для создания программного продукта были выбраны два наиболее полно соответствующих изложенным требованиям продукта.
