
- •Глава 6. Системы технического зрения
- •6.1. Основные понятия
- •6.2. Основы формирования и передачи изображений
- •6.2.1. Понятие о видеосигнале
- •6.2.2. Принципы кодирования цвета
- •6.3. Датчики изображений
- •6.3.1. Видикон
- •6.3.2. Телекамеры на основе приборов с зарядовой связью
- •6.3.3. Фотодиодные матрицы
- •6.4. Устройства ввода и хранения изображений
- •6.4.1. Принципы хранения изображений
- •6.4.2. Кодирование видеосигнала
- •Форматы хранения изображений в стз
- •6.5.1. Структура графического файла
- •6.5.2. Сжатие изображений
- •6.5.2.1. Сжатие графических файлов
- •Ааааааааааааааа
- •6.5.2.2. Сжатие видеоизображений
- •6.6. Базовые алгоритмы обработки изображений
- •6.6.1. Предварительная обработка изображений
- •6.6.2. Сегментация
- •6.6.3. Кодирование изображений
- •6.6.4. Описание изображений
- •6.7. Распознавание изображений
- •6.7.1. Пример алгоритма распознавания
- •6.7.2. Особенности получения трехмерных изображений
- •Вопросы для самостоятельной подготовки
6.7.2. Особенности получения трехмерных изображений
Взавершении вкратце рассмотрим принципы
анализатрехмерных
сцен. Этому вопросу в последнее время
уделяется значительное внимание, созданы
соответствующие алгоритмы распознавания.
В большинстве случаев они относятся к
различным частным задачам, во всяком
случае, универсальных описаний трехмерных
объектов не получено [ ]. СТЗ, как
правило, ограничиваются анализом плоских
изображений и этого оказывается
достаточно для надежного распознавания
типовых объектов промышленного
назначения. Однако при этом возникает
необходимость надлежащей ориентации
объектов в поле зрения телекамеры.
Типичным решением является обеспечение
ортогональности оптической оси камеры
и рабочей сцены. Кроме того, необходимо,
чтобы в поле зрения оказалась именно
та поверхность объекта, которая
использовалась на этапе описания, при
формировании признаков объекта. Все
эти ограничения выполнимы в случае
детерминированной рабочей сцены, когда
существует возможность ее некоторого
упорядочивания. В более сложных задачах
все же приходится учитывать трехмерный
характер рабочей сцены.
ВСТЗ под трехмерным понимают изображение,
содержащее информацию о трех геометрических
измерениях объекта. Оно может быть
получено с помощью двух телекамер (3D),
или могут использоваться специальные
приемы. (В этом случае, обычно говорят
о 2,5D
или K2D
изображениях). При использовании 2-х
телекамер, каждая из них обрабатывает
свой плоский 2D
образ, на основании описанных выше
принципов. Если известна ориентация
каждой камеры и расстояние между ними,
всегда можно восстановить третью
координату объекта (рис. 6.59). Основная
трудность этого метода заключается в
идентификации каждой точки объекта по
их плоским изображениям на двух камерах,
особенно в случае нечетких изображений.
Обычно две телекамеры используются в
задачах телеуправления, в мобильных
роботах и др. (Примерами таких роботов
являются отечественные разработки
МРБ-25, МГТУ им. Н.Э. Баумана и «Богомол»,
ИФТП). При необходимости, результирующее
3D
изображение может быть выведено на
обычный монитор, что применяется,
например, в задачах телеуправления. С
этой целью, в одно поле вводится информация
с одной камеры, а в другое - с другой.
Другими словами, нечетный полукадр
развертки образует видеосигнал, например,
с левой телекамеры, а четный - с правой.
Ясно, что такое изображение субъективно
воспринимается как двоящееся. Поэтому,
для получения бинокулярного эффекта
необходимо использовать стереоочки.
Другой
распространенный способ получения
«псевдотрехмерных» изображений,
требует только одного телевизионного
датчика и связан с применением
«структурированной подсветки» (рис.
6.61). В частности, он используется в
лазерных 3D-сканерах.
Объект освещается от проектора через
матрицу - транспарант
с периодической системой полос, а
изображение воспринимается камерой,
расположенной под некоторым
параллаксным углом к оси проектора.
Зная расстояние (период) между полосами,
а также взаимное положение камеры и
проектора, можно восстановить форму
объекта. Полученное изображение объекта
в виде бинарных искривленных линий
можно интерпретировать как результат
фазовой
пространственной модуляции
оптического сигнала. Действительно,
если периодическую сетку, спроецированную
на плоский экран считать несущим
сигналом, то любая неплоская поверхность
вносит фазовую модуляцию в этот сигнал,
причем закон модуляции линейно связан
с профилем поверхности в направлении
оптической оси камеры. Данный способ
также позволяет восстановить третью
координату объекта. Рис. 6.60а и б
иллюстрируют принцип восстановления
рельефа объекта и наблюдаемая на экране
его трехмерная модель. Обозначив Tx
- период полос транспаранта вдоль
оси Х,
- паралаксный угол, определим период
полос, воспринимаемых камерой: Txk
= Tx/tg.
Следовательно, для любой точки на
изображении с координатами xk,
yk,
принадлежащей i-ой
линии транспаранта можно восстановить
третью координату zk:
zk = xk /tg = (xk – iTxk)/tg.
В завершении заметим, что в описанных подходах к анализу трехмерных сцен, собственно обработка информации производится на двухмерных образах. Третья координата используется, как правило, для вычисления дальности до объекта или при определении взаимного положения нескольких объектов сцены. Обширная библиография, посвященная алгоритмам обработки трехмерных сцен приведена в [ ].