
- •Глава 6. Системы технического зрения
- •6.1. Основные понятия
- •6.2. Основы формирования и передачи изображений
- •6.2.1. Понятие о видеосигнале
- •6.2.2. Принципы кодирования цвета
- •6.3. Датчики изображений
- •6.3.1. Видикон
- •6.3.2. Телекамеры на основе приборов с зарядовой связью
- •6.3.3. Фотодиодные матрицы
- •6.4. Устройства ввода и хранения изображений
- •6.4.1. Принципы хранения изображений
- •6.4.2. Кодирование видеосигнала
- •Форматы хранения изображений в стз
- •6.5.1. Структура графического файла
- •6.5.2. Сжатие изображений
- •6.5.2.1. Сжатие графических файлов
- •Ааааааааааааааа
- •6.5.2.2. Сжатие видеоизображений
- •6.6. Базовые алгоритмы обработки изображений
- •6.6.1. Предварительная обработка изображений
- •6.6.2. Сегментация
- •6.6.3. Кодирование изображений
- •6.6.4. Описание изображений
- •6.7. Распознавание изображений
- •6.7.1. Пример алгоритма распознавания
- •6.7.2. Особенности получения трехмерных изображений
- •Вопросы для самостоятельной подготовки
6.2.2. Принципы кодирования цвета
Термин
«цвет» даже в научной литературе имеет
несколько определений. Одним из наиболее
удачных является формулировка Э.
Шредингера, определившего цвет как
«свойство спектрального состава
излучения, общего излучениям, визуально
неразличимым для человека». Подобное
представление лежит в основе цветовых
измерений (колориметрии) и теориицветного
зрения.
Особенности спектрального состава
излучения изучал в XVIII
в. И. Ньютон, определивший отдельные
составляющие солнечного света. Основные
положения теории цветового зрения были
заложены М. Ломоносовым, экспериментально
установившим, что все цвета могут быть
получены путем сложения
трех основных (первичных) цветов.
Проведенные в XIX в. исследования Г.
Гельмгольца и некоторых других ученых
показали, что чувствительность
S
зрительных
клеток к свету различных длин волн
неодинакова (рис. 6.11). Многочисленные
физиологические эксперименты привели
к эмпирической зависимости:
L = 0,59 G + 0,3 R + 0,11 B
где G, R и B - соответственно зеленая, красная и синяя составляющие спектра излучения. Яркость L, как и ранее, характеризует амплитуду черно-белого изображения. Поскольку представления о черном и белом весьма субъективны, возникла необходимость централизовано установить понятие «белого». Согласно принятому международному определению белым цветом называется цвет свечения абсолютно черного тела при температуре 6500 0С.
Формула,
определяющая яркость как взвешенную
сумму компонентов цветности, лежит в
основе наиболее известной моделиаддитивного
цветового синтеза,
применяемой в светоизлучающих системах
(в том числе - цветном телевидении).
Согласно аддитивной модели, известной
также как цветовая
система RGB,
любой цвет получается наложением
красного,
зеленого
и синего
цветов спектра. Так, например, на экране
монитора цвет и яркость каждой точки
задается интенсивностью R,
G
и B
составляющих, использующихся при
управлении мощностью трехкомпонентной
электронной пушки. Для наглядного
представления цветовой системы RGB
используется цветовой
куб, где
чистые цвета образуют вершины куба, а
оттенки серого лежат на главной диагонали
(рис. 6.12). Однако при всей наглядности
этой схемы она имеет два существенных
недостатка. Во первых, в системе RGB
невозможно получить все
цвета путем сложения основных составляющих.
Во вторых, цветопередача является
аппаратно-зависимой (например, от
люминофора). В частности, экспериментально
установлено, что методика RGB
недействительна в сине-зеленой
(450 ... 550 нм) области. Это связано с тем,
что для имитации спектрального цвета
в данной области требуется отрицательная
красная составляющая (рис. 6.13).
Действительно, согласно цветовому кубу
справедливо равенство:
Голубой = Синий + Зеленый
На самом деле, эмпирически установлена справедливость другого выражения:
Синий + Зеленый = Голубой + Красный,
что и приводит к появлению отрицательной красной компоненты:
Голубой = Синий + Зеленый - Красный.
Ясно, что в природе не существует отрицательных составляющих цвета, и, следовательно, в модели аддитивного цветового синтеза голубой цвет может быть получен только искусственно.
Модель RGB используется для описания источников излучения. Если же объект освещается, он является приемником света, отражающим волны. Большинство предметов отражают либо солнечные лучи, либо лучи других источников освещения. Так, например, если объект кажется красным, это означает, что он отражает только длинные волны, поглощая все остальные. Для описания приемников света используется модель субтрактивного цветового синтеза, называемая также CMYK (Cyan - голубой, Magenta - пурпурный, Yellow - желтый и Black - черный). Модель CMYK позволяет получить на бумаге большинство необходимых цветов и широко используется в полиграфии и других системах печати. Важной особенностью такого подхода является возможность корректировать цвета изображений. Так, если изображение (фотография) получилось излишне синим, то необходимо увеличить желтую составляющую, поскольку желтый цвет поглощает синюю компоненту. Аналогично, зеленый цвет корректируется увеличением пурпурной составляющей. На практике, при технической реализации цветной печати изображение раскладывают на голубую, пурпурную и желтую составляющие, образующие на бумаге точечный растр. Затем для увеличения контрастности в растр добавляют чисто черную составляющую, которая оказывается гораздо насыщеннее, чем компонента, образованная сложением C, M и Y цветов. Белый цвет соответствует нулевым значениям всех составляющих C, M, Y и K, в отличие от RGB, где все компоненты соответствуют максимуму.
Система CMYK, также как и RGB является аппаратно-зависимой. Более того, цветовое изображение, полученное в CMYK (например, при печати на принтере) не совпадает с изображением в RGB (представленным на мониторе). Указанные недостатки не позволяют количественно оценивать цветовую информацию, содержащуюся в изображении. Следовательно, возникла необходимость разработки аппаратно-независимых моделей кодирования цвета.
Впоследние 20 лет для цифровой обработки
изображений широко используютсяаппаратно-независимые
системы кодирования цвета. К наиболее
известным относятся система HSV
и ее варианты - HSI,
HLS,
а также телевизионная система YUV
(разработанная для стандарта цветного
телевидения PAL).
Особенностью всех этих систем является
раздельность
кодирования
сигналов яркости и цвета. Применительно
к телевидению такой подход получил
название компонентного
кодирования.
Принцип HSV (HSI) очень напоминает способ, используемый художниками для получения нужных цветов - смешивание белой, черной и серой красок с чистыми красками для получения различных тонов и оттенков (tine, shade и tone). При этом, цвет задается не смесью трех основных составляющих как, например, в системе RGB, а с помощью трех независимых величин - цветового тона (hue), насыщенности (saturation) и интенсивности (value, intensity). В качестве геометрической модели используется конус, получаемый как сглаженная проекция цветового куба RGB вдоль его главной диагонали «черный-белый» (рис.6.14). В соответствии с этой моделью цветовой оттенок (тон) H и насыщенность S кодируются как угловая и радиальная характеристики цветового круга - основания конуса. Тон описывается углом цветовой стрелки (например, красный соответствует 00), насыщенность представляется как величина смещения вдоль радиуса круга. Она возрастает по величине от 0 к 1 (или от 0 до 100%) при перемещении от центра круга к его границе соответственно. Насыщенность характеризует насколько тусклым или «сочным» является цвет. Чем больше данный цвет разбавлен белым (чем ближе к центру круга), тем он менее насыщен. Естественные (реальные) цвета имеют низкую насыщенность.
Величина
интенсивности
(или цвета)
V
указывает яркость
цвета. Она также меняется от 0 к 1, но по
оси OV
и не связана с цветовым кругом. По этой
оси располагаются серые цвета, так,
например, для белого цвета имеем: S
= 0, V
= 1. Следовательно, добавление белого в
любой цвет уменьшает S,
а добавление черного уменьшает V.
В системе HSV
при S
= 0, Н
не имеет смысла. Действительно, как
следует из рис. 6.14 эта точка соответствует
вершине конуса.
Другая цветовая система HLS или HSB (буквы H и S также обозначают тон и насыщенность, L и В - яркость) использует то же координатное пространство, но представленное в виде двух пирамид, соединенных основаниями (рис. 6.15). Эта фигура в большей степени соответствует диагональной проекции куба. В модели HLS, также как и в HSV черный и белый цвета образуются при любых значениях H и разных L и S, например, насыщенный черный при L = 0, S = 1, а белый - при L = 1 и S = 0. Голубые цвета соответствуют значению H = 1800. Так, грязно-голубому цвету (смеси серого с голубым) отвечает комбинация: L = 0,5, H = 1800 и S = 0, цвету морской волны: L = 0,5, H = 1800 , но S = 1, и, наконец, небесно-голубому: H = 1800 и L и S = 1.
Поскольку в основе геометрических построений в системе HSV и ей подобных лежит модель RGB, то и пересчет цветов в обе стороны достаточно прост.
Наличие
большого количества разнообразных
моделей, применяемых в различных задачах
обработки цветных изображений, привело,
в конце концов, к необходимости созданияединого
описания цвета. В качестве всемирного
стандарта для определения цвета в
настоящее время утвержден цветовой
график МКО
(CIE),
сочетающий абстрактный характер HSV
и практичность RGB
и CMYK.
Этот график, предложенный еще в 1931 г.
охватывает все
цвета,
которые способен видеть человеческий
глаз (рис. 6.16). График МКО строится как
функция двух переменных х
и y,
представляющих собой некоторые
гипотетические (несуществующие в
природе) основные цвета. Тогда, на линии,
которая ограничивает цветовое пространство
МКО, будут находиться все
чистые цвета видимого света. Их можно
получить путем смешения источников x
и y.
(Например, чистый красный с длиной волны
700 нм понимается как результат сложения
70% x
и 25% y).
Все цвета, лежащие внутри графика и на
его границе являются физически
реализуемыми.
Цветовой охват устройства (телекамеры, монитора, сканера, принтера, фотопленки и пр.) характеризует его способность к отображению цветовой гаммы всего цветового диапазона. Для любого устройства он находится внутри пространства МКО. Самый большой цветовой охват имеет фотопленка.
При передаче цветных изображений в большинстве СТЗ применяются устройства аддитивного цветового синтеза, основанные на модели RGB. (К ним относятся и телекамеры и мониторы). Сигнал яркости Y передается непосредственно, а информация о цвете кодируется двухкомпонентным вектором цветности (рис. 6.17). В этой системе, получившей название YUV, к уже известной формуле расчета яркости Y добавляются еще две, определяющие проекции U и V вектора цветности:
Y = 0,59G + 0,30R + 0,11B, U = R - Y, V = B - Y.
Длина
вектора цветности находится черезамплитуды
его проекций U
и V;
она кодирует
насыщенность
цвета. Фазовый
сдвиг
между проекциями описывает цветовой
тон.
В телевизионной технике эти вектора
обычно нормируют, и круг превращается
в эллипс: U
= (R-Y)/1,44
и V
= (B-Y)/2,03. На
основе системы YUV построены и другие
известные модели. Примером может служить
система цифрового
цветного телевидения YCbCr. (Здесь
цветоразностные сигналы Cr и Cb строятся
из R-Y и B-Y соответственно).
Рассмотрим формирование цветного сигнала в телевизионной камере. Обычно применяются три развертывающих луча, формирующих первичные сигналы изображения ER, EG, EB соответствующие красной, зеленой и синей составляющим цвета передаваемого объекта. Первичные сигналы широкополосные, однако, ни один из них не несет яркостной информации об объекте. (Иногда вместо термина «яркость» используется понятия освещенности ). Поэтому в системе цветного телевидения из трех первичных цветов формируется четвертый - сигнал яркости EY, для чего первичные сигналы сначала балансируются, а затем матрицируются. Сущность данной процедуры, учитывающей спектральную чувствительность глаза, описывается уже известной зависимостью: EY = 0,30 ER + 0,59 EG + 0,11 EB, где ER = EG = EB. Этот сигнал передается непрерывно на каждой строке развертки во всей полосе частот видеосигнала 6 МГц и позволяет воспроизводить черно-белое изображение на экранах черно-белых и цветных приемников.
Наличие сигнала яркости EY освобождает от необходимости передачи всех трех первичных сигналов изображения. Обычно передаются два из них ER и EB, а «зеленый» восстанавливается по формуле:
EG = (EY - 0,30 ER - 0,11 EB)/0,59
Важной особенностью зрения является зависимость пространственной разрешающей способности глаза от длины волны - она понижена в области красных и синих цветов. Следствием этого является меньшая чувствительность глаза к пространственным изменениям оттенков цвета, чем к изменениям яркости, что позволяет передаваться цветовую информацию с меньшим разрешением. Таким образом, трехкомпонентная модель цветового зрения распространяется только на относительно крупные объекты. Цвет объектов средних размеров является смесью двух цветов: оранжевого и голубого, а мелкие и вовсе различаются только по яркости, т.е. кажутся черно-белыми. Указанные обстоятельства позволяют сократить полосу частот сигнала цветности до 1 ... 1,5 МГц. Поскольку, полная информация о яркости объекта содержится в сигнале EY, из сигналов ER и EB ее можно исключить, и передать эти компоненты в виде цветоразностных сигналов ER-Y и EB-Y. При таком подходе достигается двойной выигрыш. Во-первых, обеспечивается достоверность воспроизведения цветов, т.к. в реальных объектах значительную часть составляют неокрашенные и слабоокрашенные участки. Во вторых, уменьшается амплитуда передаваемых сигналов, что увеличивает энергетическую эффективность передачи. Таким образом, исходные RGB-видеосигналы с телекамеры перед передачей преобразуют в сигнал яркости Y и два цветоразностных сигнала U = ER-Y и V = EB-Y (рис. 6.17). Следовательно, полный цветной телевизионный видеосигнал представляет собой композицию трех сигналов Y, U, V и служебных импульсов. Такой сигнал получил название композитного. При приеме в цветном телевизоре осуществляется обратный процесс восстановления (декодирования): R = Y+U (или ER = EY+ER-Y), B =Y+V (или EB = EY+EB-Y) и, наконец, G = Y - 0,509U - 0,194V (или EG = EY - 0,509 ER-Y - 0,194 EB-Y).
В настоящее время в эксплуатации находятся три совместимых системы цветного телевидения:
американская NTSC (National Television System Color) - первая система цветного телевидения 1953 г.;
германская PAL (Phase Alternation Line - строки с переменной фазой) - разработана фирмой Telefunken в 1963 г;
французская SECAM (Sequentiel couleur a memoire - последовательная цветная с памятью) - предложена А. Франсом в 1954 г.
В каждой из этих систем используется группа из трех составляющих: сигнала яркости и двух цветоразностных. Сигнал яркости частотно уплотняется цветоразностными сигналами, причем спектры цветности переносятся на поднесущую частоту в области высокочастотной части спектра. (Чтобы не возникало путаницы - несущую частоту цветности, в отличие от несущей яркости, называют поднесущей). Методы кодирования и передачи сигналов цветности в этих системах существенно различаются.
В табл. 6.4 представлены основные технические характеристики систем цветного телевидения.
Таблица 6.4. Системы цветного телевидения
Тип системы |
NTSC |
PAL |
SECAM | ||
Вертикальная частота развертки, Гц |
60 |
50 |
50 | ||
Горизонтальная частота развертки, кГц |
15374 |
15625 |
15625 | ||
Число строк в кадре |
525 |
625 |
625 | ||
Число видимых (активных) строк в кадре |
480 |
576 |
576 | ||
Тип модуляции цветовой поднесущей |
АМ |
АМ |
ЧМ | ||
Полоса видеосигнала, МГц |
4,2 |
5 для B/G, 5,5 для I, 6 для D/K | |||
Частота цветовой поднесущей, МГц |
3,60 |
4,43 |
4,41 по U, 4,25 по V | ||
Разнос несущих видео/звук, МГц |
4,5 |
5,5 для B/G, 6 для I, 6,5 для D/K | |||
Полная ширина сигнала, МГц |
6 |
7 для B/G, 8 для I/D/K |
Система NTSC принята для вещания в США, Канаде, большинстве стран Центральной и Южной Америки, Японии, Южной Корее и Тайване. Именно при ее создании были выработаны основные принципы передачи цвета в телевидении. В NTSC каждая телевизионная строка содержит составляющую яркости Y и два сигнала цветности EI = 0,737U - 0,268V, EQ=0,478U+0,413V. Здесь переход от осей цветового кодирования U, V к осям I, Q обусловлен необходимостью сужения ширины полос цветовых поднесущих до ± 0.5 МГц (в NTSC используется самая узкая полоса видеосигнала). Цветоразностные сигналы передаются путем АМ поднесущих на одной и той же частоте, но с фазовым сдвигом на 90°. Последнее обстоятельство является принципиально важным для разделения сигналов при приеме. Однако из-за неизбежных нелинейных искажений в канале передачи поднесущие оказываются промодулированными сигналом яркости как по амплитуде, так и по фазе. В результате в зависимости от яркости участков изображений изменяются их цветовой тон. Например, человеческие лица на изображении окрашиваются в красноватый цвет в тенях и в зеленоватый - на освещенных участках. Это и является основным недостатком системы NTSC.
В системе PAL используется аналогичная АМ цветоразностных сигналов EU=0,877U и EV=0,493V с фазовым сдвигом на 90°, но через строку дополнительно производится изменение знака амплитуды составляющей EU. В результате при восстановлении в декодере цветовые составляющие надежно разделяются сложением/вычитанием сигналов цветности последовательных телевизионных строк, и паразитная яркостная модуляция приводит лишь к некоторому изменению цветовой насыщенности. Усреднение сигналов двух строк обеспечивает также повышение отношения сигнал/шум, но приводит к снижению вертикальной четкости в два раза. Впрочем, частично это компенсируется увеличением числа телевизионных строк разложения. Система PAL принята в большинстве стран Западной Европы, Африки и Азии, включая Китай, Австралию и Новую Зеландию.
Система SECAM первоначально была предложена во Франции еще в 1954 г., но регулярное вещание после длительных доработок было начато только в 1967 одновременно во Франции и СССР. В настоящее время она принята также в Восточной Европе, Монако, Люксембурге, Иране, Ираке и некоторых других странах. Основная особенность системы - поочередная, через строку, передача цветоразностных сигналов (DR= 1,9U, DB=1,5V) с дальнейшим восстановлением в декодере путем повторения строк. При этом в отличие от PAL и NTSC используется ЧМ поднесущих. В результате цветовой тон и насыщенность не зависят от освещенности, но на резких переходах яркости возникают цветовые окантовки. Обычно после ярких участков изображения окантовка имеет синий цвет, а после темных - желтый. Кроме того, как и в системе PAL, цветовая четкость по вертикали снижена вдвое.
Во всех рассмотренных системах к цветному видеосигналу добавляется сигнал звукового сопровождения, образуя так называемый низкочастотный телевизионный сигнал. Этот сигнал передается через эфир путем модуляции несущей частоты одного из 5 допустимых частотных диапазонов (табл. 6.3). И здесь даже в рамках одной системы существуют различия, связанные с конкретной шириной спектра видеосигнала и его разносом со звуковой частью, полярностью амплитудной модуляции радиоканала изображения и типом модуляции радиоканала звука. В табл. 6.5 представлены основные параметры телевизионных стандартов.
Таблица 6.5. Телевизионные стандарты стран мира
Стандарт |
Число строк, Z |
Ширина канала, МГц |
Полоса видео, МГц |
Разнос видео/ звук, МГц |
Полярность модуляции видео |
Тип модуляции несущей звука |
A |
405 |
5 |
3 |
3.5 |
+ |
AM |
B |
625 |
7 |
5 |
5.5 |
- |
ЧМ |
C |
625 |
7 |
5 |
5.5 |
+ |
AM |
D |
625 |
8 |
6 |
6.5 |
- |
ЧМ |
E |
819 |
14 |
10 |
11.15 |
+ |
AM |
F |
819 |
7 |
5 |
5.5 |
+ |
AM |
G |
625 |
8 |
5 |
5.5 |
- |
ЧМ |
H |
625 |
8 |
5 |
5.5 |
- |
ЧМ |
I |
625 |
8 |
5.5 |
6 |
- |
ЧМ |
K |
625 |
8 |
6 |
6.5 |
- |
ЧМ |
L |
625 |
8 |
6 |
6.5 |
+ |
AM |
M |
525 |
6 |
4.2 |
4.5 |
- |
ЧМ |
N |
625 |
6 |
4.2 |
4.5 |
- |
ЧМ |
В России принят стандарт SECAM D/K (первая буква относится к диапазону метровых волн, вторая - дециметровых), во Франции - SECAM E/L, Иране - SECAM B, Германии - PAL B/G, Англии - PAL A/I, Бразилии - PAL M/M, Китае - PAL D/K, в США, Японии и Тайване - NTSC M/M. Характерные различия модификаций SECAM связаны с особенностями модуляции несущей частоты, как по видео, так и по звуку, а также частотой разноса звука от видео. Сами же низкочастотные телевизионные сигналы одинаковы. В то же время с точки зрения модуляции радиосигналов отличий между PAL D/K и SECAM D/K нет. Это позволяет использовать телевизионный тюнер, настроенный на PAL D/K, для выделения отечественного SECAM из высокочастотного сигнала. Очевидно, что полученный при этом низкочастотный сигнал все же необходимо подавать именно на SECAM-декодер.
В
системе SECAM D/K сигнал яркости занимает
всю полосу частот - 6 МГц. Информация о
цвете передается внутри этого спектра,
путем введения в него поднесущих частот,
ЧМ цветоразностными
сигналами (рис. 6.18). Поднесущие частотыf0R
= 4,4 МГц и f0B
=
4,25 МГц, на
которой передаются цветоразностные
сигналы DR
и DB,
расположены внутри полосы сигнала
яркости, т.е. внутри спектра черно-белого
сигнала. (Возможность такого уплотнения
спектра
обусловлена его дискретностью и,
следовательно, наличием свободных
промежутков между соседними гармониками).
ЧМ поднесущие передаются поочередно
через строку, т.е. в пределах каждой
строки развертки передается сигнал
яркости и только одна из поднесущих
foR
или foB.
Это вдвое сужает участок спектра сигнала
яркости, уплотняемого сигналами
цветности, что существенно снижает
уровень помех. Однако в одной строке
будет отсутствовать красный цвет, а в
другой - синий. Чтобы этого не происходило,
на приемной стороне задерживают цветную
строку с помощью пьезокерамической
линии задержки.
ЧМ, с максимальной девиацией 50 кГц, несущая частота радиосигнала звукового сопровождения выбирается на 6,5 МГц выше несущей частоты радиосигнала изображения. Радиосигнал звука занимает полосу частот 0,25 МГц и обеспечивает передачу звуковых частот 30 ... 15000 Гц.
Качество получения телевизионного сигнала в современных СТЗ непрерывно совершенствуется. Разработки ведутся в направлении расширения полосы передаваемых частот, увеличения частоты передачи полукадров с 50 до 100 (с использованием цифровой памяти), расширения уровня черного сигнала, а также применения цифровых методов коррекции.