
- •Глава 6. Системы технического зрения
- •6.1. Основные понятия
- •6.2. Основы формирования и передачи изображений
- •6.2.1. Понятие о видеосигнале
- •6.2.2. Принципы кодирования цвета
- •6.3. Датчики изображений
- •6.3.1. Видикон
- •6.3.2. Телекамеры на основе приборов с зарядовой связью
- •6.3.3. Фотодиодные матрицы
- •6.4. Устройства ввода и хранения изображений
- •6.4.1. Принципы хранения изображений
- •6.4.2. Кодирование видеосигнала
- •Форматы хранения изображений в стз
- •6.5.1. Структура графического файла
- •6.5.2. Сжатие изображений
- •6.5.2.1. Сжатие графических файлов
- •Ааааааааааааааа
- •6.5.2.2. Сжатие видеоизображений
- •6.6. Базовые алгоритмы обработки изображений
- •6.6.1. Предварительная обработка изображений
- •6.6.2. Сегментация
- •6.6.3. Кодирование изображений
- •6.6.4. Описание изображений
- •6.7. Распознавание изображений
- •6.7.1. Пример алгоритма распознавания
- •6.7.2. Особенности получения трехмерных изображений
- •Вопросы для самостоятельной подготовки
6.4.2. Кодирование видеосигнала
Композитный сигнал в системах PAL и NTSC дискретизируется с частотой 4fц равной четвертой гармонике цветовой поднесущей. В системе NTSC строка содержит 910 элементов, из которых 768 образуют активную часть цифровой строки. В системе PAL на интервал аналоговой строки приходится нецелое число отсчетов с частотой 4fц, и, следовательно, длительность цифровой строки не равна длительности аналоговой. Все строки поля (за исключением двух) содержат по 1135 элементов, а две - по 1137. Скорость передачи цифровых данных в системе NTSC составляет 143 Мбит/с, а в системе PAL - 177 Мбит/с
Более распространенный в последнее время компонентный телевизионный видеосигнал на выходе телекамеры также имеет аналоговую форму. Для его представления в цифровом виде в соответствии с рекомендацией ITU-R 601устанавливаются правила раздельной дискретизации, квантования и кодирования сигнала яркости Y и двух цветоразностных сигналов R-Y (Cr) и B-Y (Cb). Кодирование видеосигнала, также как и рассмотренного ранее звукового, предполагает использование линейной ИКМ. Полоса частот, требуемая для обеспечения заданной пропускной способности, зависит от характеристик канала. В качестве примера рассмотрим кодирование сигнала в режиме линейной ИКМ на видеомагнитофон профессионального цифрового формата магнитной видеозаписи D1. Здесь сигнал яркости и оба цветоразностных сигнала имеют одинаковые полосы частот 3,375 МГц.
Частота дискретизации сигнала яркости fдY выбирается вчетверо большей верхней частоты этого сигнала и равна 43,375 МГц = 13,5 МГц. Частоты дискретизации каждого цветоразностного сигнала принимаются вдвое выше верхних частот сигналов, что соответствует 23,375 МГц = 6,75 МГц. (Согласно критерию Найквиста fд 2fв). Частоты дискретизации fд связаны с гармониками строчной частоты, что обеспечивает неподвижную ортогональную структуру отсчетов телевизионного изображения. Существенно, что величинам 13,5 и 6,75 МГц кратна как частота строчной развертки стандарта телевизионного разложения 625/50, так и стандарта 525/60. (Собственно, и выбор в качестве базовой именно частоты 3,375 МГц во многом связан с этими соображениями кратности). Указанные обстоятельства позволили ввести единый мировой стандарт цифрового кодирования компонентного видеосигнала, при котором в активной части строки содержится 720 элементов яркостного сигнала и по 360 - каждого цветоразностного. (Системы 625/50 и 525/60 различаются числом строк разложения Z и длительностью гасящих импульсов). Таким образом, соотношение частот дискретизации всех трех компонентов видеосигнала в данном случае (13,5; 6,75 и 6,75 МГц) по отношению к fв выражается как 4:2:2. Поэтому рассматриваемый формат получил название компонентного формата 4:2:2. Записываемый поток видеоинформации в формате 4:2:2 при 8 битовом квантовании составляет (13,5+26,75) МГц8 бит = 216 Мбит/с. При 10 битовом квантовании этот поток расширяется до 270 Мбит/с. (При записи телевизионных программ к нему необходимо добавить соответствующий поток аудиоинформации). Существуют и другие форматы представления компонентного сигнала в цифровом виде. Кодирование по стандарту 4:4:4 предполагает использование частоты 13,5 МГц для всех трех компонентов: R, G, B или Y, Cr, Cb. Это означает, что все компоненты передаются в полной полосе и для каждой из них в активной части кадра оцифровывается 576 строк по 720 элементов. Скорость цифрового потока при кодировании 4:4:4 и 10-битовом слове достигает 405 Мбит/с.
Итак, самый популярный студийный сигнал - цифровое видео D1 (или CCIR 601) использует систему NTSC и может кодироваться цифровым потоком в 270 Мбит/с. Пропускная способность канала рассчитывается и другим способом, исходя из растрового представления. В каждой строке растра содержится 858 точек, в кадре - 525 строк. Имеем по компоненте Y: 858 точек/строку525 строк/кадр30 кадр/с10 бит/точку 135 Мбит/с. По компонентам R-Y (Cr) и B-Y (Cb) соответственно: 429 точек/ строку525 строк /кадр30 кадр/с10 бит/точку 68 Мбит/с. Всего получим: 27 млн. точек/с 10 бит/точку = 270 Мбит/с.
Во всех рассмотренных случаях получается очень большой поток данных, который трудно как передавать, так и записывать. Рассмотрим еще один пример. Одна минута цифрового видеосигнала с разрешением SIF (сопоставимым с VHS и равным 288 358 точек) и цветопередачей в режиме true color, займет: 28835824 бита 25 кадров/с60 с = 442 Мб.
Таким образом, не только пропускная способность канала, но и ограничения на память современных носителей (компакт-диска или жесткого диска), не позволяет записать изображение в несжатом виде.
До недавнего времени магнитная лента являлась единственным средством хранения больших массивов видеоинформации. Сейчас ее успешно заменяют оптические носители, и, в первую очередь, оптические диски высокой плотности - DVD (digital versatile disk) и HD-DVD. До появления этих систем различные фирмы самостоятельно боролись с проблемой малых скоростей передачи данных и невысокой емкости носителя, пока не был сформулировано требование - обеспечить 120 мин запись с вещательным качеством. Это требование, поставленное по заказу Голливуда, и привело к появлению системы DVD, а также специальных принципов сжатия видеоинформации. Информация хранится на дорожках дисков в виде последовательности пит - бинарных элементов с разной отражательной способностью. Емкость дисков DVD доведена до 40 Гбайт, допустимая пропускная способность канала составляет 10,08Мбит/с. Заметим, что это значение существенно ниже требуемого, которое составляет для формата D1 - 216 Мбит/с. Указанное обстоятельство означает, что и DVD диски не позволяют воспроизводить видеопотоки в реальном времени. Поэтому, общепринятым решением является кодирование и сжатие изображения.
Устройства DVD используются при развитии цифровых телевизионных систем высокой четкости. Необходимая для этих систем скорость воспроизведения должна составлять 23 Мбит/с. В 2001 г. систему такого рода создала фирма Pioneer на базе голубого полупроводникового лазера с = 410 ... 450 нм и числовой апертурой оптической системы, равной 0,6. Новые технологии позволили получить и четко считывать питы длиной 0,26 мкм при шаге дорожек 0,44 мкм.