Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка_2010.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
23.45 Mб
Скачать

Тип пикселя

Рассмотрим теперь растровое цифровое изображение как чистую структуру данных, абстрагировавшись от всего, что было изложено выше и касалось физических особенностей и способов их получения. Поскольку с геометрической (и программной) точки зрения структура любого изображения совершенно стандартна и представляет собой регулярный двумерный массив (матрицу) пикселей, различные типы изображений могут порождаться только оригинальным типом данных, представляющим пиксель.

В таблице 1.1.3 сведены основные варианты структур двумерных растровых данных различного типа.

@Таблица 1.1.3. Изображения с различным типом пикселя

Тип пикселя

Емкость (в битах)

Яркостное разрешение (диапазон)

Семантический смысл

Bit (Boolean)

1

[0,1]

Бинарное изображение. 0 – «фон», 1 – «объект»

Byte (char, shortint)

8

[0..255], [–128..127]

Полутоновое изображение стандартного яркостного разрешения – со знаком и без знака

Integer (word, int)

10, 12, 16

[0..210–1], [–29.. 29–1],

[0..212–1], [–211.. 211–1],

[0..216–1], [–215.. 215–1]

Полутоновое изображение повышенного яркостного разрешения – со знаком и без знака. Меточные изображения

Long (double word, long int)

32, 64

[0..232–1], [–231.. 231–1],

[0..264–1], [–263.. 263–1]

Полутоновое изображение высокого яркостного разрешения – со знаком и без знака

RGB (TColorRef)

24, 32

[{0,0,0}..{255,255,255}] [{0,0,0,0}..{255,255,255,255}]

Цветное изображение. Разрешение 8 бит на цветовой канал. С выравниванием и без

Real (fixed, float, double)

*

**(зависит от реализации)

Действительнозначное изображение. Результат обработки

Complex

*

**(зависит от реализации)

Комплексное изображение. Результат перехода в частотную область

Vector (array of…)

*

**(зависит от реализации)

Векторное изображение. Многозональные и гиперспектральные данные. Результаты комплексирования. Результаты вычисления множественных признаков

По типу данных изображения делятся на битые (булевские, логические), байтовые (со знаком и без знака), целочисленные (со знаком и без знака), действительные (с фиксированной и плавающей точкой), цветные (специальный тип данных) и векторные (пиксель представляет собой массив или список численных значений).

В семантическом плане об этих типах изображений можно вкратце сказать следующее:

  • Бинарные изображения (битые, булевские, логические). 0 обозначает пиксель «фона», 1 – пиксель «объекта», «символа» (или наоборот – зависит от знака контраста объект/фон). В качестве исходного бинарное изображение формирует только один тип устройств ввода – оптический сканер в режиме сканирования текстовых документов. В качестве промежуточных и окончательных результатов обработки изображения такого типа широко используются в задачах обнаружения объектов, задачах морфометрических измерений, системах автоматического считывания текста и штриховых кодов;

  • Полутоновые изображения стандартного разрешения (байтовые без знака). На сегодня разрешение 8 бит (диапазон значений [0..255] – 256 градаций серого) – фактический стандарт для систем видеоввода, способных работать в реальном времени – фреймграбберов и цифровых видеокамер для технического зрения и систем видеонаблюдения. Это самый распространенный формат входных полутоновых данных. Соответственно в том же формате представляются и результаты фильтрации полутоновых изображений. Системный тип данных TBitmap поддерживается операционной системой Windows как часть графического интерфейса на системном уровне;

  • Результаты обработки полутоновых изображений, в которых возможны отрицательные значения пикселей (байтовые со знаком). Короткое целое со знаком используется для представления промежуточных результатов обработки в целях экономии используемого объема памяти. Длинное целое со знаком стандартной и двойной длины используется при реализации всех возможных целочисленных операций над изображениями (например, накопления разнообразных сумм и разностей) в случае, если нет необходимости в специальном ограничении потребных объемов памяти. Действительные значения пикселей используются при реализации различных нецелочисленных операций и преобразований над изображениями. В случае, если требуется ограничить объем задействованной памяти или увеличить быстродействие алгоритмов, вместо представлений с плавающей точкой используются представления действительных чисел с фиксированной точкой;

  • Полутоновые изображения повышенного разрешения (целочисленные без знака). Используются в тех случаях, когда диапазон в 256 градаций серого не позволяет отразить все богатство исходной информации, предоставляемое датчиком в силу его физической природы. Таким образом оцифровываются, в частности, медицинские рентгеновские и томографические изображения, а также астрономические и технические изображения, полученные в результате длительных экспозиций. Многие специализированные медицинские и технические устройства формируют на выходе изображения с яркостным разрешением в 10 или 12 бит, однако в компьютерных системах обработки такие данные удобно дополнять до «целого слова» в 16 бит, с которым проще и быстрее оперируют современные 16-, 32- и 64-битные вычислительные архитектуры;

  • Меточные изображения (целочисленные без знака стандартной или двойной длины). Используются при автоматическом выделении связных областей и объектов. Каждый пиксель такого изображения помечен номером области, которой он принадлежит. Байтовые изображения здесь не подходят, так как в них можно закодировать только 255 различных областей, а на изображениях высокого разрешения их могут оказаться десятки и даже сотни тысяч;

  • Двумерные частотные характеристики – комплексные изображения, состоящие из действительной и мнимой части. Формируются в результате двумерного преобразования Фурье, быстрого преобразования Фурье (БПФ), двумерного косинусного преобразования (ДКП) и т.п. преобразований изображения из пространственной области в частотную. На программном уровне, как правило, реализуются не как двумерный массив комплексных чисел (двухкомпонентных векторов), а как пара двумерных массивов (изображений), один из которых представляет действительную часть образа, а второй – мнимую;

  • Цветные изображения – специальный тип данных, запись формата TcolorRef = {Red, Green, Blue}. Разрешение по каждому из каналов – 8 бит. С целью выравнивания до «целого слова» 32-битной архитектуры часто дополняется еще одним 8-битным компонентом: TColorRef32 = {Red, Green, Blue, Reserved}. Цветное изображение – системный тип данных. Он поддерживается всеми устройствами ввода цветовых изображений. Кроме того, стандартный тип данных TRGBBitmap поддерживается операционной системой Windows как часть графического интерфейса на системном уровне;

  • Многозональные и гиперспектральные изображения – векторные, пиксель представляет собой массив целочисленных значений. Формируются специальными устройствами ввода. Используются для попиксельной классификации и сегментации изображений. На программном уровне, как правило, реализуются не как двумерный массив векторов, а как набор двумерных изображений, каждое из которых соответствует одной зональной или спектральной компоненте;

  • Признаковые изображения – скалярные или векторные, пиксель представляет собой скаляр, массив или список действительных значений. Представляют собой результат признакового анализа изображений. Используются для попиксельной классификации и сегментации изображений. На программном уровне, как правило, реализуются не как двумерный массив векторов, а как набор двумерных изображений, каждое из которых соответствует одному типу признаков.