Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава10.DOC
Скачиваний:
3
Добавлен:
14.04.2019
Размер:
409.09 Кб
Скачать

Форматы представления графической информации в пк

Существуют два формата представления графической информации:

  • растровый;

  • векторный.

В растровом формате изображение запоминается в файле в виде мозаичного набора множества точек, соответствующих пикселам отображения этого изображения на экране дисплея. Файл, создаваемый сканером, в памяти компьютера имеет растровый формат (так называемая битовая карта — bitmap). Редактировать этот файл средствами стандартных текстовых и графических редакторов не представляется возможным, ибо они не работают с мозаичным представлением информации.

В векторном формате информация идентифицируется характеристиками шрифтов, кодами символов, абзацев и т. п. Стандартные текстовые процессоры предназначены для работы именно с таким представлением информации.

Фундаментальное отличие векторных форматов от растровых можно показать на таком примере: в векторном формате окружность идентифицируется радиусом, координатами своего центра, толщиной и типом линии; в растровом формате хранятся просто последовательные ряды точек, геометрически формирующих окружность.

Следует также иметь в виду, что битовая карта требует очень большого объема памяти для своего хранения. Так, битовая карта с одного листа документа формата А4 (204´297 мм) с разрешением 10 точек/мм и без передачи полутонов (штриховое изображение) занимает около 1 Мбайта памяти, она же при воспроизведении 16 оттенков серого — 4 Мбайта, при воспроизведении цветного качественного изображения (стандарт HighColor — 65 536 цветов) — 16 Мбайт. Иными словами, при использовании стандарта TrueColor и разрешающей способности 50 точек/мм для хранения даже одной битовой карты может не хватить емкости НМД.

Для сокращения объема памяти, необходимой для хранения битовых карт, используются различные способы сжатия информации. Наиболее распространенный алгоритм растрового уплотнения CCITT(Compressed Tagged Image File Format) Group 4 дает коэффициент сжатия информации до 40:1 (в зависимости от содержания файла – графика сжимается существенно сильнее текста ). Другие используемые форматы сжатия: CTIFF Group 3 , семейство MPEG (Multimedia Photographics Experts Group), JPEG (Joint PEG),), GIF (Graphics Interchange Format) и др.

Форматы без сжатия: Uncompressed TIFF (Tagged Image File Format), BMP (BitMaP) и др.

Сканер используется обычно совместно с программами распознавания образов — OCR (Optical Character Recognition). Система OCR распознает считанные сканером с документа битовые (мозаичные) контуры символов и кодирует их ASCII-кодами, переводя в удобный для текстовых редакторов формат.

Некоторые системы OCR предварительно нужно обучить — ввести в память сканера шаблоны и прототипы распознаваемых символов и соответствующие им коды. Сложности возникают при различении букв, совпадающих по начертанию в разных алфавитах (например, в латинском (английском) и в русском — кириллица) и разных гарнитур шрифтов. Но большинство систем не требуют обучения: в их памяти уже заранее помещены распознаваемые символы. Так, одна из лучших OCR — FineReader — распознает тексты на десятках языках (в том числе языках программирования Basic, C++ и т. д), использует большое число электронных словарей, при распознавании проверяет орфографию, готовит тексты к публикации в Интернете и т. д.

В последние годы появились интеллектуальные программы распознавания образов типа Omnifont (Cunei Form 2000), которые опознают символы не по точкам, а по характерной для каждого из них индивидуальной топологии. При наличии системы распознавания образов текст записывается в память ПК уже не в виде битовой карты, а в виде кодов, и его можно редактировать обычными текстовыми редакторами.

Файлы в растровом формате разумно хранить только в том случае, если:

  • документы и соответствующие им файлы не должны редактироваться в процессе их использования;

  • документ должен храниться в виде факсимильных копий оригинала (фотографии, рисунки, документы с резолюциями и т. п.);

  • имеются технические возможности для хранения и просмотра большого числа огромных (по 1–20 Мбайт) файлов.

Основные факторы, учитываемые при выборе сканера:

  • размер, цветность и форма (листовые, сброшюрованные и т. д.) документов, подлежащих сканированию, должны соответствовать возможностям сканера;

  • разрешающая способность сканера должна обеспечивать воспроизведение высококачественных твердых копий документов по их электронным образам;

  • производительность сканера должна быть достаточно высокой при приемлемом качестве получаемого изображения;

  • должна обеспечиваться минимальная погрешность в размерах получаемого электронного изображения по отношению к оригиналу в случае, если размеры изображения с электронного документа служат основанием для производства расчетов;

  • необходимо наличие программных средств сжатия растровых файлов при хранении их в памяти компьютера;

  • необходимо наличие программных средств распознавания образов (OCR) при хранении векторных файлов в памяти компьютера;

  • необходимо наличие программно-аппаратных средств для улучшения качества изображения в растровых файлах (повышения контрастности и яркости изображения, удаления фонового «шума»);

  • качество и тип бумаги носителя в известных пределах не должны сильно влиять на качество получаемого электронного изображения;

  • работа на сканере должна быть удобной и простой и исключать ошибки при сканировании при неверной заправке носителя;

  • учитывается стоимость сканера.

Сканер может подключаться к ПК через параллельный (LPT) или последовательный (через интерфейс USB) порт. Для работы со сканером ПК должен иметь специальный драйвер, желательно, драйвер, соответствующий стандарту TWAIN. В последнем случае возможна работа с большим числом TWAIN-совместимых сканеров и обработка файлов поддерживающими стандарт TWAIN программами, например, распространенными графическими редакторами CorelDraw, Adobe Photoshop, MaxMate, Picture Publisher, Photo Finish и т. д.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]