![](/user_photo/1334_ivfwg.png)
- •Оглавление
- •Введение
- •Глава 1. МИКРОПРОЦЕССОРНЫЕ СИСТЕМЫ
- •1.1. Понятие архитектуры вычислительной системы. Структура аппаратной части и назначение основных функциональных узлов
- •1.2. Базовые параметры и технические характеристики ЭВМ
- •Контрольные вопросы к главе 1
- •Глава 2. СТРУКТУРА И ФУНКЦИОНИРОВАНИЕ ПРОЦЕССОРА
- •2.2. Устройство управления с программируемой логикой
- •2.3. Устройство управления с жесткой логикой
- •2.4. Слово состояния процессора
- •2.5. Микроконтроллеры
- •2.6. Особенности организации однокристальных и секционных микропроцессоров
- •2.8. Архитектура и функционирование микропроцессора
- •Контрольные вопросы к главе 2
- •Глава 3. СИСТЕМЫ КОМАНД МИКРОЭВМ
- •3.1. Язык микроопераций для описания вычислительных устройств
- •3.2. Структура и формат команд микропроцессора и МПС
- •3.3. Программирование микропроцессора
- •Контрольные вопросы к главе 3
- •Глава 4. ТЕНДЕНЦИИ РАЗВИТИЯ АРХИТЕКТУРЫ И АППАРАТНОГО ОБЕСПЕЧЕНИЯ ЭВС
- •4.1. Требования различных задач к вычислительным ресурсам и ограничения фон-Неймановской архитектуры
- •4.2. Распараллеливание процессов обработки информации
- •4.3. Принцип совмещения операций. Конвейерная обработка информации
- •4.4. Архитектура процессоров с сокращенным набором команд
- •4.5. Применение кэш-памяти и повышение пропускной способности
- •4.6. Транспьютеры
- •4.7. Развитие новых архитектурных принципов
- •4.8. Оценка производительности скалярного процессора
- •Контрольные вопросы к главе 4
- •Глава 5. ОПЕРАТИВНАЯ ПАМЯТЬ
- •5.1. Классификация и иерархическая структура памяти ЭВМ
- •5.2. Запоминающие элементы статических ОЗУ
- •5.3. Запоминающие элементы динамических ОЗУ
- •5.4. Структуры матриц накопителей информации
- •5.5. Структура построения БИС статических ОЗУ и модулей памяти
- •5.6. Структура построения БИС динамических ОЗУ
- •5.7. Элементная база и организация постоянных запоминающих устройств
- •Контрольные вопросы к главе 5
- •Глава 6. ВНЕШНИЕ ЗАПОМИНАЮЩИЕ УСТРОЙСТВА НА МАГНИТНЫХ НОСИТЕЛЯХ
- •6.1. Принцип записи двоичной информации на магнитную поверхность
- •6.3. Методы записи цифровой информации на магнитный носитель
- •6.4. Воспроизведение информации и повышение ее достоверности
- •6.5. Накопители на гибких магнитных дисках и их контроллеры
- •6.6. Накопители на жестких магнитных дисках типа винчестер и их контроллеры
- •6.7. Накопители на сменных магнитных дисках
- •6.8. Накопители на магнитной ленте
- •Контрольные вопросы к главе 6
- •Глава 7. ОПТИЧЕСКИЕ И МАГНИТООПТИЧЕСКИЕ ВЗУ
- •7.1. Лазерные системы и их применение в устройствах внешней памяти
- •7.2. Оптические диски
- •7.3. Магнитооптические диски
- •7.4.Устройство накопителя на оптических дисках
- •Контрольные вопросы к главе 7
- •Глава 8. ВЗУ НА ЦМД-СОДЕРЖАЩИХ МАТЕРИАЛАХ
- •8.1. Принципы возникновения цилиндрических магнитных доменов
- •8.2. Организация продвижения ЦМД
- •8.4. Структура ЦМД-микросхем памяти
- •8.5. Устройство ЦМД-накопителя
- •Контрольные вопросы к главе 8
- •Глава 9. ВЗУ НА ОСНОВЕ ГОЛОГРАФИИ
- •9.1. Носители информации голографических ЗУ
- •9.2. Создание голограмм
- •9.3. Воспроизведение голограмм
- •9.4. Голографические ЗУ двоичной информации
- •Контрольные вопросы к главе 9
- •Глава 10. ОРГАНИЗАЦИЯ БЕЗАДРЕСНОЙ И ВИРТУАЛЬНОЙ ПАМЯТИ
- •10.1. Стековая память
- •10.2. Ассоциативная память
- •10.3. Виртуальная память со страничной организацией
- •10.4. Структура виртуальной памяти при сегментном распределении
- •Контрольные вопросы к главе 10
- •Глава 11. НАЗНАЧЕНИЕ ПЕРИФЕРИЙНЫХ УСТРОЙСТВ
- •11.1. Классификация периферийных устройств
- •Контрольные вопросы к главе 11
- •Глава 12. УСТРОЙСТВА АВТОМАТИЧЕСКОГО СЧИТЫВАНИЯ ТЕКСТОВ
- •12.1. Устройства автоматического ввода печатных текстов
- •12.2. Методы распознавания образов печатных знаков
- •12.3. Устройства автоматического ввода рукописных текстов
- •12.4. Средства считывания и хранения графических изображений поврежденных рукописных текстов
- •12.5. Кодирование текстов для электронных публикаций
- •Контрольные вопросы к главе 12
- •Глава 13. УСТРОЙСТВА АВТОМАТИЧЕСКОГО ВВОДА ИЗОБРАЖЕНИЙ
- •13.1. Устройства автоматического ввода одноконтурных изображений
- •13.2. Устройства автоматического ввода многоконтурных и полутоновых изображений
- •13.3. Считывание цветных изображений
- •Контрольные вопросы к главе 13
- •Глава 14. УСТРОЙСТВА ПОЛУАВТОМАТИЧЕСКОГО ВВОДА ГРАФИЧЕСКОЙ ИНФОРМАЦИИ - ДИГИТАЙЗЕРЫ
- •14.1. Устройство рабочего поля планшета
- •14.2. Структурная схема дигитайзера и ее функционирование
- •Контрольные вопросы к главе 14
- •Глава 15. УСТРОЙСТВА ВВОДА - ВЫВОДА РЕЧЕВОЙ ИНФОРМАЦИИ
- •15.1. Модель речи
- •15.2. Структурная схема анализатора речи
- •15.3. Структура устройств ввода речи
- •15.4.Устройства вывода речевой информации - синтезаторы
- •Контрольные вопросы к главе 15
- •Глава 16. УСТРОЙСТВА ОТОБРАЖЕНИЯ ИНФОРМАЦИИ - ДИСПЛЕИ
- •16.1. Классификация дисплеев
- •16.2. Способы формирования изображения на экране телевизионного дисплея
- •16.3. Структурная схема текстового телевизионного дисплея
- •16.4. Структурная схема графического телевизионного дисплея
- •16.5. Устройство плоских экранов
- •Контрольные вопросы к главе 16
- •Глава 17. АВТОМАТИЧЕКИЕ УСТРОЙСТВА РЕГИСТРАЦИИ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ - ГРАФОПОСТРОИТЕЛИ
- •17.1. Классификация и устройство графопостроителей
- •17.2. Принципы работы графопостроителя по вычерчиванию
- •17.3. Структурная схема планшетного графопостроителя
- •17.4. Структурная схема растрового графопостроителя
- •Контрольные вопросы к главе 17
- •Глава 18. АППАРАТУРА ПРИЕМА-ПЕРЕДАЧИ ИНФОРМАЦИИ
- •18.1. Обобщенная структурная схема аппаратуры передачи дискретной информации
- •18.2. Характеристики аппаратуры передачи данных
- •18.3. Принципы организации интерфейсов
- •18.4. Классификация интерфейсов
- •Контрольные вопросы к главе 18
- •Глава 19. АВТОМАТИЧЕСКИЕ УСТРОЙСТВА ВВОДА-ВЫВОДА АНАЛОГОВОЙ ИНФОРМАЦИИ В ЭВМ
- •19.1. Назначение устройств ввода-вывода аналоговой информации в ЭВМ
- •19.2. Принципы построения ЦАП и АЦП
- •19.3. Принципы построения и программирование системы ввода-вывода аналоговой информации в ЭВМ
- •Контрольные вопросы к главе 19
- •Глава 20. КАНАЛЫ ВВОДА-ВЫВОДА И АППАРАТУРА СОПРЯЖЕНИЯ
- •20.2. Организация обмена массивами данных
- •20.3. Мультиплексный канал
- •20.4. Селекторный канал
- •20.5. Устройства сопряжения - мультиплексоры передачи данных
- •Контрольные вопросы к главе 20
- •Глава 21. УСТРОЙСТВА ЗАЩИТЫ ОТ ОШИБОК В ПЕРЕДАВАЕМОЙ ИНФОРМАЦИИ
- •21.1. Причины возникновения ошибок в передаваемой информации
- •21.2. Краткая характеристика способов защиты от ошибок
- •21.3.Обнаруживающие коды - с проверкой на четность и итеративный код
- •21.4. Корректирующий код Хэмминга
- •21.5. Циклические коды
- •21.6. Циклический код Файра как средство коррекции пакетов ошибок
- •Контрольные вопросы к главе 21
- •ЗАКЛЮЧЕНИЕ
- •Приложение 2
- •Приложение 3
- •Приложение 4
- •Приложение 5
- •Приложение 6
- •Приложение 7
- •Приложение 8
- •Приложение 9
- •Приложение 10
- •Приложение 11
- •Приложение 12
- •Приложение 13
- •Приложение 14
- •Приложение 15
- •Приложение 16
- •Приложение 17
- •Приложение 18
- •Приложение 19
- •Приложение 20
- •Приложение 22
- •Приложение 23
- •Приложение 24
- •Приложение 25
- •Приложение 26
- •Предметный указатель
- •Список литературы
![](/html/1334/288/html_lWzDNqkTWr.70HG/htmlconvd-VplQW_191x1.jpg)
Глава 12. Устройства автоматического считывания текстов |
191 |
штабирование - от 1% до 400% с пошаговым изменением в 1% при 300 dpi в зависимости от разрешения; сканирующий элемент - прибор с зарядовой связью; источник света - одиночная ксеноновая лампа; интерфейс SCSI-2, с автоматической оконечной нагрузкой.
Функциональные характеристики сканера: скорость сканирования в ОЗУ без учета времени калибровки (4 с): 22 с для 8-разрядной шкалы серого цвета или 24-разрядного цвета; режимы сканирования: 1-разрядный для черно-белого, 4-разрядный для 16 уровней серого цвета, 8-разрядный для 256 уровней серого цвета либо для 256 оттенков цвета и 24разрядный для 16,7 миллиона цветовых оттенков. Потребление энергии 36 Вт максимум, в режиме простоя 8 Вт. Эксплуатационные характеристики сканера соответствуют требованиям международных стандартов.
Новая модификация сканера той же компании HP ScanJet 3c обеспечивает более высокое качество ввода благодаря разрешению 2400 точек на дюйм и оптическому разрешению 600 dpi и 1024-уровневому представлению тонов серого.
Для устройств ввода не только буквенных символов, но и иероглифов, разработан новый стандарт кодирования - UNICODE. Он представляет из себя 16-битовый набор кодов взамен 7-битового в стандартах ASCII и ISO-8859-1 (старое название Latin I). Это позволяет кодировать 65 536 символов. Для хранения эталонов этих символов требуется 10 - 20% объема оперативной памяти.
12.3. Устройства автоматического ввода рукописных текстов
Рукописные тексты вводятся читающими автоматами с использованием корреляционного метода, который обладает универсальностью к распознаваемому материалу, наиболее полно исследован и показывает высокие результаты.
Так же, как и в любом автоматическом устройстве ввода изображений, процесс ввода распадается на три этапа: анализ символа, его идентификация в результате сравнения считанного кода с кодами эталонов, кодирование в машинном коде и ввод в ЭВМ.
y |
|
∆ |
|
y |
|
∆ |
x |
х |
|
Рис. 12.8. Фрагмент рецепторного поля |
Рассмотрим первый этап - анализ символа, то есть разбиение его после бинаризации на элементы и получение считанного кода. Рецепторное поле представляет собой матрицу с шагом квантования Dx и Dy. Фрагмент поля с спроецированным на него участком линии контура рукописного знака приведен на рис. 12.8. Знак представляется в виде матрицы дискретных площадок Dx · Dy с координатами (x, y). Площадки могут быть белыми, черными и с преобладанием белых или черных участков в зависимости от расположения линий контура символа. Значение двоичной функции f(x, y) для каждого дискрета, где площадь вокруг координат (x, y) черная, принимается равным “1”, где площадь белая - “0”. Произведению значений этой функции для двух соседних точек линии f(x, y)· f(x+Dx, y+Dy) присваивается значение “1” лишь там, где одна точка черная, а другая - белая. На каждой паре точек распознаваемого символа S производится умножение значений этой функции.
![](/html/1334/288/html_lWzDNqkTWr.70HG/htmlconvd-VplQW_192x1.jpg)
Глава 12. Устройства автоматического считывания текстов |
192 |
Разным символам будет соответствовать свое количество пар перекрываемых черных участков. Автокорреляционная функция RS определяет число этих пар и определяется как
RS = Sx, y f(x, y)· f(x+Dx, y+Dy).
Автокорреляционная функция однозначно описывает символ, причем разрядность кода символа существенно меньше количества рецепторов матрицы, так как кодируются и суммируются лишь границы переходов от черного к белому и от белого к черному.
Для примера возьмем упрощенную матрицу из 12 рецепторов (рис. 12.9). Рецепторные поля реальных устройств имеют большее число рецепторов. По методу зондов, описанному в разделе о читающих автоматах печатного текста, получим 12-разрядный код символа “C”: 110100011000. По автокорреляционному методу код получается 6-разрядный: 011010, а автокорреляционная функция символа “C” будет RC = 3. Для символа “0” R0 = 4. Как видим, этот метод позволяет сжать информацию. Но главное достоинство этого метода заключается в том, что значения автокорреляционных функций для одних и тех же рукописных знаков, отличающихся начертанием, масштабом, наклоном, зависящими от почерка, будут близки друг к другу.
На этапе распознавания из памяти запрашиваются по одному коды автокорреляционных функций эталонов символов алфавита RV и сравниваются с RS . Результаты сравнения нормализуются путем деления их на квадратный корень из суммы квадратов элементов автокорреляционной функции соответствующего эталона, то есть на “вес” эталона, который равен
∑ к,у (R S (Dx , Dy) R V (Dx, Dy))/ ∑ к,у (R V (Dx, Dy)) 2 .
Распознаваемый символ идентифицируется, приписывается тому эталону, для которого эта сумма оказалась максимальной, что означает равенство или приблизительное равенство корреляционных функций символа и эталона:
RS(Dx, Dy) = RV(Dx, Dy).
Наименьшие кодовые расстояния имеются между кодами рукописных прописных символов “г”, “с”, “е” и “о”; “н” и “п”; “ш”, “щ” и “т”, поэтому на этапе распознавании этих символов возможны ошибки. Особые трудности вызывает распознавание заглавных букв, в написании которых авторы текстов особенно любят выражать свою индивидуальность. Здесь вплотную подходим к одной из задач создания интеллектуальных устройств ввода - обучению, то есть сбору эталонов новых символов и дополнению базы данных. И все-таки количество ошибок при распознавании рукописного текста например, разработанным компанией Grid Corporation читающим автоматом типа MK Gridpad, достигает 10%.
12.4. Средства считывания и хранения графических изображений поврежденных рукописных текстов
Реставрация поврежденных рукописных текстов представляет интерес для таких областей деятельности, как криминалистика, историография, языкознание и других. В Институте русского языка РАН проводилась работа с древними рукописями по их реставрации и архивированию с применением созданной системы цифровой обработки рукописных текстов. Единственный экземпляр рукописной картотеки древнерусского словаря, хранящей около 2 млн. довольно ветхих карточек с цитатами из уникальных письменных источников 11 - 18 веков, получил свое воплощение в форме страхового дубля в виде компьютерной базы данных.
Система цифровой реставрации и архивирования состоит из двух подсистем: подсистемы ввода и реставрации карточек и подсистемы наполнения и просмотра базы данных.
Подсистема ввода и реставрации построена на базе ПК 486DX2-50, к которому помимо обычных периферийных устройств подключено устройство оптического ввода - сканер
Глава 12. Устройства автоматического считывания текстов |
193 |
планшетного типа ScanNex II. Может использоваться и барабанный сканер в случае ввода текстов с фотопленок. Программное обеспечение этой подсистемы включает операционную систему MSDOS и систему диалоговой обработки изображений IMS-VGA, дополненную оригинальными программами ввода, реставрации и архивирования изображений.
Основой подсистемы базы данных, представляющей собой информационно-поиско- вую систему, является более мощный ПК Pentium-120 с оперативной памятью 16 Мбайт, с операционной средой Windows и СУБД Access. В состав подсистемы входят также стандартные ПУ и принтер, который можно использовать для распечатки копий найденных карточек. В НМД хранится системное программное обеспечение и оригинальные программы, позволяющие хранить в базе данных не обычные байтовые описания изображений карточек в форме файлов размером по 1 Мбайт каждый, а результаты их компактного представления (сжатия) и обеспечивающие обратное восстановление документов при выводе. Время показа одной карточки из базы не превышает 4-5 с. Архивы закодированных изображений вначале формируются на МД, а затем по мере накопления нужного объема переносятся на CD ROM или на магнитооптический диск.
Для повышения удобства и увеличения скорости взаимодействия подсистем они связаны между собой в одноранговую локальную сеть NWLITE (Novell NetWare Lite).
При вводе поврежденного документа (потемневший или окрашенный фон, зернистая структура низкокачественной бумаги, выцветшие чернила, пятна, просвечивающийся с оборота текст, разрывы и порезы) необходимо прежде всего провести его бинаризацию, то есть двухградационное представление изображения - черный текст на белом фоне. Для этого они должны быть подвергнуты трудоемкой обработке в диалоговом режиме. В рассматриваемой системе применен метод автоматической бинаризации на основе оценки локальных статистических параметров (среднего М, дисперсии D, асимметрии A и эксцесса E) многоградационного изображения текста в пределах скользящей окрестности произвольного размера (mxn отсчетов). Эти параметры вычисляются по формулам:
M = S1 / mn, D = S2 / mn - M2 ,
A = (S3 / mn - 3MD - M3) / D3/2 , E = ((S4 - 4S3 M) / mn + 6M2D) / D2 - 3,
m / 2 - 1 n / 2 - 1
где Sk = Σ |
Σ |
аk |
- сумма k -тых степеней отсчетов изображения а, |
u = - m / 2 n = - n / 2 |
i + u, j + n |
|
входящих в скользящую окрестность с центром в точке а ij .
После вычисления M, D, A и E бинаризация отсчетов а ij выполняется по формуле:
255, |
если а ij >M, D>D0 , E>0, |
b ij = } |
для остальных элементов. |
0 |
Точка а ij считается черной, когда яркость аij превышает среднее значение М , дисперсия D превышает заданный порог D0 (это позволяет оставлять белыми области, содержащие практически однородный фон), а эксцесс отрицателен ( что дает возможность отмечать черные точки лишь в областях с “широкой” функцией плотности вероятности, содержащих элементы букв, и оставлять белыми области с узким распределением вероятности, характерным для шума). На результат бинаризации влияют значения m, n и D0. В большинстве случаев можно применять значения m= n = 5, D = 8. Изображения примерно 90% карточек со значительными дефектами удается бинаризировать указанным способом, сразу получая приемлемое двухградационное изображение текста.
Рассмотрим теперь способ компактного представления графического изображения рукописного текста. Ввод изображения текста должен осуществляться с достаточно высо-
Глава 12. Устройства автоматического считывания текстов |
194 |
ким пространственным разрешением, не хуже 10 линий/мм, в противном случае их визуальное качество оказывается низким. Для карточек словаря это приводит к изображениям больших размеров, порядка 1000 строк по 1000 элементов. Хранение такого изображения на диске в обычном полутоновом черно-белом представлении порождает файл размером около 1 Мбайта. Это делает невозможным создание больших баз изображений текстов на персональном компьютере, к которому можно обычно подключить лишь 2 - 4 накопителя на магнитных или на оптических дисках объемом порядка 1 - 5 Гбайт. Здесь используются методы сжатия информации, тем более, что бинарные изображения рукописных текстов обладают значительной избыточностью.
Среди существующих методов сжатия графических изображений без потери информации наиболее подходит для решения задачи ввода и хранения рукописных текстов метод сжатого кодирования длин серий, представляющий изображение в виде чередующихся последовательностей белых и черных элементов с последующим составлением перечня длин этих последовательностей и кодированием этих длин кодом Хаффмана. Алгоритм Хаффмана осуществляет двоичное кодирование элементов конечного множества A = {a1, a2, . . . , an }, для каждого элемента а i которого предполагается известной вероятность рi его появления в сообщении. Для этого алгоритма выполняется префиксное условие, заключающееся в том, что никакое кодовое слово не является префиксом (то есть совпадающим с первыми символами) любого другого кодового слова. Кроме того, средняя длина получающихся кодовых слов оказывается минимальной. Таким образом, элемент аi c высокой вероятностью появления в сообщении будет кодироваться короткой двоичной строкой, а элемент с малой вероятностью появления - более длинной строкой.
Основная схема двумерного кодирования длин серий, зафиксированная в качестве стандарта CCITT как “модифицированный алгоритм READ”, имеет вид, показанный на рис. 12.10. В каждый момент процедуры кодирования используется информация о двух со-
седних строках изображения: текущей строке i |
и предшествующей ей строке i - 1. В строке |
i определяются положения трех отсчетов а0 , а1 |
и а2 , а в строке i - 1 - положения отсчетов |
b1 и b2 . Отсчеты а0 , а1 и а2 - это три последовательных отсчета, в которых цвет текущей |
строки меняется с белого на черный или с черного на белый. Кодированию подлежит серия (а0 а1 ). Отсчет b1 соответствует изменению цвета в предшествующей строке; он должен находиться справа от а0 и иметь тот же цвет, что а1. Отсчет b2 отвечает следующему за b1 изменению цвета в предшествующей строке.
В зависимости от взаимного расположения отсчетов а0, а1, b1 и b2 используется один из трех режимов кодирования: “проходной”, “вертикальный” или “горизонтальный”. “Проходной” режим (верхняя часть рис. 12.10) применяется, когда отсчет b2 находится слева от а 1. В этом режиме запоминается специальный код - признак режима, а затем отсчетом а0 считывается отсчет текущей строки, находящийся под b2 . Это позволяет изолировать короткие серии предшествующей строки, целиком находящиеся внутри длинных серий текущей строки. Если отсчет b2 находится над а1 или правее а1 , то оценивается кодовое расстояние между а1 и b1. Это расстояние есть |а1-b1|. Если это расстояние не превышает 3, устанавливается “вертикальный” режим, показанный в середине рис. 12.10, и значение кодового расстояния кодируется одним из семи специально выделенных коротких кодов. Это позволяет использовать короткий код для описания достаточно длинных серий, почти одинаково расположенных в текущей и предшествующей строках. После формирования этого кода отсчеты а0, а1, а2, b1 и b2 сдвигаются на одну серию вправо, и процесс кодирования повторяется для новой серии. Если расстояние |а1 - b1| превышает 3, то используется “горизонтальный“ режим кодирования (нижняя часть рис. 12.10), аналогичный применяемому при одномерном кодировании длин серий кодом Хафмана. Для обеспечения синхронизации серий в текущей и последующей строках “горизонтальному” кодированию подвергаются одна за другой две серии - (а0а1) и (а1а2). Затем отсчеты а0, a1 и а2 сдвигаются на две