- •Системы автоматического ввода текста
- •Слайд 3. Этапы распознавания текста
- •Слайд 4. Характеристики систем распознавания текста
- •Слайд 5. Цифровое обозначение товара
- •Слайд 7. Корреляционный метод распознавания текста. Этапы принятия решения относительно введенного символа
- •Слайд 8. Метод распознавания текста по вторичным признакам. Этапы принятия решения относительно введенного символа
Слайд 4. Характеристики систем распознавания текста
Систему распознавания текста принято характеризовать:
вероятностью ошибок распознавания, т. е. числом неправильно распознанных символов, приходящимся на сто правильных;
вероятностью отказов от распознавания, т. е. числом символов, для которых устройство или программа распознавания не находит соответствующей меры сходства.
Для уменьшения вероятности ошибок и отказов от распознавания в некоторых случаях, например на упаковках потребительских товаров, обложках книг, конвертах и т. д., применяют специальные кодированные, стилизованные или нормализованные шрифты.
В системах автоматизированной продажи различных изделий (например, книг) и учета товаров на складах и в магазинах наибольшее распространение получили кодированные шрифты, представляющие собой комбинации штрихов различной толщины. Такая запись может быть легко прочитана посредством простейшего ручного сканера и введена в базу данных компьютера. Одновременно с нанесением кодированного шрифта на документе размещается и привычное для человека цифровое обозначение товара (слайд 5).
Слайд 5. Цифровое обозначение товара
Так, в тринадцатиразрядном цифровом коде, например 4002823010903 первые две цифры означают страну-изготовителя товара (Ассоциацией EAN (European Article Number, EAN (европейский номер товара)) число 40 присвоено Германии), пять следующих цифр (02823) – фирму-изготовителя, а пять последующих цифр (01090) — наименование и некоторые свойства товара (в данном случае, это замороженная курица). Последняя цифра (3) служит в качестве контрольной, служащей для проверки правильности считывания штрихового кода. Чтобы ее найти, нужно сложить цифры на четных позициях кода (0 + 2 + 2 + 0 + 0 + 0 = 4), полученный результат умножить на 3 (4 х 3 = 12), сложить все цифры на нечетных позициях кода (4 + 0 + 8 + 3+ 1 + 9 = 25), затем произвести сложение двух последних чисел (12 + 25 = 37) и, наконец, найти разность между найденной суммой и ближайшим числом, кратным 10 (40 – 37 = 3).
Каждая цифра кодируется комбинацией из семи светлых и темных полосок, причем в правой и левой частях, разделенных двумя направляющими полосками, кодирование выполняется инверсным способом, что дает возможность определить направление перемещения сканера слева направо или справа налево. Направляющие полоски служат для определения начала и конца цифрового кода, делая возможным его чтение, практически независимым от скорости перемещения сканера. Смежные темные и светлые полоски сливаются, образуя широкие полоски. Комбинации подобраны так, что каждая десятичная цифра кодируется четырьмя результирующими полосками, причем в левой половине кода крайняя левая полоска цифры светлая, а в правой половине — темная.
Можно использовать и другой способ кодирования чередующимися светлыми и темными полосками. Так, широкой полоске ставится в соответствие «1», а узкой — «0». Общее число полосок фиксируется, например 5 темных и 4 светлых. Изображение каждой цифры начинается и заканчивается темной полоской, а между цифрами предусматривается пробел.
Далее.
Нормализованные шрифты наносятся от руки в строго определенных местах документа, обозначенных прямоугольниками. Примером нормализованного шрифта может служить обозначение почтового индекса на конвертах для писем или сделанного вами выбора какого-либо депутата в избирательном бюллетене. Прямоугольники печатаются на бланке документа тонкими или цветными линиями, которые не воспринимаются считывающим устройством.
Примерами стилизованных шрифтов могут служить оптический шрифт РОС-А, а также магнитный шрифт Е13В. Оптический стилизованный шрифт РОС-А использовался до появления персональных компьютеров для печати документов и последующего ввода этих документов в память машины. Вначале составлялось первичное описание в соответствии с величиной сигнала, получаемого при отражении света от элементов прямоугольной сетки, покрывающей символ. Вторичное описание каждого символа представляет набор структурных признаков — наличие или отсутствие вертикального, горизонтального или наклонного штриха, наличие точек и их взаимное расположение.
При чтении магнитного стилизованного шрифта Е13В широкая магнитная головка передвигается вдоль строки. Величина сигнала с магнитной головки пропорциональна суммарной ширине всех горизонтальных участков изображения символа. Полученный сигнал преобразуется в цифровую форму, и каждому символу ставится в соответствие фиксированное количество чисел. По этим числам программно определяется код вводимого символа. Этот шрифт использовался при обработке банковских документов. Но с появлением ПК необходимость в стилизованных шрифтах отпала.
Методы распознавания символов.
Современный сканер считывает информацию построчно, поэтому, несмотря на большое число различных алгоритмов распознавания, все они последовательно выделяют символы, разделенные промежутками, и затем распознают эти символы в результате сравнения составленного описания с эталонными описаниями символов используемого шрифта. При сравнении выбираются определяющие признаки, и определяется мера сходства составленного описания символа с описаниями эталонов. Наиболее распространен корреляционный метод сравнения.
Слайд 6. Корреляционный метод распознавания текста
Изображение каждого символа «покрывается» прямоугольной сеткой, шаг которой соответствует шагу перемещения сканера. Тогда анализируемое изображение символа «х» можно описать последовательностью чисел, характеризующих яркость каждого элемента сетки. Все эти числа, описывающие изображение символа, образуют n-мерный вектор V(x), где vi(х) — значение яркости i-гo элемента сетки. Эталонные описания всех символов алфавита (например, «а») также представляют собой n-мерные вектора E(a), состоящие из элементов еi(a). Сравнивая вектор V(x) со всеми векторами Е(а, ..., z) и находя их меру сходства, можно с определенной вероятностью определить вводимый символ. Вероятность правильного определения символа зависит от нескольких факторов – освещенности изображения символа, наличия светового фона, смещения символа со строки, перекоса символа и т. д. Все эти факторы приводят к необходимости преобразования эталонных описаний перед проведением сравнения их с описанием вводимого символа. Яркость каждого элемента в преобразованном эталонном описании можно определить следующим образом:
е*i(а, ) = α • еi(а, ) + β,
где α, β – параметры, характеризующие изменение освещенности и яркости фона; – параметр, определяющий другие факторы. Преобразованный вектор может служить новым эталонным описанием, этот вектор имеет вид:
E*(а, ) = α • E(а, ) + β • J,
где J — единичный вектор.
Обычно при распознавании символа в качестве меры сходства используют скалярное произведение вектора V(x) на нормированную составляющую С(а, ) вектора E*(а, ), ортогональную J. Максимальное значение скалярных произведений и позволяет принять решение о соответствии символа «х» тому или иному эталону (а, ..., z). Для принятия решения относительно вводимого символа необходимо:
