Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТСИ / OCR.pdf
Скачиваний:
67
Добавлен:
04.06.2015
Размер:
524.48 Кб
Скачать

Принципы IPA

Принцип адаптивности (adaptability)

подразумевает способность системы к самообучению.

Полученная при распознавании информация упорядочивается, сохраняется и используется впоследствии при решении аналогичных задач.

Многоуровневый анализ документа

Иерархическая структура документа:

 

Страница

 

Таблица

Блок текста

Картинка

Ячейка

Абзац

Строка

Слово Буква (символ)

Многоуровневый анализ документа

Большинство современных OCR-систем ведёт анализ документа в соответствии с одним из следующих принципов: top - down («сверху вниз») либо bottom - up («снизу вверх»).

Механизм «голосования»

Для принятия решений относительно того или иного объекта нередко используется механизм так называемого «голосования», voting.

Суть данного метода заключается в параллельной выработке нескольких гипотез относительно объекта и передаче их «эксперту», логическому блоку, выбирающему одну из них.

Такой метод широко практиковался на протяжении последнего десятилетия; в частности, существуют OCRсистемы, буквально составленные из двух или более независимых механизмов распознавания с общим «экспертом» на выходе.

Собственно же процедура «голосования» в наши дни используется по-прежнему широко, но не на уровне

архитектуры систем, а для решения несложных, рядовых задач.

Соседние файлы в папке ТСИ