Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие Матмодел.doc
Скачиваний:
92
Добавлен:
10.11.2019
Размер:
3.1 Mб
Скачать

5.4. Моделирование распознавания технической железнодорожной документации

В данном подразделе излагаются результаты моделирования, полученные старшим преподавателем ПГУПС Бурсиан Е.Ю., ученицей профессора Ходаковского В. А.

В работе рассматривается моделирование процесса распознавания символов, расположенных в ячейках таблицы технологической карты систем железнодорожной автоматики. Предлагаемые алгоритмы распознавания основываются на построении скелета символа с помощью моделирования распространения плоской волны по изображению символа. Рассматриваемые алгоритмы используются для автоматизации построения электронной базы данных железнодорожной документации.

Введение

Технологические карты систем железнодорожной автоматики представлены на листах документации форматов А0 или А1. Основную площадь листа занимает принципиальная или монтажная схема, имеющая вид таблицы. Линии таблицы построены, как правило, с помощью принтера с высоким качеством печати или с применением матричного принтера старого образца. Ячейки таблицы заполнены либо чертёжными рукописными символами, либо печатным текстом различного качества.

В рассматриваемой ситуации анализ неисправностей по данным чертежам в реальном времени имеет определённые сложности, так как получение информации о технических характеристиках приборов, схемах соединений и комплектации представляет собой трудоёмкую процедуру.

Для построения электронной базы данных исходная документация или её копии сканируются и применяются системы оптического распознавания текста (Optical Character Recognition – OCR-системы), либо ввод и структуризация информации осуществляется вручную. Ведущими разработками в данной области являются пакеты программ ABBYY FineReader и FormReader. Для распознавания таблиц, полиграфического текста и машинописных гарнитур применяется также программный пакет OCR CuneiForm. Комплекс программ ABBYY FineReader применяется главным образом для расшифровки печатного текста, пакет программ ABBYY FormReader содержит систему распознавания рукописных символов.

Применение рассматриваемых пакетов для распознавания железнодорожной документации, созданной с помощью чертёжных шрифтов вручную, приводит к распознаванию нескольких символов на листе документации. Также с помощью данных пакетов нельзя распознать ксерокопии невысокого качества ранее распечатанных электронных документов и документы, созданные с помощью матричного принтера.

Таким образом, создание программ распознавания для технологических карт систем железнодорожной автоматики и, в частности разработка средств распознавания символов является, актуальной задачей.

Постановка задачи

При построении модели процесса распознавания для технологической карты систем железнодорожной автоматики, предполагается, что сначала выполняется сегментация изображения, то есть осуществляется разделение текста, специальных знаков и таблицы, в которой представлена основная информация. При распознавании таблицы вычисляются средняя толщина и предельные значения толщины линий таблицы, устанавливаются координаты ячеек и определяется структура таблицы. При этом предполагается, что процессы обработки линий таблицы и символов являются параллельными, с обменом информацией.

Таким образом, при распознавании символов можно считать, что толщина линии является известной, примерные размеры (ширина и высота прямоугольника расположения) и координаты возможного местонахождения символов определяются исходя из значений координат ячеек таблицы. В данной работе предполагается, что символы являются рукописными чертёжными знаками. Необходимо разработать методы и средства распознавания символов, применимые в рассматриваемых условиях, и проверить их эффективность.