Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Агапеев ФОЗ-310506дс Синтез «Ю», «Ы» плохой.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
884.75 Кб
Скачать

инистерство образования и науки Российской Федерации

ФГАОУ ВПО «УрФУ имени первого Президента России Б.Н.Ельцина»

Институт фундаментального образования

Кафедра информационных систем и технологий

Оценка работы:_____________

Члены Комиссии:_____________

Курсовая работа

СИНТЕЗ ПАТТЕРНОВ РУКОПИСНЫХ БУКВ ДРЕВНЕРУССКОГО АЛФАВИТА «Ю», «Ы»

Дисциплина «Интеллектуальные информационные системы и технологии»

Студент группы ФОЗ-310506дс

______________ Агапеев С.В.

Научный руководитель к. ф.- м. н.

_________________ Потанин Н.И.

Екатеринбург 2014

Министерство образования и науки Российской Федерации

ФГАОУ ВПО «УрФУ имени первого Президента России Б.Н.Ельцина»

Институт фундаментального образования

«Кафедра Информационных систем и технологий»

«УТВЕРЖДАЮ»

Зав. кафедрой______________________________

«_____» ____________________20 г.

Задание № __5__

по курсовой работе

            1. По дисциплине Интеллектуальные информационные системы и технологии

            2. Студент группы ФО-310501 специальность Информационные системы

            3. Фамилия Агапеев Имя Сергей Отчество Викторович

            4. Руководитель курсовой работы Потанин Н.И.

            5. Срок выполнения с 24.02.14_____________________ по 20.05.14

Тема СИНТЕЗ ПАТТЕРНОВ РУКОПИСНЫХ БУКВ ДРЕВНЕРУССКОГО АЛФАВИТА «Ю», «Ы»

Содержание работы (какие графические работы и расчеты должны быть выполнены)\

1.План выполнения курсовой работы

Наименование элементов курсовой работы

Сроки

Примечания

результаты

Отметка о выполнении

Согласование темы ,цели, задач и входных данных курсовой работы

До 20.02.14-

Оформление титульного листа, бланка, введения, плана работы и литературы.

Теоретическая часть – изучение основных моделей, алгоритмов

20.02.14-30.04.14

Основные понятия, методы распознавания букв, база знаний

Практическая часть Планирование машинного эксперимента

20.02.14-14.05.14

Описание букв, деформации, массив векторов

Анализ результатов с помощью методов ИИ

14.05.14-27.05.14

Обработка данных в квазаре

Заключение Основные выводы работы

20.05.14-25.05.14

Анализ результатов

Предварительный показ результатов курсовой работы на ПК

20.02.14-20.05.14

Сдача печатного и электронного варианта курсовой работы с программами (на СД).

25.05.14-25.06.14

2.Курсовая работа закончена 30.05.14

3.Оценка работы_______________________________________________________Руководитель

СОДЕРЖАНИЕ

ВВЕДЕНИЕ 4

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 6

1.1Методы распознавания букв 7

1.2Распознавание рукописных символов, теория Гренандера 8

1.3Синтаксический подход к распознаванию образов 9

1.4 Система синтаксического распознавания образов.........................15

ПРАКТИЧЕСКАЯ ЧАСТЬ 13

2.1 Описание рукописных букв 13

2.2 Деформация рукописных букв и матрицы смежности 14

2.3 Создание массива векторов 20

2.4 Обработка массива векторов в «Квазаре». Таксономия 22

2.5 Листинг с коэффициентом корреляции от 0.9 до 1 23

2.6 Построение графа корреляции 30

2.7 Вывод 33

ЗАКЛЮЧЕНИЕ 34

СПИСОК ЛИТЕРАТУРЫ 35

По дисциплине Интеллектуальные информационные системы и технологии 2

Студент группы ФО-310501 специальность Информационные системы 2

Фамилия Агапеев Имя Сергей Отчество Викторович 2

Руководитель курсовой работы Потанин Н.И. 2

Срок выполнения с 24.02.14_____________________ по 20.05.14 2

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 7

1.1Методы распознавания букв 7

С ростом автоматизации производства, возникла необходимость обеспечить работу многих технологических процессов без участия человека. Главным образом это процессы, связанные с рутинной, однообразной работой или опасные для человека. В таких процессах человека целесообразно заменить на автоматы, реагирующие на различные отклонения параметров технологического процесса от номинальных. Создание таких автоматов являлось первым шагом на пути к построению распознающих систем.

Целью работы: освоение технологии анализа изображений.

Задачи работы: изучить теорию Гренандера, алгоритмы распознавания изображений, описать рукописные буквы, обработать их в Квазаре, проанализировать полученные данные и построить графы корреляции.

План работы ( оценка этапов):

  1. согласовать тему курсовой работы и отметить в журнале курсовых работ

  2. выбор букв в алфавите

  3. перенос каждого экземпляра буквы из АЛФАВИТА в EXEL файл фамилия группа буквы

ДАЛЕЕ РАБОТА ИДЕТ С КАЖДОЙ БУКВОЙ

  1. Выделить крайние и существенные точки буквы ( PAIN – точки существенные – ЗЕЛЕНЫЕ )( вначале изменяется Y потом X -- смотри таблицу КОДИРОВКИ ) выслать potaninni@list.ru

  2. Деформация буквы. Выделить структурные элементы связей. ( пример линия дуга ). Какие и как элементы могут переходить друг друга. Нарисовать крайние форм букв , т.е. такие буквы, что их можно распознать как другую букву. выслать potaninni@list.ru

  3. Построить матрицы смежности ДЛЯ ВСЕХ ДЕФОРМАЦИЙ ( Желательно в МАТЛАБЕ – ПРОГРАММА)

Найти минимальное и максимально ( по количеству вершин ) описание букв.

  1. Построение ИНВАРИАНТОВ ПРОСТОГО ГРАФА. Расширить все матрицы смежности до максимального размера. ( добавить нулевые строки и столбцы)

  2. Развернуть матрицу по строкам - получим N- вектор

Создать МАССИВ n- ВЕКТОРОВ для обработки в КВАЗАРЕ ( отдельный лист EXEL название - МАССИВ n- ВЕКТОРОВ буква выслать potaninni@list.ru

  1. Перевести МАССИВ n- ВЕКТОРОВ в файл .txt по структуре КВАЗАРА выслать potaninni@list.ru

  2. Обработка файла описания букв в КВАЗАРЕ. Таксономия векторов и признаков

  3. Построить Образ (таксон) БУКВЫ

  4. Таксономия признаков Параметры – режим - ручной просчет ( смотри папка та признаков и методичка КВАЗАР

  5. Коэф корреляции от 0.9 до 1

  6. Листинг выслать potaninni@list.ru

  7. Простроить граф корреляции 0.9 , 0.95, 1 выделить вершины (существенные признаки – МУВ - круги большого размера).

    Ro Величина корреляции

    Линии связей графа

    0,98 < Ro

    3 линии

    0.94 < Ro < 0,975

    2 линии

    0.895 < Ro < 0,94

    1 линия

  8. Провести анализ на вложенность графов. В графе 0.9 выделить толщиной линий граф 0.95 и граф 1 выслать potaninni@list.ru

Оценка отлично

Входные данные – согласованы с преподавателем.

Теоретическая часть

    1. 1.1Методы распознавания букв

Распознавание рукописного текста- это способность компьютера получать и интерпретировать интеллектуальный и рукописный ввод. Распознавание текста может производиться оффлайновым методом из уже написанного на бумаге текста или онлайновым методом считыванием движением кончика ручки, к примеру по поверхности специального компьютерного экрана

Оффлайновый вид распознавания успешно применяется в сферах деятельности, где необходимо обрабатывать большое количество рукописных документов, к примеру, в страховых компаниях. Качество распознавания можно повысить, используя структурированные формы. Кроме того, можно улучшить качество, уменьшив диапазон возможных вводимых символов.

Точное распознавание латинских символов в печатном тексте в настоящее время возможно, если доступны четкие изображения, такие как сканированные печатные документы. Точность при такой постановке задачи превышает 99%, абсолютная точность может быть достигнута только путем последующего редактирования человеком.

1.2 Распознавание рукописных символов

Рис.1. «Витиеватые» символы

Надежность распознавания очень сильно зависит от качества изображений символов, которое определяется формой символов или стилем написания и способом выполнения.

Рис. 2. Символы с конфликтным начертанием

Хороший стиль написания означает, что знак по форме легко узнаваем, не содержит лишних деталей (декоративных украшений, рис. 1), но все необходимые элементы присутствуют. Кроме того, форма не должна вызывать конфликтов при определении человеком принадлежности символа ко вполне определенному классу (рис. 2). Реально оказывается, что символы, написанные различными людьми, отличить по классам очень трудно или вообще невозможно.

Рис. 3. Качество выполнения знака

Хорошие по выполнению знаки подразумевают неразрывность штрихов, гладкость краев (отсутствие «бахромы»), отсутствие ложных касаний или полных заплывов (рис. 3). Качество выполнения зависит не только от человека, но и от пишущего инструмента, от бумаги и процесса сканирования. Дополнительные помехи возникают от фона на машиночитаемой форме.

В период с 1960 по 1970 годы известный американский математик УльфГренандер создал основы теории паттернов. К сожалению, автору не удалось придать теории законченную форму, и он был вынужден опубликовать изложение результатов своих многолетних исследований только в виде трех томов своих лекций [5]. Выход в свет работы Гренандера привлек внимание специалистов в области распознавания образов, информатики и программирования. Однако со временем, ввиду отсутствия эффективных практических применений, интерес к теории паттернов значительно уменьшился. Известно, что практическое применение математические теории обычно находят не сразу, например, использование теории графов началось более чем через сто лет после решения Эйлером знаменитой задачи о Кенигсбергских мостах. Теория паттернов в этом смысле не является исключением. В то же время, поскольку эта теория обладает большой гибкостью, оригинальностью, глубиной математических и философских идей, она может быть использована в различных областях знаний. Особый интерес представляет ее применение в системах, обладающих памятью. В России был выполнен комплекс фундаментальных и прикладных исследований в области теории паттернов и ее применений, результаты которых позволяют предположить, что теория Гренандера в ближайшем будущем найдет широкое применение в проектировании компьютерных систем и информатике.