
- •Терминология и задачи распознавания образов
- •Задача обучения без учителя. Задача таксономии.
- •Алгоритмы классификации на основе обучения по прецедтам
- •Алгоритм классификации с использованием однородных комитетовбольшинства
- •Формирование обучающей и проверочной выборок
- •Процесс решения задачи ро
- •1 Получить у преподавателя буквы, которые необходимо распознать.
- •2 Записать в отчет.
- •3. Переписать папку kvazar в папку мои документы
- •2 Записать в отчет. В отчет пишем, только информацию выделенную зеленым.
- •1 Образ {а,д, й, е, в}: с 1 вектора по 10 вектор.
- •2 Образ {г, и, б, ж, м, я} с 11 вектора по 20 вектор.
- •4. Запуск квазара и ввод данных в квазар
- •Опыт 2. Задача обучения без учителя. Задача таксономии
- •Анализ листингов 1-3 Лабораторная работа 1
- •Таксономия множества признаков
- •Анализ информативности признаков
- •Анализ наличия одинаковых векторов
- •Результаты рабочего распознавания анализом информативности признаков
- •Результаты рабочего распознавания методом комитета старшинства:
- •Входные данные
- •Таксономия множества векторов
- •Таксономия множества признаков
- •Листинг
- •Лабораторные работы 2, 3 Входные данные
- •Анализ информативности признаков
- •Анализ наличия одинаковых векторов
- •Результаты рабочего распознавания анализом информативности признаков
- •Результаты рабочего распознавания методом комитета старшинства:
- •Листинг
- •Библиографический список
- •Информационный менеджмент
- •620002, Екатеринбург, Мира, 19
Процесс решения задачи ро
Сформулировать задачу ИИ в терминах распознавания образов. Определить тип задачи РО: задача обучения с учителем, задача поиска информативных признаков или задача обучения без учителя.
После того, как определена задача РО, следует выбрать компактное признаковое описание.
Подготовить входные данные. Смотри ниже особенности описание входных данных.
Затем входные данные должны быть введены в программу КВАЗАР, в процессе, которого исправляются ошибки в данных.
Выбирая из главного меню КВАЗАРа необходимые алгоритмы, решить задачу.
Подготовка данных для пакета КВАЗАР.
Файл данных обычно бывает подготовлен в символьном виде массива – матрица “ объект - признаки”
При решении задачи обучения по прецедентам (фактам) в входном файле должен соблюдаться следующий порядок векторов – объектов:
векторы известной принадлежности, представленные на обучение (из них пакет автоматически или на основе указаний пользователя может сформировать обучающую и проверочные выборки); при этом сначала следуют векторы 1 класса – образа, затем второго и т.д.;
векторы, предъявленные для рабочего распознавания (при наличии)
Работая с пакетом КВАЗАР, нумеровать векторы не следует. Номер вектора определяется его местом в файле (массиве) обрабатываемых данных.
Требования пакета КВАЗАР к подготовке входного файла
каждая запись – объект “ n”- мерный вектор состоит из признаков вещественных чисел, которые разделяются пробелом или запятой, в конце описания вектора ставится символ “;” .
Набор следующего вектора -- новая запись, т.е. новая строка.
В начале вектора можно указывать имена векторов, которые отделяются от признаков символом “:”.
Данные должны быть набраны в “DOS” кодировке в любом редакторе, например БЛОКНОТ шрифт Terminal .
Имя файла должно состоять из 8 латинских символов – “ группа и ваш номер по списку”. Файла должен быть записан для удобства работы в каталог DATA пакета КВАЗАР.
Пример. Файл - I1601001.dat I16010 – группа 01- ваш номер по списку.
ИМЯ : 2 2 9 1. 1. 6. 1. 2.;
Подготовка входных данных для задачи распознавания без учителя
1 Получить у преподавателя буквы, которые необходимо распознать.
(лаб. работу можете делать ДОМА)
Пример {А, Д, Й, Е, В, Г, И, Б, Ж, М, Я}.
2 Записать в отчет.
Задача обучение без учителя (таксономия) распознавать рукописные буквы {А, Д, Й, Е, В, Г, И, Б, Ж, М, Я}.
3. Переписать папку kvazar в папку мои документы
4. Открыть БЛОКНОТОМ файл BAZA в папке КVAZAR\DATA\
(ШИФР ТIMES NEW ROMAN)
Оставить в этом файле только заданные буквы, остальные буквы убрать.
Одинаковые буквы в файле могут быть.
В файле должно быть более 30 векторов записей (строчек ).
посчитать число строк в файле и записать в отчет. Показать преподавателю . Сохранить в папке КVAZAR\DATA\ имя файла.dat.
Перейти шагу 2 Запись данных в KVAZAR.
Пример файла:
А: 0 1 1 0 0 1 1 0 0 1 1 0 1 0 0 1;
А: 0 1 1 1 0 1 1 0 0 1 1 0 1 0 1 0;
Д: 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0;
Д: 0 1 1 0 0 1 1 0 0 1 1 0 1 0 1 0;
Й: 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0;
Й: 1 1 0 0 1 1 1 0 0 1 1 0 0 0 0 0;
Е: 0 1 1 1 0 0 1 0 0 1 1 0 1 1 1 0;
Е: 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1;
В: 0 0 1 0 0 1 1 0 1 1 1 0 1 1 1 0;
В: 0 1 1 0 0 1 1 0 0 1 1 1 0 1 1 1;
Г: 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0;
Г: 0 1 1 0 0 1 0 0 0 1 0 0 0 0 0 0;
Б: 1 1 1 1 1 1 0 0 1 0 1 0 1 1 1 0;
Б: 0 0 1 1 0 0 1 0 0 1 1 0 0 1 0 0;
Ж: 0 0 0 0 1 1 1 0 0 1 0 0 1 1 1 0;
Ж: 0 1 1 1 0 0 1 0 0 1 1 1 0 0 0 0;
М: 0 1 1 0 0 1 1 0 1 1 1 1 1 0 0 1;
М: 0 0 0 0 1 1 1 1 1 0 0 1 1 0 0 1;
Я: 0 1 0 0 0 1 1 0 0 1 1 0 1 0 1 1;
Я: 0 1 1 0 0 1 1 0 1 1 1 0 1 1 1 0;
А: 0 1 1 0 0 1 1 0 1 1 1 0 0 0 0 0;
Д: 0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 0;
Й: 0 1 0 0 0 1 1 0 0 1 1 0 0 0 0 0;
Е: 0 0 0 0 0 1 1 0 0 1 1 0 0 1 1 0;
В: 1 1 1 0 1 1 1 0 1 0 0 1 1 1 1 1;
Г: 0 0 0 0 0 1 1 0 0 1 1 0 0 1 1 0;
Б: 0 1 1 0 0 1 1 0 0 1 1 0 0 0 0 0;
Ж: 1 1 1 1 0 1 1 0 0 1 1 0 1 1 1 1;
М: 1 1 1 1 1 1 1 1 1 0 0 1 1 0 0 1;
Я: 0 0 1 0 0 0 1 0 1 0 1 0 1 1 1 1;
Подготовка входных данных для задачи распознавания с учителем и задачи информативности признаков
Получить у преподавателя буквы, которые необходимо распознать.