Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
TPR_otvety.doc
Скачиваний:
25
Добавлен:
26.09.2019
Размер:
1.35 Mб
Скачать

30. Общая схема постановки и решения задачи распознавания.

Анализ исходных данных для решения конкретной задачи:

— анализируется поставленная цель;

— исследуется ситуация, в которой возможно решение задачи;

— рассматриваются способы описания экспериментального материала;

— анализируется экспериментальный материал для оценки заданного числа образов, числа объектов в каждом образе, соотношений числа объектов и числа свойств, типов свойств;

— изучаются априорные предположения, при этом выясняется расположение заданных объектов в признаковом пространстве, а также определяются степени зависимости свойств, представительность МО, соотношение цен ошибок 1-го и 2-го рода;

— анализируются технологические условия, включающие в себя определение допустимого времени решения задачи; максимальные размеры экспериментального материала (допустимые количества объектов и свойств); режим работы; необходимые технические средства.

28. Алгоритм распознавания «Тесты».

Как и предыдущий алгоритм, алгоритм Тесты ориентирован на ситуацию, когда количество объектов много меньше числа свойств. Как и раньше мы рассматриваем только арифметические шкалы. Для каждого объекта материала обучения известно его прямое свойство. Существует много разновидностей этого алгоритма, различающихся по способу кодировки. Мы рассмотрим следующий способ:

На этом интервале обозначается среднее значение диапазона. Если объект имеет значение свойства расположенное слева(меньше среднего) от середины, то он кодируется как «0», а если справа(больше среднего) то «1».

К примеру объект а1 по свойству f1 имеет значение 12, что меньше среднего, значит по этому свойству он кодируется нулем. Процедура повторяется аналогично для всех свойств, а полный код объекта получается путем слияния кодов слева направо по порядку свойств.

О стальные объекты кодируются аналогично и заносятся в таблицу. Введем понятие теста: Тест – комбинация свойств, которая встречается только среди объектов одного из образов. Нас будут интересовать, так называемые, тупиковые тесты: Тупиковый тест – минимальная комбинация свойств, по которой объекты разных образов еще различаются. Самый простой (долгий) способ выбора всех тупиковых тестов – прямой перебор. Пример (по таблице): видно что нет ни одного тупикового теста из одного свойства, поэтому сразу рассматриваем тесты из 2х свойств. (f1,f3)=(0,1; 1,0) - является тупиковым тестом из 1-го образа, т.к. ни у одного из объектов 2-го образа нет такой же комбинации свойств (f1,f3) = (0,0;1,1). Напротив, (f1,f2) не является тупиковым тестом, т.к. среди объектов 2-го образа есть одинаковый с первым по этим свойствам: a4=a2. Т.о. мы перебираем все тупиковые тесты из 2х свойств у 1-го и 2-го образов. Если бы не оказалось тупикового теста из 2х свойств, мы бы взяли 3, 4, и т.д. Выделив все тупиковые тесты, мы переходим к построению решающего правила. Для этого рассчитывается вес каждого свойства:

И з формулы видно, что вклад в вес объекта вносят только те свойства, значения которых у объекта выше среднего – это результат выбора кодировки и слабое место этого алгоритма. Помните, что вы всегда можете выбрать другую кодировку в зависимости от задачи.

Последним шагом является построение графика распределения весов по объектам. По оси х мы откладываем объекты, а по оси у их веса. В результате получим диаграмму, на которой будет видно как распределяются по весам объекты разных образов. Анализируя диаграмму на качество распознавания, принимаем или не принимаем решение о необходимости пересмотра м.о. и (или) кодировки. Объекты экзамена наносятся на диаграмму и определятся к ближайшему образу.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]