Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
TPR_otvety.doc
Скачиваний:
23
Добавлен:
26.09.2019
Размер:
1.35 Mб
Скачать

4. Структура таблицы «объекты-свойства»

Задачу распознавания образов можно сформулировать так: пусть мы имеем совокупность объектов в виде таблицы «объекты-свойства» (табл.1). Каждый объект описан набором свойств , .

Таблица 1

f1

fn

ψ

a1

1

1

an

1

an+1

2

2

an+p

2

b1

0

0

bn

0

fi — косвенные свойства; — прямые свойства.

Известно, что объекты относятся к 1-му образу, объекты — ко 2-му образу и на объектах измерены только косвенные свойства.

Задача распознавания состоит в том, чтобы для каждого из объектов определить принадлежность к одному из заданных образов при минимуме ошибок 1-го и 2-го рода.

Таким образом, в общем случае мы имеет таблицу «объекты-свойства», где каждый объект представлен точкой в n-мерном пространстве свойств. Часть объектов по прямым свойствам расклассифицирована в качестве эталонов для различных образов, а принадлежность остальных объектов к тому или иному образу неизвестна. Для классификации используются различные алгоритмы распознавания образов.

6. Анализ данных с целью выбора постановки задач и методы решения.

Этапы анализа данных:

1. Анализ целесообразности кодировки исходных данных. Если исходные данные легко делятся на группы, то их можно кодировать без ущерба информативности. Кодировать нецелесообразно, если исходные данные плохо делятся на группы.

2. Анализ полноты и качества информации

а) при отсутствующих измерениях необходимо добавить измерения, проведенные дополнительно;

б) рассмотреть вопрос об исключении из МО объекты, имеющие большое количество пропусков;

в) рассмотреть возможность восстановления пропущенных значений путем вычисления (существует много способов заполнения; можно заполнить средним значением, можно опираться на закон распределения).

3. Анализ зависимости свойств, т.е. как с изменением одного меняется другое свойство, с целью минимизации признакового пространства.

F3=a*F1 – сильно зависимые свойства.

4. Анализ расположения объектов в пространстве свойств. Для этого необходимо пере описать исходное пространство до двухмерного и в этом пространстве рассмотреть расположение объектов. (подробнее вопрос 8)

5. По выбранному алгоритму идет решение задачи.

6. Анализ качества результатов. Для анализа качества алгоритма надо выбрать несколько объектов из МО и сформировать из них МЭ (это могут быть самые «непростые» объекты). Проверяем качество решающего правила. Это правило должно выполнятся при минимуме ошибок 1-го и 2-го рода. Минимум — это фиксированное число, заданное при постановке задачи (например, минимум ошибок приблизительно равен 10%). Если качество алгоритма нас не устраивает, то необходимо возвратится назад к анализу данных, а иначе переходим к материалу распознавания.

7. Интерпретация результатов, т.е. перевод полученных результатов на язык предметной области.

Если результат не устраивает, то возвращаемся к предметной задаче (ее можно сформулировать по разному). Главный этап формализации — формирование исходных данных и построение ТОС.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]