Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ммпур методичка.DOC
Скачиваний:
125
Добавлен:
16.12.2018
Размер:
5.47 Mб
Скачать

5.2. Подготовка и анализ исходных данных Общая схема решения задачи.

Общая схема включает в себя все существующие частные схемы решения, соответствующие отдельным алгоритмам распознавания, группирования, направленного поиска и состоит из пяти стадий.

1. Анализ исходных данных для решения конкретной задачи:

— анализируется поставленная цель;

— исследуется ситуация, в которой возможно решение задачи;

— рассматриваются способы описания экспериментального материала;

— анализируется экспериментальный материал для оценки заданного числа образов, числа объектов в каждом образе, соотношений числа объектов и числа свойств, типов свойств;

— изучаются априорные предположения, при этом выясняется расположение заданных объектов в признаковом пространстве, а также определяются степени зависимости свойств, представительность МО, соотношение цен ошибок 1-го и 2-го рода;

— анализируются технологические условия, включающие в себя определение допустимого времени решения задачи; максимальные размеры экспериментального материала (допустимые количества объектов и свойств); режим работы; необходимые технические средства.

2. Анализ модели решения задачи:

— определяется подход к решению задачи;

— фиксируются конкретные априорные предположения;

— фиксируются классы такие мер сходства, мер связи, способы определения информативных наборов свойств; решающие правила;

— фиксируются критерии оценки качества.

Рассмотрение первой и второй стадий соответствует процессу постановки задачи.

3. Выбор оптимального алгоритма для решения задачи:

— выбираются конкретные меры сходства и связи, способ определения информативной совокупности, решающее правило;

— конструируется алгоритм;

— проводятся обучение и контрольный экзамен;

— оценивается качество контрольного решения.

4. Решение задачи:

— проводится решение задачи;

— полученные результаты представляются в заданной форме.

5. Анализ результатов:

— анализируются полученные результаты с точки зрения соответствия выбранным предположениям;

— анализируется форма представления результатов;

— дается заключение о целесообразности их дальнейшего использования либо о необходимости повторного решения задачи с помощью другого алгоритма или в рамках другой модели.

Общая схема постановки и решения задачи Анализ данных с целью выбора постановки и метода решения

1. Анализ целесообразности кодировки исходных данных. Если исходные данные легко делятся на группы, то их можно кодировать без ущерба информативности (рис. 5.1). Кодировать нецелесообразно, если исходные данные плохо делятся на группы (рис. 5.2).

2. Анализ полноты и качества информации

а) при отсутствующих измерениях необходимо добавить измерения, проведенные дополнительно;

б) рассмотреть вопрос об исключении из МО объекты, имеющие большое количество пропусков;

в) рассмотреть возможность восстановления пропущенных значений путем вычисления (существует много способов заполнения; можно заполнить средним значением, можно опираться на закон распределения).

3. Анализ зависимости свойств, т.е. как с изменением одного меняется другое свойство, с целью минимизации признакового пространства.

4. Анализ расположения объектов в пространстве свойств. Для этого необходимо пере описать исходное пространство до двухмерного и в этом пространстве рассмотреть расположение объектов.

Например, для случая, изображенного на рис. 5.3, может быть применен алгоритм распознавания Голотип-N, для рис. 5.4 — алгоритм Энтропия, для рис. 5.5 — алгоритм Дискриминантная функция, для рис. 5.6 — алгоритмы Дискриминантная функция (но с большим количеством ошибок) или Голотип-N.

Типы расположения объектов:

5. По выбранному алгоритму идет решение задачи.

6. Анализ качества результатов. Для анализа качества алгоритма надо выбрать несколько объектов из МО и сформировать из них МЭ (это могут быть самые «непростые» объекты). Проверяем качество решающего правила. Это правило должно выполнятся при минимуме ошибок 1-го и 2-го рода. Минимум — это фиксированное число, заданное при постановке задачи (например, минимум ошибок приблизительно равен 10%). Если качество алгоритма нас не устраивает, то необходимо возвратится назад к анализу данных, а иначе переходим к материалу распознавания.

7. Интерпретация результатов, т.е. перевод полученных результатов на язык предметной области.

Если результат не устраивает, то возвращаемся к предметной задаче (ее можно сформулировать по разному). Главный этап формализации — формирование исходных данных и построение ТОС.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]