- •1. Задача распознавания и её формальное описание. Проблема распознавания.
- •Обсуждение задачи опознавания.
- •Общая постановка задачи.
- •Язык распознавания образов.
- •Априорные предположения — это записанные специальным образом, накопленные знания специалистов.
- •3. Исходные данные для задачи распознавания
- •2 . Геометрическая интерпретация задачи распознавания.
- •4. Структура таблицы «объекты-свойства»
- •6. Анализ данных с целью выбора постановки задач и методы решения.
- •5. Прямые и косвенные свойства в задачах распознавания.
- •7. Основные этапы анализа данных.
- •8. Анализ расположения объектов в пространстве свойств с целью выбора алгоритма распознавания.
- •9. Этапы решения задач распознавания.
- •10. Классификация алгоритмов распознавания.
- •15. Задача разбиения образа на однородные группы.
- •12. Область применения алгоритма Дискриминантная функция.
- •11. Алгоритм распознавания «Дискриминатная функция».
- •13. Мера сходства и ее свойства.
- •14. Метрика и ее свойства.
- •16. Алгоритм «Гол n»
- •26. Шкалы измерения свойств.
- •17.Способы вычисления типичного представителя в алгоритме «Гол n»
- •18. Решающее правило в алгоритме «Гол n»
- •20. Условия применения алгоритма «Гол 1»
- •22. Исследования представительности мо
- •21. Различия между алгоритмами “Гол n” и «Гол 1»
- •19. Алгоритм распознавания «Гол 1»
- •23. Распознавание с отказами и без отказов
- •24. Алгоритм распознавание «Энтропия»
- •25. Решающее правило в алгоритме «Энтропия»
- •30. Общая схема постановки и решения задачи распознавания.
- •28. Алгоритм распознавания «Тесты».
- •27. Алгоритм распознавания «Кора 3»
- •32. Основные понятия системы массового обслуживания.
- •40. Постановка задачи оптимизации при нескольких критериях.
- •41. Математическая модель многокритериальной задачи.
- •29. Алгоритм распознавания «Направление опробования»
- •31. Принципы построения и функционирования сппр.
- •32. Основные понятия системы массового обслуживания.
- •47. Способ лексикографической оптимизации.
- •48. Построение обобщенного критерия в многокритериальной задаче.
- •45. Способ указания нижних границ критериев.
- •42. Отношение доминирования по Парето
- •38. Модель производственных поставок.
- •39. Модель поставок со скидкой.
- •43. Геометрическая интерпретация доминирования по Парето
- •52. Логическая модель представления знаний
- •Продукционная модель представления знаний
- •Фреймовая модель представления знаний
- •Модель семантических сетей
- •Классификация систем Business-to-business (b2b-систем)
- •61. Понятие логистической системы
- •Основные отличия знаний от данных
- •Классификация информационно-поисковых систем
- •Основные модели представлений знаний
4. Структура таблицы «объекты-свойства»
Задачу распознавания образов можно сформулировать так: пусть мы имеем совокупность объектов в виде таблицы «объекты-свойства» (табл.1). Каждый объект описан набором свойств , .
Таблица 1
|
f1 |
… |
fn |
ψ |
a1 |
|
|
|
1 |
… |
|
|
|
1 |
an |
|
|
|
1 |
an+1 |
|
|
|
2 |
… |
|
|
|
2 |
an+p |
|
|
|
2 |
b1 |
|
|
|
0 |
… |
|
|
|
0 |
bn |
|
|
|
0 |
fi — косвенные свойства; — прямые свойства.
Известно, что объекты относятся к 1-му образу, объекты — ко 2-му образу и на объектах измерены только косвенные свойства.
Задача распознавания состоит в том, чтобы для каждого из объектов определить принадлежность к одному из заданных образов при минимуме ошибок 1-го и 2-го рода.
Таким образом, в общем случае мы имеет таблицу «объекты-свойства», где каждый объект представлен точкой в n-мерном пространстве свойств. Часть объектов по прямым свойствам расклассифицирована в качестве эталонов для различных образов, а принадлежность остальных объектов к тому или иному образу неизвестна. Для классификации используются различные алгоритмы распознавания образов.
6. Анализ данных с целью выбора постановки задач и методы решения.
Этапы анализа данных:
1. Анализ целесообразности кодировки исходных данных. Если исходные данные легко делятся на группы, то их можно кодировать без ущерба информативности. Кодировать нецелесообразно, если исходные данные плохо делятся на группы.
2. Анализ полноты и качества информации
а) при отсутствующих измерениях необходимо добавить измерения, проведенные дополнительно;
б) рассмотреть вопрос об исключении из МО объекты, имеющие большое количество пропусков;
в) рассмотреть возможность восстановления пропущенных значений путем вычисления (существует много способов заполнения; можно заполнить средним значением, можно опираться на закон распределения).
3. Анализ зависимости свойств, т.е. как с изменением одного меняется другое свойство, с целью минимизации признакового пространства.
F3=a*F1 – сильно зависимые свойства.
4. Анализ расположения объектов в пространстве свойств. Для этого необходимо пере описать исходное пространство до двухмерного и в этом пространстве рассмотреть расположение объектов. (подробнее вопрос 8)
5. По выбранному алгоритму идет решение задачи.
6. Анализ качества результатов. Для анализа качества алгоритма надо выбрать несколько объектов из МО и сформировать из них МЭ (это могут быть самые «непростые» объекты). Проверяем качество решающего правила. Это правило должно выполнятся при минимуме ошибок 1-го и 2-го рода. Минимум — это фиксированное число, заданное при постановке задачи (например, минимум ошибок приблизительно равен 10%). Если качество алгоритма нас не устраивает, то необходимо возвратится назад к анализу данных, а иначе переходим к материалу распознавания.
7. Интерпретация результатов, т.е. перевод полученных результатов на язык предметной области.
Если результат не устраивает, то возвращаемся к предметной задаче (ее можно сформулировать по разному). Главный этап формализации — формирование исходных данных и построение ТОС.