
- •9. Кластерный анализ данных
- •10. Метод Монте-Карло
- •12. Методологические подходы к построению дискретных моделей
- •13. Модели системной динамики
- •14. Назначение языков и систем моделирования ч.1
- •14. Назначение языков и систем моделирования ч.2
- •15. Непрерывные имитационные модели
- •16. Области применения имитационных моделей
- •Области применения методов имитационного моделирования
1. Анализ чувствительности имитационной модели 2. Валидация данных модели 3. Верификация имитационной модели 4. Выбор системы моделирования 5. Дискретные имитационные модели 6. Испытание и исследование свойств имитационной модели 7. Классификация систем моделирования 8. Классификация языков моделирования 9. Кластерный анализ данных 10. Метод Монте-Карло 11. Метод статистического моделирования 12. Методологические подходы к построению дискретных моделей 13. Модели системной динамики 14. Назначение языков и систем моделирования 15. Непрерывные имитационные модели 16. Области применения имитационных моделей 17. Определение целей имитационного моделирования 18. Основные классы планов вычислительного эксперимента 19. Основные понятия имитационного моделирования 20. Основные понятия теории планирования экспериментов 21. Основные типы вычислительных экспериментов 22. Основные цели имитационного вычислительного эксперимента 23. Основные этапы имитационного моделирования 24. Оценка точности результатов моделирования 25. Оценка устойчивости результатов моделирования 26. Понятие агрегативной модели 27. Понятие компьютерного моделирования 28. Понятие механизма продвижения модельного времени 29. Понятие моделирующего алгоритма 30. Понятие плана однофакторного эксперимента 31. Понятие регрессионного анализа экспериментальных данных 32. Понятие факторного анализа экспериментальных данных 33. Проверка адекватности модели 34. Программирование имитационной модели 35. Разработка концептуальной имитационной модели 36. Сбор и анализ исходных данных для имитационного эксперимента 37. Тактическое планирование имитационного эксперимента 38. Технологические возможности систем моделирования 39. Формализация имитационной модели 40. Формулировка проблемы имитационного моделирования 41. Общая характеристика языка моделирования GPSS
9. Кластерный анализ данных
Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке.
Кластерный анализ выполняет следующие основные задачи:
Разработка типологии или классификации.
Исследование полезных концептуальных схем группирования объектов.
Порождение гипотез на основе исследования данных.
Проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.
Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы:
Отбор выборки для кластеризации. Подразумевается, что имеет смысл кластеризовать только количественные данные.
Определение множества переменных, по которым будут оцениваться объекты в выборке, то есть признакового пространства.
Вычисление значений той или иной меры сходства (или различия) между объектами.
Применение метода кластерного анализа для создания групп сходных объектов.
Проверка достоверности результатов кластерного решения.
Типы входных данных
Признаковое описание объектов. Каждый объект описывается набором своих характеристик, называемых признаками. Признаки могут быть числовыми или нечисловыми.
Матрица расстояний между объектами. Каждый объект описывается расстояниями до всех остальных объектов метрического пространства.
Матрица сходства между объектами[7]. Учитывается степень сходства объекта с другими объектами выборки в метрическом пространстве. Сходство здесь дополняет расстояние (различие) между объектами до 1.
Цели кластеризации
Понимание данных путём выявления кластерной структуры. Разбиение выборки на группы схожих объектов позволяет упростить дальнейшую обработку данных и принятия решений, применяя к каждому кластеру свой метод анализа (стратегия «разделяй и властвуй»).
Сжатие данных. Если исходная выборка избыточно большая, то можно сократить её, оставив по одному наиболее типичному представителю от каждого кластера.
Обнаружение новизны (англ. novelty detection). Выделяются нетипичные объекты, которые не удаётся присоединить ни к одному из кластеров.
Методы кластеризации
Общепринятой классификации методов кластеризации не существует, но можно выделить ряд групп:
Вероятностный подход. Предполагается, что каждый рассматриваемый объект относится к одному из k классов. Подходы на основе систем искусственного интеллекта: весьма условная группа, так как методов очень много и методически они весьма различны.
Логический подход. Построение дендрограммы осуществляется с помощью дерева решений.
Теоретико-графовый подход.
Иерархический подход. Предполагается наличие вложенных групп (кластеров различного порядка). Алгоритмы в свою очередь подразделяются на агломеративные (объединительные) и дивизивные (разделяющие). По количеству признаков иногда выделяют монотетические и политетические методы классификации.
Другие методы. Не вошедшие в предыдущие группы.