Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Dokument_Microsoft_Word_Avtosokhranenny.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
351.63 Кб
Скачать
  1. Як можна оцінити надійність проведеного розбиття на кластери?

кожен кластер поділити на 2 частини, і порівняти їх внутрішні структури. Якщо кластери 25-30-45, то внутрішня структура мажє бути в кожному кластері приблизно такаж. Здесь существует эмпирическое правило — устойчивая типология сохраняется при изменении методов кластеризации. Результаты иерархического кластерного анализа можно проверять итеративным кластерным анализом по методу k-средних. Если сравниваемые классификации групп респондентов имеют долю совпадений более 70 % (более 2/3 совпадений), то кластерное решение принимается.

8. Сформулюйте загальну схему ієрархічного агломеративного кластерного аналізу.

В иерархических методах каждое наблюдение образовывает сначала свой отдельный кластер. На первом шаге два соседних кластера объединяются в один; этот процесс может продолжаться до тех пор, пока не останутся только два кластера.

9. Скільки різних варіантів розбиття на кластери дає алгоритм ієрархічного кластерного аналізу?

Алгоритм ієрархічного кластерного аналізу дає наступні варіанти розбиття на кластери: кластеризація з двома змінними, кластеризація з більше ніж 2 змінними і кластеризація з попереднім факторним аналізом. Алгоритм ієрархічного кластерного аналізу дає нам два тривіальні рішення (розбиває на 2 кластери):

1) всі об’єкти - один кластер;

2) всі об’єкти – окремі кластери.

10. Як Ви знаєте підходи до оцінювання кількості кластерів при використанні ієрархічного кластерного аналізу?

1) Попередньо знаємо кількість кластерів (з результатів емпіричних досліджень, теоретичних міркувань);

  1. Якщо таких міркувань не має, ми спираємося на певні властивості наших емпіричних даних. Це досить небезпечно, так як різні методи дають різні кількості. Тут необхідно на кожному кроці слідкувати за змінами відстані

  1. Які методи визначення відстаней між кластерами під час кластеризації Ви знаєте?

Метод ближайшего соседа. (расстояние между двумя ближайшими обьектами в разных кластерах)

метод дальнейшего соседа (тожесамое, токо наоборот)

метод среднего значения (берутся попарно все обьекты в обоих кластерах (1 с 1 2 с 2 и т. д.) и

среднее от их всех расстояний — расстояние между кластерами.

Связь между группами, Связь внутри групп, Центроидная кластеризация, Медианная

кластеризация, метода Варда.

12. Які особливості структури матриці відстаней?

Симетричная таблица в которой первая строчка и первый столбик — обьекты. На пересечении между двумя обьектами — расстояние между ними. Расстояние между одним и тем же обьектом — 0, либо пустая клетка. (видели таблицу с расстояниями между городами? Матрица расстояний в чистом виде)

13. Які алгоритми кластерного аналізу реалізовані в пакеті SPSS?

иерархический, к-средних, Двувходовое объединение (two-step)

14.Сформулюйте загальну схему алгоритму k-means Cluster (Quick Cluster), реалізованого в пакеті spss. В чому особливості цього алгоритму у порівнянні з ієрархічним кластерним аналізом?

С вычислительной точки зрения вы можете рассматривать этот метод, как дисперсионный анализ (см. Дисперсионный анализ) "наоборот". Программа начинает с K случайно выбранных кластеров, а затем изменяет принадлежность объектов к ним, чтобы: (1) - минимизировать изменчивость внутри кластеров, и (2) - максимизировать изменчивость между кластерами. Данный способ аналогичен методу "дисперсионный анализ (ANOVA) наоборот" в том смысле, что критерий значимости в дисперсионном анализе сравнивает межгрупповую изменчивость с внутригрупповой при проверке гипотезы о том, что средние в группах отличаются друг от друга. В кластеризации методом K средних программа перемещает объекты (т.е. наблюдения) из одних групп (кластеров) в другие для того, чтобы получить наиболее значимый результат при проведении дисперсионного анализа (ANOVA).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]