Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры ГОСы.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
957.95 Кб
Скачать

100. Использование методов кластерного анализа в экономических исследованиях

Кластерный анализ – это один из методов МСМ, который позволяет осуществит классификацию объектов наблюдения или совокупности признаков, описывающих объекты. В основу кластерного анализа положен политетический способ классификации объектов наблюдения (по набору всей признаков одновременно).

Методы кластерного анализа принято разделять на иерархические и итерационные (метод k-средних). Иерархические в свою очередь делятся на агломеративные (объединяющие) и дивизимные (разъединяющие). В основу иерархического агломеративного кластерного анализа положено вычисление и дальнейшее преобразование матрицы расстояний D между объектами наблюдений. Эту матрицу можно вычислить как матрицу обычный и взвешенных евклидовых расстояний; хеминговых расстояний и т. д.

Евклидово расстояние определяется по формуле: (обычное) и

(взвешенное). Хемингово расстояние вычисляется: (используется для дихотомных признаков, т. е. имеющих два значения.

При реализации иерархического агломеративного кластерного анализа могут быть использованы различные принципы объединения кластеров:

  • Принцип «ближнего соседа»,

  • Принцип «дальнего соседа»,

  • Принцип «средней связи»,

  • Принцип «центров тяжести».

Обобщающая формула отыскания расстояния между кластерами (предложена Колмогоровым): , где при «ближнем соседе» , при «дальнем соседе» , при «средней связе»

( - численность n и q кластеров).

98. Итеративные методы кластерного анализа.

Сущность процесса начинается с с задания некоторых начальных условий . Итеративный метод в большей степени, чем иерархический требует от пользователя ституации при выборе типа классификации процедур и задания начальных усл разбиения. Одним из методов является метод К средних. Отличие данного метода от иерархических процедур состоит в том, что не требуется вычисления и хранения грамоздких матриц – расстояний между объектами. Алгоритм этого метода предполагает использовать только исходные значения переменных. Для начала процедуры классификаций д.б. заданы К случайные выборки объектов, которые будут служить эталонами, т.е. центрами К.

Считается, что в целом алгоритм этелонного типа удобны и быстродействованы. В этом случае важную роль играет выбор начальных условий, т.к. именно они влияют на длительность процесса кластеризации и его результативность.

Еще одним методом является метод поиска сгущений.он не требует начального задания числа выделения К. в теории и на практике сущ-ет несколько модификаций этого метода. Схема данного метода: требуется вычислить матрицу –растояний между объектами; затем выбирается объект, который является первоначальным центром 1-го К, выбор такого объекта м.б. произвольным, а может основываться на предварительном анализе (.) и их окрестностей, выбирается точка принимается за центр гиперсферы радиуса r. Определяется совокупность точек попавших внутрь этой сферы и для них вычисляется координатфы центра. Далее вновь рассматривается гиперсфера того же радиуса, но с новым центром и для совокупности попавших в нее точка опять рассчитывается вектор ср знач. Он принимается за центров сферы и т.д. Когда очередной пересчет координат центра сферы приводит к тому же результату, что и на предыдущем шаге, , перемен сферы прекращаются. А точка попавшая в нее образует кластер.Для всех оставшихся точек процедура повторяется. Число образовавшихся кластеров в методах поиска сгущений заранее не известен и сильно зависит от выбора радиуса гиперсферы.