Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1-25 шпоры.doc
Скачиваний:
19
Добавлен:
03.06.2015
Размер:
201.73 Кб
Скачать

24.Ранг. Корр. Многом. Класс. Объектов. Кластер-анализ. Агломерат. Методы. Метод к-средних.

При изуч. кач. или колич. признаков с неизв. или непрер. зак. расп-я для изуч. тесноты связи прим. метод ранговой корр-ии. Вариац. ряд: х1<=x2<=…<=xj. Рангом набл. значения признака х наз. номер этого наблюдения в вариационном ряду, если неравенства строгие. Коэф. ранг корр.:1) Кендала. Rk=2Sk/n(n-1). Необх. исчисл. величину Sk, опред. меру сходства и рассчит. по числу инверсий, образ-х элементами двойной перестановки. 2) Спирмена испол. меру сходства с учетом весов рангов rc=1-(6Sc/(n3-3)). При изучении связи между числами признаков, измер-х в порядковой шкале, число кот. больше двух, применяют меру сходства (согласия) соответствующего числа ранжировок (перестановок). В качестве пок-ля числа перестановок опр-ся коэфф. конкордации кендала. w=12Sw/(K2(n3-n)), к – кол-во признаков, n – кол-во наблюдений. Этот коэфф. измер. от нуля (абс. несогласие) до 1 (полное совпадение всех ранжировок). Мет. класс-ии: создание интеграл. пок-ля (индекса), методы фактор. ан. (главных компонент), методы класт. ан., дискримин. анализ. КА объединяет различ. процедуры, испол. для проведения класс-ии. В ре-те прим-я эт. процедур исходные сов-ть объектов разделяется на кластеры (группы), схожих между собой объектов, облад. свойством плотности (плотность объекта внутри класса выше, чем вне его), дисперсии, формой (кластер м. им. очертания гиперсферы или элипсоида), размером. КА – автом. класс-я объе-ая методы реш. задачи класс-ии объектов при отсутствии обучающих выборок. В кач. методов КА испол: 1) Агломеративный и иерархич., 2) Метод к-средних. Задача КА обычной формой представления исх. дан. служит прямоуг. табл., каж. сторона кот. пред. рез-ат измерения к рассматр-ых признаков на одном из иссл-ых объектов. Дан. метод послед-но объединяет элементы и группы элементов. На первом шаге рассматрив. каж. из класс. наблюдений хi как отд. кластер. Далее на каж. шаге происх. объединение 2х самых близких групп набл-й. Работа алгоритма заканч., ког. се исх. набл-я окаж. объе-ы в одном кластере. Процесс наглядно отраж. на граф. в виде дендограммы. В кач-ве меры сходства испол.: обычное евклидово расстояние, взвешенное евкл. расс-ие, манхеттенское расс-ие, хемингово расс-ие, метрика Чебышева. В ряде процедур класс-ии испол. понятие рас-ия между целыми группами объектов и меры близости 2х мерных объектов. Между классами: 1) Принцип ближайшего соседа, 2) дальнего соседа, 3) центры тяжести, 4) Принцип средней связи (сред. ариф. всех попарных расстояний между представителями рассматр-х групп). Метод к-средних. Процесс класс-ии нач. с задания нек. начальных условий (кол-ва образуемых классов). Возьмем n наблюдений и хар-ие их признаки х1, х2,…, хр. Их разобьем на к кластеров. Из n точек исследуемой сов-ти отберем к точек. Они прин-тся за эталоны (центры кластеров), эталону присвоим поряд. номер. Из оставшихся точек выбир. одну и смотрим к как. эталону она ближе. Испол. евклид расст. Проверяемый объект присоед. к тому центру, кот. соот-т мин. расст-ю. Эталон зам. новым, перессчит-ся с учетом присоединенной точкии вес увел. на 1 ед. и т.д. Чтобы добиться устойчивости разбиения, по тому же правилу все точки опять отсоединяются к полученным кластерам. При эт. веса их прод. накапливаться. Если они совпадают, то работа алгоритма заканч. В против. случае повтор. Окончат. разбиение имеет центры тяжести, кот. не совпадают с эталонами. Воз-ны 2 модификации мет. к средних: 1) предполаг. пересчет центра тяжести кластера после каж. изменения его состава. 2) лишь после того, как будет завершен пересмотр всех данных.