Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MSM.doc
Скачиваний:
49
Добавлен:
27.04.2019
Размер:
1.8 Mб
Скачать

1.Для количеств.Данных:

А)расст.Менковского: , где p=2-евклидово расст., p=1-сити-блок, p=4-квадрат евкл.расст.

Б)метрика Махаланобиса:

2.для качеств.данных метрика Рао: , где m-размерность, x-значения 1-го объекта в Rm, n``- число совпадающих единичных свойств (частота в номинальных данных).

6 Иерархических методов:

1.миним.лок.расст.(ближайш.соседа):

2.макс.лок.расст.(дальнего соседа):

3.центроидный метод(расст.-по центрам тяжестей групп):

4.метод средней связи (ср.ар.всех попарн.расст.между представит.рассматрив.групп):

5.медианный 6.метод Уорда (мин.внутригрупповой суммы квадратов отклонений)

Билет №35. Итерационные методы КА. Метод k-Means.

- метод k средних (статграфик)

- метод поиска сгущений (пакет кластер)

- метод расщепления смесей (пакет кластер)

Основные проблемы:

- все эти методы требуют задания начальных условий, поэтому их используют, если проблема или объект хорошо изучен. Человек, который задает начальные условия, несет полную ответственность за классификацию. Отсюда следует объективизм.

- количество кластеров

- центры кластеров

- радиус сферы (метод поиска сгущений)

- закон распределения объектов (метод расщепления смесей)

1.Задать k – число кластеров. 2. Вес каждого кластера wk. 3. Случайным образом из совокупности Х отобрать k строк (центры кластеров, эталонные вектора и т.д.)

4. Из оставшихся (n-k) строк Х извлечь вектор xi: xi={xi1, …, xim}  сходство с каждым из эталонов.

5.Вектор сходства di (k компонент): diT=(di1,…,dik)

6. В найд.векторе сходства определить мин., по нему присоединять кластеры. 7. Эталон пересчитать, вес увеличить на 1 (ср.арифм.). Если неск.мин., то i присваив.тому центру, у которого номер меньше. Для каждой строки повторять этот шаг (n-k-1) раз, пока все объекты не распределятся по k кластерам. 8. 1 шаг, все вновь, пока центры кластеров не перестанут меняться.

Билеты №№37-39. Дискриминантный анализ.

Линейная каноническая дискриминантная функция и нахождение ее коэффициентов.

i-ый объект k-го класса, x1…p – дискриминантные перем.

Перейдем в новую систему отсчета:

На этой прямой nk точек, каждая – yki. Для любых двух классов рассмотрим:

∑внутригрупп.кв.откл.

Вывод: Внутригрупповая сумма квадратов отклонений для 2 классов=

Возьмем частные производные и приравняем к 0  р ур-ний и р неизвестных  1 решение.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]