
- •Мсм как самостоятельная область научных знаний. Их особенности и отличия от методов классич. Статистики.
- •Основные исторические этапы развития мсм.
- •Классификация мсм. Параметрические и непараметрич. Методы, их различия.
- •Особенности социально-экономической информации. Измерение различ. Данных.
- •1) Особенности соц.-экономич. Инф-ции
- •2) Измерение разнотипных данных
- •Оцифровка неколичественной информации. Основные способы оцифровки.
- •2) Таблица логического описания:
- •4) Таблица рангов
- •6) Таблица сравнений:
- •Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.
- •Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
- •1) Понятие многомерной случайной величины (мсв)
- •2) Примеры наиболее часто используемых законов:
- •3) Проверка статистической гипотезы предполагает:
- •Доверительные области
- •Критерий Хотеллинга для двух многомерных выборок.
- •Критерий Бартлетта и проверка гипотезы об однородности дисперсии.
- •Груб. Ошибки. Причины их появл-ия в статистич. Сов-ти. Методы их выявл-ия.
- •Основные методы устойчивого оценивания параметров выбороч. Совокупности.
- •Корреляционно-дисперсионный анализ многомерных количественных данных.
- •Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи. Количественные многомерные данные
- •Неколичественные многомерные данные
- •2. Коэффициент Кэндалла
- •Вероятностные коэффициенты связи
- •Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.
- •Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.
- •Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.
- •Критерий независимости для таблиц сопряженности.
- •Метод главных компонент.
- •Использование главных компонент в многомерном регрессионном анализе.
- •33) Кластерный анализ качественных многомерных данных
- •34)Методы иерархического кластерного анализа. Алгоритмическая схема. Геометрическая интерпретация результатов. Основные иерархические методы:
- •3. Метод средних связей
- •Дивизивный метод
- •35)Итеративные методы:
- •39) Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.
- •Перечень вопросов по курсу «Многомерные статистические методы»
- •Основные исторические этапы развития мсм.
- •Гауссовское (непрерывное)
- •Общий критерий Хоттелинга:
- •Общий критерий Хоттелинга:
- •Частный критерий Хоттелинга:
- •Одномерный критерий:
- •1.Для количеств.Данных:
- •6 Иерархических методов:
1.Для количеств.Данных:
А)расст.Менковского:
,
где p=2-евклидово расст., p=1-сити-блок,
p=4-квадрат евкл.расст.
Б)метрика Махаланобиса:
2.для
качеств.данных
метрика Рао:
,
где m-размерность, x-значения 1-го объекта
в Rm,
n``-
число совпадающих единичных свойств
(частота в номинальных данных).
6 Иерархических методов:
1.миним.лок.расст.(ближайш.соседа):
2.макс.лок.расст.(дальнего
соседа):
3.центроидный метод(расст.-по
центрам тяжестей групп):
4.метод средней связи
(ср.ар.всех попарн.расст.между
представит.рассматрив.групп):
5.медианный 6.метод Уорда (мин.внутригрупповой суммы квадратов отклонений)
Билет №35. Итерационные методы КА. Метод k-Means.
- метод k средних (статграфик)
- метод поиска сгущений (пакет кластер)
- метод расщепления смесей (пакет кластер)
Основные проблемы:
- все эти методы требуют задания начальных условий, поэтому их используют, если проблема или объект хорошо изучен. Человек, который задает начальные условия, несет полную ответственность за классификацию. Отсюда следует объективизм.
- количество кластеров
- центры кластеров
- радиус сферы (метод поиска сгущений)
- закон распределения объектов (метод расщепления смесей)
1.Задать k – число кластеров. 2. Вес каждого кластера wk. 3. Случайным образом из совокупности Х отобрать k строк (центры кластеров, эталонные вектора и т.д.)
4. Из оставшихся (n-k) строк
Х извлечь вектор xi:
xi={xi1,
…, xim}
сходство с каждым из эталонов.
5.Вектор сходства di (k компонент): diT=(di1,…,dik)
6. В найд.векторе сходства определить мин., по нему присоединять кластеры. 7. Эталон пересчитать, вес увеличить на 1 (ср.арифм.). Если неск.мин., то i присваив.тому центру, у которого номер меньше. Для каждой строки повторять этот шаг (n-k-1) раз, пока все объекты не распределятся по k кластерам. 8. 1 шаг, все вновь, пока центры кластеров не перестанут меняться.
Билеты №№37-39. Дискриминантный анализ.
Линейная каноническая дискриминантная функция и нахождение ее коэффициентов.
i-ый объект k-го класса,
x1…p
– дискриминантные
перем.
Перейдем в новую систему отсчета:
На этой прямой nk точек, каждая – yki. Для любых двух классов рассмотрим:
∑внутригрупп.кв.откл.
Вывод: Внутригрупповая
сумма квадратов отклонений для 2
классов=
Возьмем частные производные и приравняем к 0 р ур-ний и р неизвестных 1 решение.