- •Мсм как самостоятельная область научных знаний. Их особенности и отличия от методов классич. Статистики.
- •Основные исторические этапы развития мсм.
- •Классификация мсм. Параметрические и непараметрич. Методы, их различия.
- •Особенности социально-экономической информации. Измерение различ. Данных.
- •1) Особенности соц.-экономич. Инф-ции
- •2) Измерение разнотипных данных
- •Оцифровка неколичественной информации. Основные способы оцифровки.
- •2) Таблица логического описания:
- •4) Таблица рангов
- •6) Таблица сравнений:
- •Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.
- •Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
- •1) Понятие многомерной случайной величины (мсв)
- •2) Примеры наиболее часто используемых законов:
- •3) Проверка статистической гипотезы предполагает:
- •Доверительные области
- •Критерий Хотеллинга для двух многомерных выборок.
- •Критерий Бартлетта и проверка гипотезы об однородности дисперсии.
- •Груб. Ошибки. Причины их появл-ия в статистич. Сов-ти. Методы их выявл-ия.
- •Основные методы устойчивого оценивания параметров выбороч. Совокупности.
- •Корреляционно-дисперсионный анализ многомерных количественных данных.
- •Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи. Количественные многомерные данные
- •Неколичественные многомерные данные
- •2. Коэффициент Кэндалла
- •Вероятностные коэффициенты связи
- •Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.
- •Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.
- •Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.
- •Критерий независимости для таблиц сопряженности.
- •Метод главных компонент.
- •Использование главных компонент в многомерном регрессионном анализе.
- •33) Кластерный анализ качественных многомерных данных
- •34)Методы иерархического кластерного анализа. Алгоритмическая схема. Геометрическая интерпретация результатов. Основные иерархические методы:
- •3. Метод средних связей
- •Дивизивный метод
- •35)Итеративные методы:
- •39) Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.
- •Перечень вопросов по курсу «Многомерные статистические методы»
- •Основные исторические этапы развития мсм.
- •Гауссовское (непрерывное)
- •Общий критерий Хоттелинга:
- •Общий критерий Хоттелинга:
- •Частный критерий Хоттелинга:
- •Одномерный критерий:
- •1.Для количеств.Данных:
- •6 Иерархических методов:
Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
1) Понятие многомерной случайной величины (мсв)
М
ногомерная
СВ Х выглядит следующим образом
(смотри рисунок)
Все
зависят от времени (т.к. мы не можем
ручаться, что характеристики не изменятся
со временем). Т.о., массив
не является м-цей. В МСМ он наз-ся
параллелепипедом данных.
Гипотетической СВ является вектор
.
Этот вектор необязательно будет состоять
из числовых характеристик.
МСВ, а именно та СВ, кот. поддается измерению, обладает определен. физич. смыслом и некоторым неконтролируемым разбросом при повторениях исследуем. эксперим-та. Получить числовое отображение МСВ можно только в резул-те элементар. исхода () случ. экспер-та.
Многомерная (векторная) СВ:
Закон распределения вероятностей
многомерной статистической величины
(МСВ) называется многомерным или
совместным:
Функция распределения детерминирована и неотрицательна.
1) непрерывные m-мерные СВ, компоненты которых являются непрерывными СВ
Плотность распределения вероятности:
Соотношение функции и плотности
распределения:
В обратную сторону – m-кратный
дифференциал:
2) дискретные m-мерные СВ, компоненты которых (одномерные СВ) являются дискретными
ДМСВ может быть задана указанием
вероятностей ее попадания в люб. точку
конеч. или счет. мн-ва допустимых значений.
Если мы обозначим через
- j-е значение СВ
из мн-ва допустимых значений
i1 = 1,2,…,n; i2 = 1,2,…,n; … ; im = 1,2,…,n;
Совместная вероятность:
Тогда ф-ция распред-я такой СВ выражается
m-кратной суммой:
На всем множестве допустимых значений
эта m-кратная сумма превращается в
ед-цу:
3) СВ смешанного типа, компоненты которых являются как непрерывными, так и дискретными СВ.
2) Примеры наиболее часто используемых законов:
- Полиномиальный (мультиномиальный) закон распределения
В рез-те одного случайного эксперимента
объект типа j появляется с вероятностью
Pj.
- число объектов j-го типа, оказавшихся
в выборке размера n с вер-тью P.
Всего будет l различ. типов:
.
Мы имеем дело с бесконеч. совокуп-тью
.
Вероятность - это векторная величина:
Нас будет интересовать МСВ с законом
распределения:
Вероятность того, что из n извлеченных
объектов оказалось x1 объектов
1го типа, x2 объектов 2го типа
и т.д. может быть выражена следующим
образом:
Для данного закона:
,
- многомерная вероятность,
(это диагональ ковариационно-дисперсионной
матрицы)
- внедиагональные элементы
Чаще всего с этим ЗР сталкиваются при обработке анкет. данных (медицинской и психологич. инф-ции)
- Гаусовский закон распределения (многомер/ нормальный) X F(,)- наиболее часто встречающееся:
,
где
- многомерное МО;
- ковариац.-дисперс. м-ца
Исчерпывающей формой задания многомер.
ЗР является только совместная
функция плотности вероятности. Зная
совместный ЗР МСВ можно получить частный
(маржинальный) ЗР любого подвектора
случайной величины, а также условный
ЗР, описывающий распределение любого
подвектора, когда все или какая-то часть
остальных компонент исход. вектор.
признака фиксируется на заданных
уровнях. Если МСВ распределена каким-либо
другим способом, то пользуются правилом
независимости, а именно: если компоненты
МСВ
статистически независимы, то многомерный
ЗР может быть описан m-частными
законами распределения:
При практическом изучении поведения МСВ зачастую оказывается достаточным знание ограниченного набора его числовых характеристик: m - МО; - дисперсия; коэф-нт ассиметрии; коэф-нт эксцесса
Математическое ожидание:
- для непрерывной СВ:
- для дискретной СВ:
МО - центр группирования. Распространим это понятие на случай МСВ: x = (x(1),…,x(m))
Существует 2 случая (интерпретации):
1), = ((1),…,(m)), (j) - обобщение по n объектов
2),
= (1,…,m),
j
- обобщение по некоторому совокупному
свойству (признаку) n
объектов
Математический аппарат идентичен для обоих случаев. Поэтому остановимся на 1ом случае.
Дисперсия: Физический смысл дисперсии - разброс (рассеяние) относительно центра группирования.
- непрерывная одномерная СВ:
- дискретная одномерная СВ:
Аналог многомерной дисперсии берется из ковариационно-дисперсионной матрицы:
1)
Это симметричная относительно главной диагонали матрица.
Диагональ - рассеивание относительно конкретной компоненты.
2) во втором случае центром группирования является компоненты вектора МО по совокупному интегрированному свойству: = ( )nn
В качестве многомерной дисперсии может быть:
А) обобщенная дисперсия - определитель Dобоб = det
Б) степень рассеивания - след матрицы Dрас = tr = (11 + … + mm)
Специфика многомерной дисперсии заключается в расчете каждой компоненты ij
