
- •Задачи математической статистики. Материальные объекты, их вероятностная природа.
- •Основные понятия выборочного метода. Точечные оценки числовых характеристик случайной величины.
- •Оценка плотности вероятностей и функции распределения.
- •Статистическое оценивание параметров модели. Метод моментов. Метод максимального правдоподобия.
- •Проверка статистических гипотез. Постановка задачи. Общая логическая схема проверки гипотез. Свойства критериев.
- •Гипотезы о равенстве дисперсий двух случайных величин (при известных и неизвестных математических ожиданиях).
- •Гипотезы о равенстве математических ожиданий двух случайных величин (при известных и неизвестных дисперсиях).
- •Критерии проверки гипотезы об однородности двух или нескольких выборок. Критерий однородности 2.
- •Ранговый критерий однородности Вилкоксона-Манна-Уитни.
- •Критерии проверки гипотезы о согласии эмпирического и теоретического распределений. Критерии согласия 2 – Пирсона и Колмогорова-Смирнова. Применимость критериев.
- •Задачи корреляционного анализа. Типы измерителей статистической связи. Постановка задачи корреляционного анализа.
- •Понятие тесноты статистической связи между количественными переменными. Парный коэффициент корреляции.
- •Ранговые коэффициенты корреляции Спирмена и Кендалла.
- •Ложная корреляция и частный коэффициент корреляции.
- •Множественная корреляция. Коэффициент конкордации.
- •Проверка гипотезы о статистической значимости выборочного коэффициента конкордации.
Гипотезы о равенстве дисперсий двух случайных величин (при известных и неизвестных математических ожиданиях).
Гипотезы о равенстве математических ожиданий двух случайных величин (при известных и неизвестных дисперсиях).
Критерии проверки гипотезы об однородности двух или нескольких выборок. Критерий однородности 2.
Если данные представлены в группированном виде, то для проверки однородности можно использовать критерий однородности 2. Пусть имеется две выборки объемами n1 и n2. Элементы каждой выборки независимы, непрерывны и сгруппированы в L интервалов. Проверим, принадлежат ли выборки одной генеральной совокупности. Критерий однородности 2 применим при n 60 (еще лучше, если выполняется условие n 200) и данные представлены в группированном виде /1, 3/.
1-й шаг. Формирование основной и альтернативной гипотез
Н0: F(х) = F(y), Н1: F(х) F(y).
2-й шаг. Задание уровня значимости . 3-й шаг. Формирование критической статистики
кр =
,
где j и j – количество попаданий в j-ый интервал группирования соответственно первой и второй выборок. Если n1 = n2 = n , то
кр. =
.
Предельное распределение критической статистики кр. стремится к c2-распределению с (L - 1) числом степеней свободы, т.е.
F(
кр.)
= 2(
кр.;
L-1),
4-й шаг. Определение верхней критической точки статистического критерия
кр.в = 2% (L-1),
где 2% (L-1) – -процентная точка 2-распределения, которая может быть получена с помощью таблиц процентных точек для c2-распределения. Критерий однородности 2 является односторонним. Области неправдоподобно малых значений статистики 2 нет. Чем меньше расчетное значение критической статистики, тем более благоприятные условия складываются для принятия гипотезы об однородности двух выборок. 5-й шаг. Определение расчетного значения критической статистики
расч. = |
(40) |
Если
расч. < кр.в, |
(41) |
то гипотеза Н0 верна, в противном случае Н0 отвергается. расч не может быть меньше нуля.
Ранговый критерий однородности Вилкоксона-Манна-Уитни.
Критерий Вилкоксона–Манна–Уитни является ранговым и применяется для проверки однородности двух выборок независимых случайных величин, распределения которых неизвестны. Критерий находит применение при объеме выборки меньше 60, т.к. при больших n возрастает трудоемкость метода. Статистические данные должны быть представлены в негруппированном виде. Здесь возможны два случая. Рассмотрим их последовательно.
Случай А. Пусть
имеется две выборки независимых
непрерывных случайных величин (n £ 25
для обеих выборок) xi,
i =
,
yj,
j =
,
где n1 £ 25,
n2 £25.
Рассмотрим
последовательность критерия.
1-й шаг. Формирование основной и альтернативной гипотез
Н0: F(x) = F(y), H1: F(x) ¹ F(y),
где F(x) и F(y) – неизвестные непрерывные функции распределения случайных величин X и Y. 2-й шаг. Задание уровня значимости a. 3-й шаг. Формирование критической статистики. Статистика критерия имеет вид
кр = |
(42) |
где
–
ранги элементов выборки меньшего объема
(n1<
n2)
в общем вариационном ряду, полученном
из двух выборок.
Суммирование
рангов Ri осуществляется
по элементам меньшей выборки.
Предельное
распределение статистики
кр стремится
к распределению Вилкоксона–Манна–Уитни.
Для
принятия решения об однородности двух
выборок по критерию Вилкоксона–Манна–Уитни
необходимо выполнить следующую
последовательность действий.
1. Проанализировать объемы выборок n1 и n2, сравнить их между собой. Меньшую выборку будем считать первой. Пусть n1 – ее объем. 2. Из двух выборок составляем общий вариационный ряд с обозначением рангов вариант. Если в обеих выборках есть одинаковые варианты, то в общем вариационном ряду первыми записываются варианты меньшей (первой) выборки. 4-й шаг. По статистическим таблицам критических точек распределения Вилкоксона–Манна–Уитни /12/ для уровня значимости a найти нижнюю критическую точку
кр.н = wa/2 (n1, n2),
где wa/2 (n1, n2) – квантиль распределения Вилкоксона. Верхняя критическая точка находится из выражения
кр.в = (n1 + n2 +1) n1 - кр.н . |
|
или в виде
кр.в = 2MW - кр.н,
где 2MW может быть взято из таблицы для соответствующих n1 и n2. 5-й шаг. Вычислить расчетное значение критической статистики
расч =
суммированием рангов вариант первой выборки в общем вариационном ряду. Если выполняется условие
кр.н < расч < кр.в , |
|
то гипотеза Н0 верна. В противном случае Н0 отвергается.
Случай Б. Объем хотя бы одной из выборок больше 25. Отличие данного случая от предыдущего состоит только в вычислении кр.н. на четвертом шаге проверки гипотезы об однородности. А именно
кр.н = w (a/2,
n1,
n2)
= |
|
где
–
квантиль нормального распределения
уровня
(находится
по статистическим
таблицам функции нормального
распределения).
Критерии проверки гипотезы о стохастической независимости элементов выборки.
Критерий серий, основанный на медиане
Пусть
дана выборка xi,
i =
из
некоторой генеральной совокупности.
Необходимо проверить случайность и
независимость элементов выборки. Для
этого воспользуемся критерием
серий, основанном на медиане /1/,
являющимся ранговым.
1-й шаг. Формулирование основной и альтернативной гипотез. Н0: элементы выборки xi, i = являются стохастически независимыми, H1: элементы выборки xi, i = не являются стохастически независимыми. 2-й шаг. Задание уровня значимости a. 3-й шаг. Формирование критической статистики. Прежде чем определить вид критической статистики, необходимо выполнить следующую последовательность действий. 1. Сформировать из элементов выборки вариационный ряд
х(1) £ х(2) £ ... £ х(i) £ ... £ х(n).
2. Найти оценку медианы,
|
(46) |
= 0.5 [ х(n/2) + х(n/2+1)], если n четно. |
(47) |
3. В исходной выборке вместо каждого х(i) будем ставить "+", если х(i) > , "-", если х(i) < . Если х(i) = , то не ставится никакой знак. Полученная последовательность "+" и "-" может характеризоваться количеством серий n(n) и длиной самой длинной серии t(n). При этом подсерией понимается последовательность подряд идущих "+" или "-". Серия может состоять только из одного "+" или "-". Длина серии – количество подряд идущих "+" или "-". В данном критерии одновременно рассматривают пару критических статистик (двумерная критическая статистика)
кр. = {n(n), t(n)}.
Предельное распределение статистики кр. является двумерным с частными предельными распределениями n(n) и t(n). 4-й шаг. Определение верхней и нижней критических точек распределения осуществляется расчетным путем из выражений
nкр. (n)
= |
(48) |
tкр.(n) = 3.3Чlg(n+1), |
(49) |
где – квантиль нормального распределения уровня . 5-й шаг. Определение расчетных значений критической статистики. nрасч.(n) определяет количество серий в исходной выборке, а tрасч.(n) – длину самой длинной серии. Если одновременно выполняются условия
|
nрасч.(n) > nкр.(n), tрасч.(n) < tкр.(n), |
(50) |
то Н0 может быть принята с ошибкой первого рода. В противном случае элементы выборки нельзя считать стохастически независимыми.
Критерий серий "восходящих" и "нисходящих" серий
По аналогии с критерием серий, основанном на медиане выборки, в ранговом критерии “восходящих” и “нисходящих” серий также формируется последовательность серий "+" и "-" /1/. Для этого в исходной выборке из генеральной совокупности xi, i = на месте i-го элемента ставят "+", если хi+1 > xi, и "-", если хi+1 < xi. Если хi+1= xi, то в серии ничего не проставляется. Рассмотрим последовательность критерия.
1-й шаг. Формулирование основной и альтернативной гипотез. Н0: элементы выборки xi, i = являются стохастически независимыми, H1: элементы выборки xi, i = не являются стохастически независимыми. 2-й шаг. Задание уровня значимости a. 3-й шаг. Формирование критической статистики.
кр. = {n(n), t(n)}.
Предельное распределение статистики кр является двумерным с частными предельными распределениями n(n) и t(n). 4-й шаг. Определение верхней и нижней критических точек
кр.в = n кр(n)
= |
(51) |
кр.н = tкр(n) = |
|
5, при n £ 26 6, при 26 < n £ 153 7, при 153 < n £ 1170 , |
(52) |
где – квантиль нормального распределения. 5-й шаг. Вычисление расчетных значений статистик nрасч(n) и tрасч(n). nрасч(n) – количество серий в последовательности "+" и "-", tрасч(n) – длина самой длинной серии. Если одновременно выполняются условия
|
nрасч(n) > nкр.(n), tрасч(n) < tкр.(n), |
(53) |
то Н0 может быть принята с ошибкой первого рода. В противном случае элементы выборки нельзя считать стохастически независимыми.
Критерий стохастической независимости Аббе
Если выборка xi, i = принадлежит нормальной генеральной совокупности, то для выяснения вопроса о ее случайности предпочтительнее воспользоваться критерием квадратов последовательных разностей (критерий Аббе) /1/. Критерий Аббе позволяет обнаружить систематическое смещение среднего в ходе выборочного обследования.
1-й шаг. Формулирование основной и альтернативной гипотез: Н0: элементы выборки xi, i = являются стохастически независимыми, H1: элементы выборки не являются стохастически независимыми. 2-й шаг. Задание уровня значимости a. 3-й шаг. Формирование критической статистики
кр = |
(54) |
где
|
(55) |
–
несмещенная оценка
дисперсии выборки.
При n Ј 60
предельное распределение критической
статистики
затабулировано
и представлено в таблицах
критических точек распределения
Аббе /13/
для различных значений a.
4-й
шаг. Определение
нижней критической точки осуществляется
двумя способами (критерий Аббе –
односторонний).
Если n > 60, то
кр.н = |
(56) |
где – квантиль стандартного нормального распределения. При n £ 60 кр.н находится по статистическим таблицам /13, табл. 1.9/. 5-й шаг. Вычисление расчетного значения критической статистики
расч =
.
Если расч > кр.н, то гипотеза о стохастической независимости элементов выборки принимается. В противном случае элементы выборки нельзя считать случайными и независимыми.