
- •Задачи математической статистики. Материальные объекты, их вероятностная природа.
- •Основные понятия выборочного метода. Точечные оценки числовых характеристик случайной величины.
- •Оценка плотности вероятностей и функции распределения.
- •Статистическое оценивание параметров модели. Метод моментов. Метод максимального правдоподобия.
- •Проверка статистических гипотез. Постановка задачи. Общая логическая схема проверки гипотез. Свойства критериев.
- •Гипотезы о равенстве дисперсий двух случайных величин (при известных и неизвестных математических ожиданиях).
- •Гипотезы о равенстве математических ожиданий двух случайных величин (при известных и неизвестных дисперсиях).
- •Критерии проверки гипотезы об однородности двух или нескольких выборок. Критерий однородности 2.
- •Ранговый критерий однородности Вилкоксона-Манна-Уитни.
- •Критерии проверки гипотезы о согласии эмпирического и теоретического распределений. Критерии согласия 2 – Пирсона и Колмогорова-Смирнова. Применимость критериев.
- •Задачи корреляционного анализа. Типы измерителей статистической связи. Постановка задачи корреляционного анализа.
- •Понятие тесноты статистической связи между количественными переменными. Парный коэффициент корреляции.
- •Ранговые коэффициенты корреляции Спирмена и Кендалла.
- •Ложная корреляция и частный коэффициент корреляции.
- •Множественная корреляция. Коэффициент конкордации.
- •Проверка гипотезы о статистической значимости выборочного коэффициента конкордации.
Критерии проверки гипотезы о согласии эмпирического и теоретического распределений. Критерии согласия 2 – Пирсона и Колмогорова-Смирнова. Применимость критериев.
Критерий согласия 2-Пирсона
Критерий согласия 2-Пирсона позволяет осуществлять проверку гипотезы о согласии, когда параметры модели неизвестны /1, 11, 15/.
Неизвестные параметры модели могут быть заменены в модели их оценками, полученными по выборке, например по методу моментов или методу максимального правдоподобия. Критерий согласия 2-Пирсона применим при n 200 и требует группирования выборки. При этом число интервалов группирования должно удовлетворять условию L 8, а количество попаданий в каждый интервал j должно быть не менее 7-10. В противном случае соседние интервалы необходимо объединить в один, не забывая при этом скорректировать L. Рассмотрим последовательность критерия согласия 2–Пирсона.
1-й шаг. Формирование основной и альтернативной гипотез
Н0: = Fmod(Х; ), Н1: Fmod(Х; ).
2-й шаг. Задание уровня значимости . 3-й шаг. Формирование критической статистики
кр. = |
(57) |
где j , – количество попаданий в каждый j-ый интервал группирования, pj – теоретическая вероятность попадания в j-ый интервал
pj =
Fmod(хj+1; |
(58) |
Здесь хj+1 и хj – соответственно верхняя и нижняя границы текущего интервала группирования. Предельное распределение статистики кр при n имеет вид
|
(59) |
где S – количество параметров модельного распределения, согласие с которым проверяется, а 2( кр ; L - S -1) – функция хи-квадрат распределения с (L - S - 1) числом степеней свободы. 4-й шаг. Определение верхней и нижней критических точек по таблице процентных точек c2-распределения:
кр.в. = 2/2100% (L - S - 1), кр.н. = 2(1-/2)100% (L - S - 1).
5-й шаг. Определение расчетного значения критической статистики
расч = . |
(60) |
Если выполняется условие
2(1-/2)% (L - S - 1) < расч 2/2% (L - S - 1), |
(61) |
то гипотеза о согласии Н0 верна с ошибкой первого рода . В противном случае гипотеза Н0 отвергается. Отвержение гипотезы Н0 при расч. < 2/2% (L - S - 1) на первый взгляд противоречит здравому смыслу /1/. Однако, надо отметить, что расч как статистика также является случайной величиной со своей дисперсией. А значит, одинаково неправдоподобными можно считать как слишком большие, так и слишком малые расч. Причинами возникновения слишком малых расч могут быть как неудачный выбор Fmod(Х; ) (например, при искусственном завышении числа параметров модели), так и некорректное проведение эксперимента при деформировании выборки, например, стремление "подогнать" искусственно эмпирические данные под результат. Критерий согласия 2-Пирсона
Критерий согласия 2-Пирсона позволяет осуществлять проверку гипотезы о согласии, когда параметры модели неизвестны /1, 11, 15/.
Неизвестные параметры модели могут быть заменены в модели их оценками, полученными по выборке, например по методу моментов или методу максимального правдоподобия. Критерий согласия 2-Пирсона применим при n 200 и требует группирования выборки. При этом число интервалов группирования должно удовлетворять условию L 8, а количество попаданий в каждый интервал j должно быть не менее 7-10. В противном случае соседние интервалы необходимо объединить в один, не забывая при этом скорректировать L. Рассмотрим последовательность критерия согласия 2–Пирсона.
1-й шаг. Формирование основной и альтернативной гипотез
Н0: = Fmod(Х; ), Н1: Fmod(Х; ).
2-й шаг. Задание уровня значимости . 3-й шаг. Формирование критической статистики
кр. = , |
(57) |
где j , – количество попаданий в каждый j-ый интервал группирования, pj – теоретическая вероятность попадания в j-ый интервал
pj = Fmod(хj+1; ) - Fmod(хj; ). |
(58) |
Здесь хj+1 и хj – соответственно верхняя и нижняя границы текущего интервала группирования. Предельное распределение статистики кр при n имеет вид
, |
(59) |
где S – количество параметров модельного распределения, согласие с которым проверяется, а 2( кр ; L - S -1) – функция хи-квадрат распределения с (L - S - 1) числом степеней свободы. 4-й шаг. Определение верхней и нижней критических точек по таблице процентных точек c2-распределения:
кр.в. = 2/2100% (L - S - 1), кр.н. = 2(1-/2)100% (L - S - 1).
5-й шаг. Определение расчетного значения критической статистики
расч = . |
(60) |
Если выполняется условие
2(1-/2)% (L - S - 1) < расч 2/2% (L - S - 1), |
(61) |
то гипотеза о согласии Н0 верна с ошибкой первого рода . В противном случае гипотеза Н0 отвергается. Отвержение гипотезы Н0 при расч. < 2/2% (L - S - 1) на первый взгляд противоречит здравому смыслу /1/. Однако, надо отметить, что расч как статистика также является случайной величиной со своей дисперсией. А значит, одинаково неправдоподобными можно считать как слишком большие, так и слишком малые расч. Причинами возникновения слишком малых расч могут быть как неудачный выбор Fmod(Х; ) (например, при искусственном завышении числа параметров модели), так и некорректное проведение эксперимента при деформировании выборки, например, стремление "подогнать" искусственно эмпирические данные под результат.
Критерий согласия Колмогорова–Смирнова
Критерий согласия Колмогорова–Смирнова позволяет проверить гипотезу о согласии при небольшом объеме выборки, когда Fmod известна полностью, т.е. известны и параметры модели /1, 6, 12, 15/. Рассмотрим последовательность критерия.
1-й шаг. Формирование основной и альтернативной гипотез
Н0: = Fmod(Х; ), Н1: Fmod(Х; ).
2-й шаг. Задание уровня значимости . 3-й шаг. Формирование критической статистики. В критерии Колмогорова–Смирнова для введения меры отклонения эмпирического и модельного распределений используются статистики вида:
|
(62) |
Статистики
вида
и
являются
статистиками Колмогорова и Смирнова
соответственно. При этом
.
Известны точные распределения статистик Dn, D+n и D-n /13/. Для практических целей обычно достаточно статистики Dn. Поэтому в качестве кр. воспользуемся функцией вида
кр = |
(63) |
А.Н. Колмогоров показал, что если функция Fmod(Х; ) непрерывна, то распределение кр имеет пределом функцию
|
(64) |
получившую
название функции Колмогорова и не
зависящую от вида функции Fmod(Х;
).
Однако,
если Fmod(Х;
)
задана с точностью до неизвестных
параметров
,
и они оцениваются по выборке /1/, то
предельное распределение статистики
уже
зависит от Fmod(Х;
).
При этом статистика
кр будет
зависеть только от формы распределения
Fmod(Х;
).
Если в модельном распределении есть
только параметры сдвига и масштаба, то
применимость критерия Колмогорова–Смирнова
корректна.
4-й
шаг.
Из определения функции распределения
следует, что при достаточно большом n и
любом
кр >
0 вероятность того, что
примет
значение не меньше
кр,
будет иметь вид
тогда |
(65) |
Значение кр.в при заданном можно найти с помощью таблицы функции Колмогорова–Смирнова (65). Нижняя критическая граница в критерии Колмогорова не используется. 5-й шаг. расч определяется из выражения (63) подстановкой значений n и Dn для конкретных эмпирических данных. Если выполняется условие
расч < кр.в,
то гипотеза о согласии эмпирического распределения и модельного принимается. Критерий согласия Колмогорова–Смирнова может использоваться и при большом объеме выборки. Для этого необходимо выборку представить в группированном виде и значения и Fmod(Х; ) определять на границах интервалов группирования.