- •Тема 1. Случайные события
- •2 Алгебра событий.
- •3 Определения вероятности события.
- •4 Элементы комбинаторики
- •1 Теоремы сложения вероятностей.
- •4 Формула полной вероятности. Формула вероятности гипотез.
- •Тема 2. Повторные независимые испытания
- •2 Наивероятнейшее число наступлений события в независимых испытаниях.
- •3 Локальная теорема Муавра-Лапласа.
- •4 Интегральная теорема Муавра-Лапласа. Пуассоновское приближение
- •Тема 3. Дискретные случайные величины
- •2 Закон распределения вероятностей дискретной случайной величины.
- •3 Математическое ожидание и его свойства.
- •4 Дисперсия дискретной случайной величины и ее свойства
- •5 Одинаково распределенные взаимно-независимые случайные величины
- •Тема 4. Непрерывные случайные величины
- •2)Дифференциальная функция (плотность распределения) непрерывной случайной величины и ее свойства.
- •Тема 5. Основные законы распределения случайных величин
- •1. Основные законы распределения дискретных случайных величин.
- •2) Равномерное распределение
- •Тема 6. Функции случайных величин и векторов
- •2) Композиция законов распределения
- •3) Специальные законы распределения
- •Тема 7. Многомерные случайные величины
- •2)Функции распределения многомерной случайной величины.
- •3)Вероятность попадания двумерной случайной величины в полуполосу и прямоугольник.
- •4)Числовые характеристики системы двух случайных величин
- •Тема 8. Закон больших чисел
- •2)Неравенство и теорема Чебышева
- •3)Понятие о центральной предельной теореме
- •Часть II. Математическая статистика
- •Тема 10. Вариационные ряды распределения
- •1) Понятие и виды вариационных рядов распределения.
- •2) Графическое изображение рядов распределения и связь между ними.
- •1) Понятие и виды вариационных рядов распределения
- •2) Графическое изображение рядов распределения и связь между ними.
- •1) Средняя арифметическая и ее свойства.
- •2) Дисперсия ряда распределения и ее свойства. Среднее квадратическое отклонение.
- •3)Моменты ряда распределения и связь между ними
- •Тема 11. Выборочный метод
- •2)Статистические оценки выборочной совокупности и их свойства.
- •3) Точечные и интервальные оценки.
- •Тема 12. Проверка статистических гипотез
- •1)Понятие и виды статистических гипотез.
- •2)Статистический критерий проверки гипотез.
- •3)Уровень значимости. Мощность критерия.
- •2)Статистический критерий проверки гипотез
- •Тема 13. Дисперсионный анализ
- •1)Понятие и модели дисперсионного анализа.
- •2)Однофакторный дисперсионный анализ.
- •1)Понятие и модели дисперсионного анализа.
- •2)Однофакторный дисперсионный анализ.
- •4.1.2.3. Двухфакторный дисперсионный анализ. Факторы а и в
- •Тема 14. Корреляционно-регрессионный анализ
- •1)Понятие корреляционной зависимости.
- •2) Оценка методом наименьших квадратов коэффициентов регрессии
- •Тема 15. Статистический анализ временных рядов
- •1)Понятие экономического временного ряда и его составляющие.
- •2)Тренд динамического ряда.
- •2)Тренд динамического ряда
Тема 12. Проверка статистических гипотез
Лекция 1. Вопросы:
1)Понятие и виды статистических гипотез.
2)Статистический критерий проверки гипотез.
3)Уровень значимости. Мощность критерия.
1)Понятие и виды статистических гипотез.
Статистической гипотезой называется всякое высказывание о генеральной совокупности, проверяемое по выборке. Статистические гипотезы делятся на:
Параметрические - это гипотезы, сформулированные относительно параметров (среднего значения, дисперсии и т.д.) распределения известного вида;
Непараметрические - это гипотезы, сформулированные относительно вида распределения (например, определение по выборке степени нормальности генеральной совокупности).
Процесс использования выборки для проверки гипотезы называется статистическим доказательством. Основную выдвигаемую гипотезу называют нулевой H0. Наряду с нулевой гипотезой рассматривают ей альтернативную H1. Например, H0: M(х)=1, математическое ожидание генеральной совокупности равно 1; H1: M(х)>1, или M(х)<1, или M(х)1 (математическое ожидание больше 1, или меньше 1, или не равно 1).
Выбор между гипотезами H0 и H1может сопровождаться ошибками двух родов. Ошибка первого рода α означает вероятность принятия H1, если верна гипотеза H0:. Ошибка второго рода означает вероятность принятия H0, если верна гипотеза H1:. Существует правильное решение двух видов:и.
Ошибки первого и второго рода
Принятая гипотеза |
Н0 |
Н1 |
H0 - верна |
P(Н0/Н0)=1- |
P(Н1/Н0)= |
H0 – неверна |
P(Н0/Н1)= |
P(Н1/Н1)=1- |
Правило, по которому принимается решение о том, что верна или не верна гипотеза Н0, называется критерием, где:
=P(Н1/Н0) - уровень значимости критерия;
M=1-=P(Н1/Н1) - мощность критерия.
2)Статистический критерий проверки гипотез
Статистическим критерием K называют случайную величину, с помощью которой принимают решение о принятии или отклонении Н0.
Замечание. Для проверки параметрических гипотез используют критерии значимости, основанные на статистиках: u, χ2,t,F(приложения 5-7). Непараметрические гипотезы проверяют с помощью критериев согласия, использующих статистики распределений:, Колмогорова-Смирнова [1, 2, 6, 10] и т.д.
Например, Н0: М(х)=10. В зависимости от альтернативной гипотезы рассматривают три случая.
1. Если
Рис 27. Двусторонняя критическая область
В этом случае рассматривают двустороннюю критическую область и используют дифференциальную функцию f (K/H0), для определения соответствующих квантилей (границ области принятия гипотезы - левой (К1-/2) и правой (К/2)). Площадь под криволинейной трапецией дифференциальной функции слева от К1-/2 и справа от К/2 равна/2.
Общая площадь ограниченная криволинейной трапецией дифференциальной функции, квантилями и осью абсцисс равна (1 - α) (рис. 27):
(11.1)
2. Если то рассматривается правосторонняя критическая область (площадь под криволинейной трапецией справа от Кравна) (рис. 28):
(11.2)
Рис. Правосторонняя критическая область
3. Если , то рассматривается левосторонняя критическая область (площадь под криволинейной трапецией слева от К1-равна) (рис. 29):
(11.3)
Рис. Левосторонняя критическая область
Алгоритм проверки статистических гипотез состоит из следующих этапов:
Располагая выборочными данными (), формируют нулевую гипотезуи конкурирующую гипотезу Н1.
Задают уровень значимости α (обычно принимают α =0,1; 0,01; 0,05; 0,001).
Рассматривается выборочная статистика наблюдений (критерий) К, обычно одна из перечисленных ниже:
u - нормальное распределение;
χ2- распределение Пирсона (хи – квадрат);
t - распределение Стьюдента;
F - распределение Фишера - Снедекора.
4. На основании выборки - определяют значение критерия (статистики) К (приложения 5-7). В зависимости от вида альтернативной гипотезы выбирают по соответствующей таблице квантили критерия для двустороннейили односторонней области (К1-или К) (приложения 1-4). Если значения критерия попадают в критическую область, то H0отвергается; в противном случае принимается гипотеза H0и считается, что Н0не противоречит выборочным данным (при этом существует возможность ошибки с вероятностью равной).
Следует отметить, что возможность принятия гипотезы происходит из принципа невозможности наступления маловероятных событий. Те же события, вероятность которых близка к 1, принимаются за достоверные. Возникает проблема выбора уровня риска (уровня значимости ).
В одних случаях возможно пренебрегать событиями р<0,05, в других нельзя пренебрегать событиями, которые могут появиться с р=0,001 (разрушение сооружений, транспортных средств и т.д.).
Лекция 2.Проверка гипотез о равенстве средних. Критерии согласия.
Пусть требуется проверить нулевую гипотезу о нормальном законе распределения случайной величины. Уровень значимости принять =0,001 .
Обычно точные параметры гипотетического нормального закона нам неизвестны, поэтому нулевую гипотезу (Н0) словесно можно сформулировать следующим образом: F(х) является функцией нормального распределения с параметрами М(X) =а =и D(X) =.
Для проверки этой нулевой гипотезы найдем точечные оценки математического ожидания и среднего квадратического отклонения нормально распределенной случайной величины:
: (11.4)
При проверке гипотезы о нормальном распределении генеральной совокупности сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормальности распределения) частоты. Для этого используются статистика 2– Пирсона с=k-r-1 степенями свободы (k– число групп,r– число оцениваемых параметров, в настоящем примере оценивались математическое ожидание и среднее квадратическое отклонение, следовательно,r= 2). Если2расч.2кр., то нулевая гипотеза отвергается и считается, что предположение о нормальности распределения не согласуется с опытными данными. В противном случае (2расч.<2кр.) нулевая гипотеза принимается.
Вычисляются теоретические вероятности рi, попадания СВ ХN в частичные интервалы [xi-1; xi) по формуле:
, (i=1,2,...,k), (11.5)
где
. (11.6)
Применение критерия 2, для проверки гипотезы о нормальности распределения предполагает наличие в каждом частичном интервале не менее пяти единиц, в противном случае желательно объединять эти интервалы с соседними.
Проверка гипотезы о принадлежности СВ показательному, биномиальному, пуассоновскому или другому распределению основывается на применении в описанном алгоритме соответствующих интегральных функций.
По таблице квантилей 2-распределения , при заданном уровне значимостии числе степеней свободы=k-r-1 находится критическое значение, которое сравнивается с фактически наблюдаемым значением. Если2расч.<2кр. ,то нет оснований для отклонения нулевой гипотезы о нормальном законе распределения.
Пример. Из нормальной генеральной совокупности сельскохозяйственных предприятий, рассматриваемых по показателю урожайности пшеницы, с известным средним квадратическим отклонением =9,4 и генеральной средней=38,1, извлечена выборка объема n=50. По ней найдена выборочная средняя=42. Требуется при уровне значимости=0,05 проверить нулевую гипотезу Н0:
а) , при конкурирующей гипотезе Н1:38,1;
б) , при конкурирующей гипотезе Н1:<38,1;
в) , при конкурирующей гипотезе Н1:>38,1.
Решение. Необходимо рассмотреть критерий К=u, где (11.7)
а) По условию конкурирующая гипотеза имеет вид 38,1, поэтому критическая область двусторонняя. Найдем критическую точку из равенства Ф(uкр.,/2)=(1-)/2=(1-0,05)/2=0,475. Согласно приложения 1: uкр.=1,96.
, поэтому следует отклонить нулевую гипотезу, то есть выборочная и гипотетическая генеральная средняя статистически различаются значимо.
б) По условию конкурирующая гипотеза имеет вид <38,1, поэтому критическая область левосторонняя. Найдем критическую точку из равенства Ф(uкр.,)=(1-2)/2=(1-0,1)/2=0,45. Согласно приложения 1: uкр.= -1,65. uрасч.> uкр., поэтому следует принять нулевую гипотезу Н0, то есть выборочная и гипотетическая генеральная средняя статистически различаются не значимо.
в) По условию конкурирующая гипотеза имеет вид >38,1, поэтому критическая область правосторонняя. Найдем критическую точку из равенства Ф(uкр.,)=(1-2)/2=(1-0,1)/2=0,45. Согласно приложения 1: uкр.=+1,65. uрасч.> uкр..поэтому следует отклонить нулевую гипотезу Н0, то есть выборочная и гипотетическая генеральная средняя статистически различаются значимо.
Пример. Оценить существенность различий в средней урожайности двух сортов озимой пшеницы, если для первого сорта средняя урожайность ц/га и выборочная дисперсия, а для второго сорта средняя урожайностьи выборочная дисперсия. Объемы выборокn1=5 иn2=5 соответственно.
Решение. Выдвигаем нулевую гипотезу о том, что средние урожайности двух сортов пшеницы не отличаются друг от друга, т.е. , при альтернативной гипотезе-урожайности существенно различны.
Примем уровень значимости .Так как выборки независимы, причем,то применим критерийt– Стьюдента сстепенями свободы.
. (11.8)
Критическое значение t-распределения:,при числе степеней свободы.
Так как tрасч.>tкр , то нулевую гипотезу следует отклонить. Следовательно, два сорта пшеницы отличаются статистически значимо по величине урожайности.
Если проверяется нулевая гипотеза о равенстве двух выборочных средних (), при конкурирующей гипотезе( уровень значимости принять равным 0,05), то используется критерийt– Стьюдента сстепенями свободы:
. (11.9)
Пример. Два сорта озимой пшеницы испытывались на одинаковом числе участков на протяжении семи лет (табл.8).
При уровне значимости проверить нулевую гипотезу о существенности различий в урожайности двух сортов озимой пшеницы.
Решение. Так как имеются две зависимости выборки, т.е. существует определенная корреляция между урожайностью сортов по годам, то необходимо оценить значимость не разности двух выборочных средних, а средней разности.
Выдвигаем нулевую гипотезу: средняя величина различий в урожайности пшеницы равна нулю,при.
Вспомогательная таблица для расчета ошибки средней разности
Год |
Урожайность, ц/га |
Разность | |||
х2i |
x1i | ||||
1995 |
46 |
53 |
6 |
1 |
1 |
1996 |
48 |
43 |
5 |
0 |
0 |
1997 |
46 |
45 |
-1 |
-6 |
36 |
1998 |
51 |
56 |
5 |
0 |
0 |
1999 |
52 |
58 |
6 |
1 |
1 |
2000 |
48 |
55 |
7 |
2 |
4 |
2001 |
52 |
59 |
7 |
2 |
4 |
Сумма |
|
|
35 |
0 |
40 |
. По данным таблицы найдем среднюю разность и ошибку средней разности:
; ;,
где ,n– число пар наблюдений.
При =0,05;k=n-1=7-1=6,tкр.=2,45
Сопоставив расчётное значение tс критическим, можно сделать вывод, что два сорта существенно различаются по уровню урожайности.