![](/user_photo/2706_HbeT2.jpg)
- •Конспект лекций
- •2 Алгебра событий.
- •3 Определения вероятности события.
- •4 Элементы комбинаторики
- •1 Теоремы сложения вероятностей.
- •4 Формула полной вероятности. Формула вероятности гипотез.
- •Тема 2. Повторные независимые испытания
- •2 Наивероятнейшее число наступлений события в независимых испытаниях.
- •3 Локальная теорема Муавра-Лапласа.
- •4 Интегральная теорема Муавра-Лапласа. Пуассоновское приближение
- •Тема 3. Дискретные случайные величины
- •2 Закон распределения вероятностей дискретной случайной величины.
- •3 Математическое ожидание и его свойства.
- •4 Дисперсия дискретной случайной величины и ее свойства
- •5 Одинаково распределенные взаимно-независимые случайные величины
- •Тема 4. Непрерывные случайные величины
- •2)Дифференциальная функция (плотность распределения) непрерывной случайной величины и ее свойства.
- •Тема 5. Основные законы распределения случайных величин
- •1. Основные законы распределения дискретных случайных величин.
- •2) Равномерное распределение
- •Тема 6. Функции случайных величин и векторов
- •2) Композиция законов распределения
- •3) Специальные законы распределения
- •Тема 7. Многомерные случайные величины
- •2)Функции распределения многомерной случайной величины.
- •3)Вероятность попадания двумерной случайной величины в полуполосу и прямоугольник.
- •4)Числовые характеристики системы двух случайных величин
- •Тема 8. Закон больших чисел
- •2)Неравенство и теорема Чебышева
- •3)Понятие о центральной предельной теореме
- •Часть II. Математическая статистика
- •Тема 10. Вариационные ряды распределения
- •1) Понятие и виды вариационных рядов распределения.
- •2) Графическое изображение рядов распределения и связь между ними.
- •1) Понятие и виды вариационных рядов распределения
- •2) Графическое изображение рядов распределения и связь между ними.
- •1) Средняя арифметическая и ее свойства.
- •2) Дисперсия ряда распределения и ее свойства. Среднее квадратическое отклонение.
- •3)Моменты ряда распределения и связь между ними
- •Тема 11. Выборочный метод
- •2)Статистические оценки выборочной совокупности и их свойства.
- •3) Точечные и интервальные оценки.
- •Тема 12. Проверка статистических гипотез
- •1)Понятие и виды статистических гипотез.
- •2)Статистический критерий проверки гипотез.
- •3)Уровень значимости. Мощность критерия.
- •2)Статистический критерий проверки гипотез
- •Тема 13. Дисперсионный анализ
- •1)Понятие и модели дисперсионного анализа.
- •2)Однофакторный дисперсионный анализ.
- •1)Понятие и модели дисперсионного анализа.
- •2)Однофакторный дисперсионный анализ.
- •4.1.2.3. Двухфакторный дисперсионный анализ. Факторы а и в
- •Тема 14. Корреляционно-регрессионный анализ
- •1)Понятие корреляционной зависимости.
- •2) Оценка методом наименьших квадратов коэффициентов регрессии
- •Тема 15. Статистический анализ временных рядов
- •1)Понятие экономического временного ряда и его составляющие.
- •2)Тренд динамического ряда.
- •2)Тренд динамического ряда
- •Приложение е – Глоссарий
- •Приложение ж – Экзаменационные билеты
Тема 12. Проверка статистических гипотез
Лекция 1. Вопросы:
1)Понятие и виды статистических гипотез.
2)Статистический критерий проверки гипотез.
3)Уровень значимости. Мощность критерия.
1)Понятие и виды статистических гипотез.
Статистической гипотезой называется всякое высказывание о генеральной совокупности, проверяемое по выборке. Статистические гипотезы делятся на:
Параметрические - это гипотезы, сформулированные относительно параметров (среднего значения, дисперсии и т.д.) распределения известного вида;
Непараметрические - это гипотезы, сформулированные относительно вида распределения (например, определение по выборке степени нормальности генеральной совокупности).
Процесс
использования выборки для проверки
гипотезы называется статистическим
доказательством. Основную выдвигаемую
гипотезу называют нулевой H0.
Наряду с нулевой гипотезой рассматривают
ей альтернативную H1.
Например, H0:
M(х)=1, математическое ожидание генеральной
совокупности равно 1; H1:
M(х)>1, или M(х)<1, или M(х)1
(математическое ожидание больше 1, или
меньше 1, или не равно 1).
Выбор
между гипотезами H0
и
H1
может сопровождаться ошибками двух
родов. Ошибка первого рода α означает
вероятность принятия H1,
если верна гипотеза H0:.
Ошибка второго рода означает вероятность
принятия H0,
если верна гипотеза H1:
.
Существует правильное решение двух
видов:
и
.
Ошибки первого и второго рода
Принятая гипотеза |
Н0 |
Н1 |
H0 - верна |
P(Н0/Н0)=1- |
P(Н1/Н0)= |
H0 – неверна |
P(Н0/Н1)= |
P(Н1/Н1)=1- |
Правило, по которому принимается решение о том, что верна или не верна гипотеза Н0, называется критерием, где:
=P(Н1/Н0) - уровень значимости критерия;
M=1-=P(Н1/Н1) - мощность критерия.
2)Статистический критерий проверки гипотез
Статистическим критерием K называют случайную величину, с помощью которой принимают решение о принятии или отклонении Н0.
Замечание.
Для проверки параметрических гипотез
используют критерии значимости,
основанные на статистиках: u, χ2,
t,
F
(приложения 5-7). Непараметрические
гипотезы проверяют с помощью критериев
согласия, использующих статистики
распределений:
,
Колмогорова-Смирнова [1, 2, 6, 10] и т.д.
Например, Н0: М(х)=10. В зависимости от альтернативной гипотезы рассматривают три случая.
1.
Если
Рис 27. Двусторонняя критическая область
В этом случае рассматривают двустороннюю критическую область и используют дифференциальную функцию f (K/H0), для определения соответствующих квантилей (границ области принятия гипотезы - левой (К1-/2) и правой (К/2)). Площадь под криволинейной трапецией дифференциальной функции слева от К1-/2 и справа от К/2 равна /2.
Общая площадь ограниченная криволинейной трапецией дифференциальной функции, квантилями и осью абсцисс равна (1 - α) (рис. 27):
(11.1)
2. Если
то
рассматривается правосторонняя
критическая область (площадь под
криволинейной трапецией справа от К
равна )
(рис. 28):
(11.2)
Рис. Правосторонняя критическая область
3. Если
,
то рассматривается левосторонняя
критическая область (площадь под
криволинейной трапецией слева от К1-
равна )
(рис. 29):
(11.3)
Рис. Левосторонняя критическая область
Алгоритм проверки статистических гипотез состоит из следующих этапов:
Располагая
выборочными данными (),
формируют нулевую гипотезу
и
конкурирующую гипотезу Н1.
Задают уровень значимости α (обычно принимают α =0,1; 0,01; 0,05; 0,001).
Рассматривается выборочная статистика наблюдений (критерий) К, обычно одна из перечисленных ниже:
u - нормальное распределение;
χ2- распределение Пирсона (хи – квадрат);
t - распределение Стьюдента;
F - распределение Фишера - Снедекора.
4. На
основании выборки
-
определяют значение критерия (статистики)
К (приложения 5-7). В зависимости от вида
альтернативной гипотезы выбирают по
соответствующей таблице квантили
критерия для двусторонней
или
односторонней области (К1-
или К)
(приложения 1-4). Если значения критерия
попадают в критическую область, то H0
отвергается; в противном случае
принимается гипотеза H0
и считается, что Н0
не противоречит выборочным данным (при
этом существует возможность ошибки с
вероятностью равной ).
Следует отметить, что возможность принятия гипотезы происходит из принципа невозможности наступления маловероятных событий. Те же события, вероятность которых близка к 1, принимаются за достоверные. Возникает проблема выбора уровня риска (уровня значимости ).
В одних случаях возможно пренебрегать событиями р<0,05, в других нельзя пренебрегать событиями, которые могут появиться с р=0,001 (разрушение сооружений, транспортных средств и т.д.).
Лекция 2.Проверка гипотез о равенстве средних. Критерии согласия.
Пусть требуется проверить нулевую гипотезу о нормальном законе распределения случайной величины. Уровень значимости принять =0,001 .
Обычно точные
параметры гипотетического нормального
закона нам неизвестны, поэтому нулевую
гипотезу (Н0)
словесно можно сформулировать следующим
образом: F(х) является функцией нормального
распределения с параметрами М(X)
=а =
и D(X)
=
.
Для проверки этой нулевой гипотезы найдем точечные оценки математического ожидания и среднего квадратического отклонения нормально распределенной случайной величины:
:
(11.4)
При проверке гипотезы о нормальном распределении генеральной совокупности сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормальности распределения) частоты. Для этого используются статистика 2 – Пирсона с =k-r-1 степенями свободы (k – число групп, r – число оцениваемых параметров, в настоящем примере оценивались математическое ожидание и среднее квадратическое отклонение, следовательно, r = 2). Если 2расч. 2кр., то нулевая гипотеза отвергается и считается, что предположение о нормальности распределения не согласуется с опытными данными. В противном случае (2расч. < 2кр.) нулевая гипотеза принимается.
Вычисляются теоретические вероятности рi, попадания СВ ХN в частичные интервалы [xi-1; xi) по формуле:
,
(i=1,2,...,k),
(11.5)
где
.
(11.6)
Применение критерия 2, для проверки гипотезы о нормальности распределения предполагает наличие в каждом частичном интервале не менее пяти единиц, в противном случае желательно объединять эти интервалы с соседними.
Проверка гипотезы о принадлежности СВ показательному, биномиальному, пуассоновскому или другому распределению основывается на применении в описанном алгоритме соответствующих интегральных функций.
По таблице квантилей 2-распределения , при заданном уровне значимости и числе степеней свободы =k-r-1 находится критическое значение, которое сравнивается с фактически наблюдаемым значением. Если 2расч.< 2кр. , то нет оснований для отклонения нулевой гипотезы о нормальном законе распределения.
Пример.
Из нормальной генеральной совокупности
сельскохозяйственных предприятий,
рассматриваемых по показателю урожайности
пшеницы, с известным средним квадратическим
отклонением =9,4
и генеральной средней
=38,1,
извлечена выборка объема n=50. По ней
найдена выборочная средняя
=42.
Требуется при уровне значимости=0,05
проверить нулевую гипотезу Н0:
а)
,
при конкурирующей гипотезе Н1:
38,1;
б)
,
при конкурирующей гипотезе Н1:
<38,1;
в)
,
при конкурирующей гипотезе Н1:
>38,1.
Решение.
Необходимо рассмотреть критерий К=u,
где
(11.7)
а) По
условию конкурирующая гипотеза имеет
вид
38,1,
поэтому критическая область двусторонняя.
Найдем критическую точку из равенства
Ф(uкр.,/2)=(1-)/2=(1-0,05)/2=0,475.
Согласно приложения 1: uкр.=1,96.
,
поэтому следует отклонить нулевую
гипотезу, то есть выборочная и
гипотетическая генеральная средняя
статистически различаются значимо.
б) По
условию конкурирующая гипотеза имеет
вид
<38,1,
поэтому критическая область левосторонняя.
Найдем критическую точку из равенства
Ф(uкр.,)=(1-2)/2=(1-0,1)/2=0,45.
Согласно приложения 1: uкр.=
-1,65. uрасч.
> uкр.,
поэтому следует принять нулевую гипотезу
Н0,
то есть выборочная и гипотетическая
генеральная средняя статистически
различаются не значимо.
в) По
условию конкурирующая гипотеза имеет
вид
>38,1,
поэтому критическая область правосторонняя.
Найдем критическую точку из равенства
Ф(uкр.,)=(1-2)/2=(1-0,1)/2=0,45.
Согласно приложения 1: uкр.=+1,65.
uрасч.
> uкр..
поэтому следует отклонить нулевую
гипотезу Н0,
то есть выборочная и гипотетическая
генеральная средняя статистически
различаются значимо.
Пример.
Оценить
существенность различий в средней
урожайности двух сортов озимой пшеницы,
если для первого сорта средняя урожайность
ц/га
и выборочная дисперсия
,
а для второго сорта средняя урожайность
и выборочная дисперсия
.
Объемы выборокn1=5
и n2=5
соответственно.
Решение. Выдвигаем
нулевую гипотезу о том, что средние
урожайности двух сортов пшеницы не
отличаются друг от друга, т.е.
, при альтернативной гипотезе
-урожайности существенно различны.
Примем уровень
значимости
.Так
как выборки независимы, причем
,то
применим критерийt
– Стьюдента с
степенями свободы.
.
(11.8)
Критическое
значение t-распределения:
,при
числе степеней свободы
.
Так как tрасч. > tкр , то нулевую гипотезу следует отклонить. Следовательно, два сорта пшеницы отличаются статистически значимо по величине урожайности.
Если
проверяется нулевая гипотеза о равенстве
двух выборочных средних (),
при конкурирующей гипотезе
(
уровень значимости принять равным
0,05), то используется критерийt
– Стьюдента с
степенями свободы:
.
(11.9)
Пример. Два сорта озимой пшеницы испытывались на одинаковом числе участков на протяжении семи лет (табл.8).
При
уровне значимости
проверить нулевую гипотезу о существенности
различий в урожайности двух сортов
озимой пшеницы.
Решение. Так как имеются две зависимости выборки, т.е. существует определенная корреляция между урожайностью сортов по годам, то необходимо оценить значимость не разности двух выборочных средних, а средней разности.
Выдвигаем нулевую
гипотезу: средняя величина различий в
урожайности пшеницы равна нулю,при
.
Вспомогательная таблица для расчета ошибки средней разности
Год |
Урожайность, ц/га |
Разность |
|
| ||||
х2i |
x1i | |||||||
1995 |
46 |
53 |
6 |
1 |
1 | |||
1996 |
48 |
43 |
5 |
0 |
0 | |||
1997 |
46 |
45 |
-1 |
-6 |
36 | |||
1998 |
51 |
56 |
5 |
0 |
0 | |||
1999 |
52 |
58 |
6 |
1 |
1 | |||
2000 |
48 |
55 |
7 |
2 |
4 | |||
2001 |
52 |
59 |
7 |
2 |
4 | |||
Сумма |
|
|
35 |
0 |
40 |
.
По данным таблицы найдем среднюю
разность
и ошибку средней разности
:
;
;
,
где
,n
– число пар наблюдений.
При
=0,05;k=n-1=7-1=6,
tкр.=2,45
Сопоставив расчётное значение t с критическим, можно сделать вывод, что два сорта существенно различаются по уровню урожайности.