- •1 Задачи математической статистики
- •2 Генеральная и выборочная совокупность
- •3 Виды выборки и способы отбора
- •4 Статистическое распределение выборки
- •5 Эмпирическая функция распределения
- •6 Графики статистического распределения
- •7 Статистические оценки параметров распределения
- •8 Несмещенные, эффективные и состоятельные оценки
- •9 Точечные оценки
- •9.1 Выборочная средняя
- •9.2 Групповая и общие средние
- •9.3 Дисперсия
- •9.4 Групповая, внутригрупповая, межгрупповая и общая дисперсии
- •9.5 Оценка генеральной дисперсии по исправленной выборочной
- •10 Другие характеристики вариационного ряда
- •11 Доверительные интервалы для оценки параметров распределения
- •11.1 Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
- •11.2 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ
- •11.3 Доверительные интервалы для оценки среднего квадратического отклонения σ нормального распределения
- •12 Статистическая проверка статистических гипотез
- •12.1 Критическая область. Область принятия гипотезы. Критические точки. Мощность критерия
- •12.2 Сравнение двух дисперсий нормальных генеральных совокупностей
- •12.3 Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- •12.4 Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны
- •12.5. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы
- •12.6. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности дисперсия известна
- •12.7. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности дисперсии неизвестны
- •13 Критерий согласия Пирсона
- •13.1 Вычисление теоретических частот нормального распределения
- •13.2 Проверка гипотезы о нормальном распределении генеральной совокупности
- •14 Функциональная, статистическая и корреляционная зависимости
- •15 Решение нулевого варианта
- •16 Расчетно-графические задания
- •17 Вопросы для самопроверки
- •18 Список использованных источников
- •Приложение
13.2 Проверка гипотезы о нормальном распределении генеральной совокупности
Обычно эмпирические и теоретические частоты различаются. Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Возможно, что расхождение неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности.
Критерий Пирсона отвечает на поставленный выше вопрос. Как и любой другой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.
Правило:
Для
того, чтобы при заданном уровне значимости
α проверить нулевую гипотезу Н0:
генеральная совокупность распределена
нормально, надо сначала вычислить
теоретические частоты, а затем наблюдаемое
значение критерия:
и по таблице критических точек
,
по заданному уровню значимости α
и числу
степеней свободы
(s
– число вариант (частичных интервалов))
найти критическую точку
.
Если
<
- нет оснований
отвергнуть нулевую гипотезу. Если
>
- нулевую
гипотезу отвергают.
Пример 13.2.
При уровне значимости α=0,05 проверить гипотезу о нормальном распределении генеральной совокупности по данным примера 13.1.
Решение:
Для нахождения наблюдаемого значения критерия составим расчетную таблицу:
-
xi
ni
48
54
60
66
72
14
36
34
13
3
12
35
37
14
2
0,3333
0,0286
0,2432
0,0714
0,5
сумма
100
100
1,1765
=1,1765.
По
таблице критических точек распределения
,
по уровню значимости 0,05 и числу степеней
свободы k=m-3=5-3=2
находим критическую точку
(0,05;2)=6.
Т.к. < - нулевую гипотезу принимаем, другими словами, различие между эмпирическими значениями и теоретическими не значимо, т.е. данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.
14 Функциональная, статистическая и корреляционная зависимости
Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин.
Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них могут быть и общие для обеих величин (под «общими» здесь подразумеваются такие факторы, которые воздействуют и на Y и на X). В этом случае возникает статистическая зависимость.
Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае статистическую зависимость называют корреляционной.
Приведем пример случайной величины Y, которая не связана с величиной X функционально, а связана корреляционно. Пусть Y - урожай зерна, X - количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, т. е. Y не является функцией от X. Это объясняется влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем, как показывает опыт, средний урожай является функцией от количества удобрений, т. е. Y связан с X корреляционной зависимостью.
Рассмотрим две зависимые случайные величины. Представим одну из них как функцию другой. Пусть Х связана с Y линейной зависимостью: у=a+bx, которую называют линейной регрессией.
Для расчета параметров a и b линейной регрессии решаем систему нормальных уравнений относительно a и b.
=na+b
=a
+b
Для определения степени тесноты линейной зависимости служит выборочный коэффициент корреляции.
Выборочный коэффициент корреляции может принимать значения в пределах от -1 до 1. Чем ближе он по абсолютной величине к 1, тем тесте связь. Знак при нем указывает направление связи: знак + соответствует прямой зависимости, т.е. с увеличением х увеличивается и у, знак - соответствует обратной зависимости, т.е. с увеличением х, у уменьшается.
Если r=±1, то х и у связаны линейной функциональной зависимостью. Если r=0, то величины не зависимы.
Выборочный
коэффициент корреляции определяется
следующим образом: rв
=
.
Если выборочный коэффициент корреляции найден по выборке и оказался не равен 0. Т.к. выборка отобрана случайно, то нельзя заключать, что коэффициент корреляции генеральной совокупности также отличен от 0. Возникает необходимость проверить гипотезу о значимости (существенности) выборочного коэффициента корреляции или о равенстве нулю коэффициента корреляции генеральной совокупности.
Правило:
Для
того, чтобы при заданном уровне значимости
α
проверить нулевую гипотезу Н0:
rг=0
о равенстве нулю коэффициента корреляции
генеральной совокупности при конкурирующей
гипотезе Н1:
rг≠0,
надо вычислить наблюдаемое значение
критерия: Тнабл.=rв
/
и по таблице критических точек
распределения Стьюдента, по заданному
уровню значимости и числу степеней
свободы k=n-2
найти критическую точку tкр(α,
k)
для двусторонней критической области.
Если |Тнабл|<tкр, нулевую гипотезу принимаем, в противном случае отвергаем.
Пример 14.1.
По следующим данным построить уравнение линейной регрессии, определить выборочный коэффициент корреляции и проверить нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0, при уровне значимости α=0,05:
Х |
12 |
15 |
19 |
22 |
27 |
31 |
33 |
35 |
40 |
42 |
Y |
23 |
28 |
35 |
41 |
55 |
52 |
59 |
55 |
50 |
51 |
Решение:
Составим выборочное уравнение регрессии Y на Х: у=a+bx.
Параметры уравнений найдем путем составления и решения системы уравнений:
=na+b
= a + b
Составим расчетную таблицу:
x |
y |
xy |
x2 |
y2 |
12 15 19 22 27 31 33 35 40 42 |
23 28 35 41 55 52 59 55 50 51 |
276 420 665 902 1485 1612 1947 1925 2000 2142 |
144 225 361 484 729 961 1089 1225 1600 1764 |
529 784 1225 1681 3025 2704 3481 3025 2500 2601 |
276 |
449 |
13374 |
8582 |
21555 |
Возьмем значения из последней строчки таблицы.
4
49=10а+276b
13374=276а+8582b.
Решим систему b=1,02; а=16,81.
Составим уравнение ух=16,81+1,02х
Вычислим выборочный
коэффициент корреляции: rв=
,
где
=
,
,
,
=
9,82,
=
11,81.
rв=
0,846.
Т.к. rв>0, то делаем вывод, что связь между признаками прямая, а т.к. rв близок к 1, то связь тесная.
При уровне значимости α=0,05 проверим нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0.
Найдем
наблюдаемое значение критерия:
Тнабл.=
≈8,42.
По условию конкурирующая гипотеза имеет вид: rг≠0, поэтому критическая область – двусторонняя.
Находим критическую точку по таблице критических точек распределения Стьюдента по уровню значимости 0,05 tкр.(0,05; 8)=2,31.
Так как Тнабл>tкр - нулевую гипотезу отвергаем, другими словами выборочный коэффициент корреляции значимо отличается от нуля.
