
- •Введение
- •1. Основные понятия математической статистики
- •2. Построение вариационного ряда
- •3. Графическое изображение вариационных рядов
- •4. Эмпирическая функция распределения
- •5. Основные выборочные характеристики
- •5.1. Показатели центра распределения
- •5.2. Показатели рассеяния
- •5.3. Показатели формы распределения
- •6. Точечные и интервальные оценки параметров генеральной совокупности
- •Стандартные ошибки:
- •7. Статистическая проверка гипотез
- •8. Предварительный выбор закона распределения
- •9. Проверка гипотезы о виде распределения
- •Приложение 1
- •Приложение 2
- •ЛИтература
- •Содержание
8. Предварительный выбор закона распределения
Большинство применяемых в практике контроля статистических методов основано на предложении, что распределение контролируемого признака подчиняется определенному теоретическому закону (нормальному, биноминальному, пуассоновскому и так далее) с параметрами, либо оцениваемыми по выборке, либо заранее известными. Применению этих методов должна предшествовать проверка по данным выборочных наблюдений гипотезы о законе распределения. Проверка гипотезы о законе распределения значения признака в генеральной совокупности осуществляется с помощью критериев согласия.
Чаще всего на практике имеют дело с нормальным распределением. Чем это объясняется? Ответ на этот вопрос дан А.М.Ляпуновым в центральной предельной теореме теории вероятности. Приведем следствие из нее: если случайная величина представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то имеет распределение, близкое к нормальному.
Функция
плотности нормального закона распределения
имеет вид
,
а интегральная функция распределения
–
У
нормального распределения два параметра
(количество параметров
):
математическое ожидание
и среднее квадратическое отклонение
.
Их оцениваем по выборке:
.
Кривая
нормального распределения симметрична
относительно прямой
.
1)
Для нормального закона средняя
арифметическая
,
мода
и медиана
равны как характеристики центра
распределения:
У
нас:
9,0548;
9,115;
9,097.
Как видно, значения этих величин практически не отличаются друг от друга.
2) У кривой нормального распределения коэффициенты асимметрии и эксцесса равны нулю.
У
нас:
–0,3;
–0,25.
Как
видно, значение коэффициента асимметрии
и значение коэффициента эксцесса
отличаются от нуля. (Замечание: считается,
что число
,
если
1.)
3) В случае нормального распределения справедливо следующее условие:
Проверим выполнение этого условия для нашего примера.
;
.
Условия выполняется.
4)
На практике для выдвижения гипотезы о
нормальном распределении используют
правило 3-х сигм: если случайная величина
распределена нормально, то абсолютная
величина её отклонения от математического
ожидания не превосходит утроенного
среднеквадратического отклонения, т.е.
все значения случайной величины должны
попасть в интервал:
:
Рисунок 5. – Правило 3-х сигм.
В
нашем случае все значения величин
попадают в интервал
,
равный
,
то есть в интервал (6,3848; 11,7248), так как
6,75,
10,97.
Таким образом, у нас есть основания предположить, что изучаемая случайная величина распределена по нормальному закону (нулевая гипотеза):
,
где
– опытные частоты,
– теоретические частоты,
– длина интервала,
– объём выборки,
– среднее квадратическое отклонение,
– табулированная функция,
.
9. Проверка гипотезы о виде распределения
Проверка гипотезы о законе распределения значения признака в генеральной совокупности осуществляется с помощью критериев согласия.
Проверяемая (нулевая) гипотеза утверждает, что значения признака в выборке, взятой из генеральной совокупности, распределены по предполагаемому закону.
Для проверки гипотезы о виде распределения необходимо вычислить теоретически ожидаемые (выравнивающие) частоты, которые должны были бы получиться, если бы распределение действительно соответствовало предполагаемому.
Теоретические частоты вычисляются по формулам:
1)
в случае дискретной случайной величины
,
где
– объем выборки;
– вероятность случайной величины
принять значения равное
.
2)
в случае непрерывной случайной величины
,
где
– объем выборки,
– середина интервала;
– функция плотности теоретического
распределения, вычисленная в точке
;
h
– длина интервала.
Проверку
гипотезы о виде теоретического
распределения можно провести с помощью
критерия согласия Пирсона
,
основанного на статистике:
где
– опытные частоты,
– выравнивающие частоты.
Гипотеза
отвергается, если вычисленное значение
окажется больше критического
,
найденного по таблицам распределения
для уровня значимости
и числа степеней свободы
,
где
– число интервалов,
– число оцениваемых параметров
предполагаемого теоретического
распределения (приложение 2).
Например,
если проверяется согласие экспериментальных
данных нормальному закону распределения,
для которого r=2,
то число степеней свободы
.
Следует
учитывать, что при использовании критерия
согласия Пирсона общее число наблюдений
должно быть достаточно большим (
50),
и число наблюдений в интервалах должно
быть не менее пяти
.
Интервалы, у которых
<5
нужно объединить, а их частоты сложить.
Проверим
для нашего примера гипотезу о нормальном
законе распределения изучаемой величины
для уровня значимости
.
Найдем выравнивающие частоты.
Таблица 4.
|
|
|
|
|
|
|
|||
6,97 |
3 |
|
-2,09 |
-2,34 |
0,0258 |
1,2412 |
1 |
12 |
|
7,40 |
6 |
-1,66 |
-1,86 |
0,0707 |
3,4014 |
3 |
|||
7,83 |
2 |
-1,23 |
-1,38 |
0,1569 |
7,5485 |
8 |
|||
8,26 |
14 |
-0,80 |
-0,89 |
0,2685 |
12,9176 |
13 |
|||
8,69 |
14 |
-0,37 |
-0,41 |
0,3668 |
17,6469 |
18 |
|||
9,12 |
24 |
0,06 |
0,07 |
0,3980 |
19,1479 |
19 |
|||
9,55 |
14 |
0,49 |
0,55 |
0,3429 |
16,4970 |
16 |
|||
9,98 |
12 |
0,92 |
1,03 |
0,2347 |
11,2915 |
11 |
|||
10,41 |
9 |
11 |
1,35 |
1,51 |
0,1276 |
6,1389 |
6 |
9 |
|
10,84 |
2 |
1,78 |
1,99 |
0,0551 |
2,6509 |
3 |
Находим с учетом объединения интервалов (объединяем первый, второй и третий интервалы, а также девятый и десятый)
=
=3,15.
Определим
.
Число степеней свободы
=7–3=4,
тогда при уровне значимости
имеем
=9,5.
Имеем
<
.
Следовательно, в рассматриваемом примере
нет оснований отвергнуть гипотезу о
нормальном распределении изучаемой
случайной величины.
Вид функции плотности вероятности данной случайной величины, распределённой по нормальному закону в нашем случае:
.
Интегральная функция распределения такова
.
Построим кривую Гаусса данного распределения. Найдем максимум кривой Гаусса
.
Рисунок 6. –.Полигон частот и кривая Гаусса