
- •Введение
- •1. Основные понятия математической статистики
- •2. Построение вариационного ряда
- •3. Графическое изображение вариационных рядов
- •4. Эмпирическая функция распределения
- •5. Основные выборочные характеристики
- •5.1. Показатели центра распределения
- •5.2. Показатели рассеяния
- •5.3. Показатели формы распределения
- •6. Точечные и интервальные оценки параметров генеральной совокупности
- •9,0548; 9,115;9,097;0,89;0,7988;9,8;–0,3;–0,25.
- •Стандартные ошибки:
- •8,8796199,229981.
- •8. Предварительный выбор закона распределения
- •9. Проверка гипотезы о виде распределения
- •Приложение 1
- •Приложение 2
- •ЛИтература
- •Содержание
8. Предварительный выбор закона распределения
Большинство
применяемых в практике контроля
статистических методов основано на
предложении, что распределение
контролируемого признака подчиняется
определенному теоретическому закону
(нормальному, биноминальному, пуассоновскому
и так далее) с параметрами, либо
оцениваемыми по выборке, либо заранее
известными. Применению этих методов
должна предшествовать проверка по
данным выборочных наблюдений гипотезы
о законе распределения. Проверка гипотезы
о законе распределения значения признака
в генеральной совокупности осуществляется
с помощью критериев согласия.
Чаще
всего на практике имеют дело с нормальным
распределением. Чем это объясняется?
Ответ на этот вопрос дан А.М.Ляпуновым
в центральной предельной теореме теории
вероятности. Приведем следствие из нее:
если случайная величина
представляет собой сумму очень большого
числа взаимно независимых случайных
величин, влияние каждой из которых на
всю сумму ничтожно мало, то
имеет распределение, близкое к нормальному.
Функция
плотности нормального закона распределения
имеет вид
,
а интегральная функция распределения
–
.
У
нормального распределения два параметра
(количество параметров
):
математическое ожидание
и среднее квадратическое отклонение
.
Их оцениваем по выборке:
.
Кривая
нормального распределения симметрична
относительно прямой
.
1)
Для нормального закона средняя
арифметическая
,
мода
и медиана
равны как характеристики центра
распределения:
.
У
нас:
9,0548;
9,115;
9,097.
Как видно, значения этих величин практически не отличаются друг от друга.
2) У кривой нормального распределения коэффициенты асимметрии и эксцесса равны нулю.
У
нас:
–0,3;
–0,25.
Как
видно, значение коэффициента асимметрии
и значение коэффициента эксцесса
отличаются от нуля. (Замечание: считается,
что число
,
если
0,1).
3) В случае нормального распределения справедливо следующее условие:
.
Проверим выполнение этого условия для нашего примера.
;
.
Условия выполняется.
4)
На практике для выдвижения гипотезы о
нормальном распределении используют
правило 3-х сигм: если случайная величина
распределена нормально, то абсолютная
величина её отклонения от математического
ожидания не превосходит утроенного
среднеквадратического отклонения, т.е.
все значения случайной величины должны
попасть в интервал:
:
Рисунок 5. – Правило 3-х сигм.
В
нашем случае все значения величин
попадают в интервал
,
равный
,
то есть в интервал (6,3848; 11,7248), так как
6,75,
10,97.
Таким образом, у нас есть основания предположить, что изучаемая случайная величина распределена по нормальному закону (нулевая гипотеза):
,
где
– опытные частоты,
– теоретические частоты,
– длина интервала,
– объём выборки,
– среднее квадратическое отклонение,
– табулированная функция,
.
9. Проверка гипотезы о виде распределения
Проверка
гипотезы о законе распределения значения
признака
в генеральной совокупности осуществляется
с помощью критериев согласия.
Проверяемая (нулевая) гипотеза утверждает, что значения признака в выборке, взятой из генеральной совокупности, распределены по предполагаемому закону.
Для проверки гипотезы о виде распределения необходимо вычислить теоретически ожидаемые (выравнивающие) частоты, которые должны были бы получиться, если бы распределение действительно соответствовало предполагаемому.
Теоретические
частоты
вычисляются по формулам:
1)
в случае дискретной случайной величины
,
где
– объем выборки;
– вероятность случайной величины
принять значения равное
.
2)
в случае непрерывной случайной величины
,
где
– объем выборки,
– середина интервала;
– функция плотности теоретического
распределения, вычисленная в точке
;h
– длина интервала.
Проверку
гипотезы о виде теоретического
распределения можно провести с помощью
критерия согласия Пирсона
,
основанного на статистике:
где
– опытные частоты,
– выравнивающие частоты.
Гипотеза
отвергается, если вычисленное значение
окажется больше критического
,
найденного по таблицам распределения
для уровня значимости
и числа степеней свободы
,
где
– число интервалов,
– число оцениваемых параметров
предполагаемого теоретического
распределения (приложение 2).
Например,
если проверяется согласие экспериментальных
данных нормальному закону распределения,
для которого r=2,
то число степеней свободы
.
Следует
учитывать, что при использовании критерия
согласия Пирсона общее число наблюдений
должно быть достаточно большим (50),
и число наблюдений в интервалах должно
быть не менее пяти
.
Интервалы, у которых
<5
нужно объединить, а их частоты сложить.
Проверим
для нашего примера гипотезу о нормальном
законе распределения изучаемой величины
для уровня значимости
.
Найдем выравнивающие частоты.
Таблица 4.
|
|
|
|
|
|
| |||
6,97 |
3 |
|
-2,09 |
-2,34 |
0,0258 |
1,2412 |
1 |
| |
7,40 |
6 |
-1,66 |
-1,86 |
0,0707 |
3,4014 |
3 | |||
7,83 |
2 |
-1,23 |
-1,38 |
0,1569 |
7,5485 |
8 | |||
8,26 |
14 |
-0,80 |
-0,89 |
0,2685 |
12,9176 |
13 | |||
8,69 |
14 |
-0,37 |
-0,41 |
0,3668 |
17,6469 |
18 | |||
9,12 |
24 |
0,06 |
0,07 |
0,3980 |
19,1479 |
19 | |||
9,55 |
14 |
0,49 |
0,55 |
0,3429 |
16,4970 |
16 | |||
9,98 |
12 |
0,92 |
1,03 |
0,2347 |
11,2915 |
11 | |||
10,41 |
9 |
|
1,35 |
1,51 |
0,1276 |
6,1389 |
6 |
| |
10,84 |
2 |
1,78 |
1,99 |
0,0551 |
2,6509 |
3 |
Находим с учетом объединения интервалов (объединяем первый, второй и третий интервалы, а также девятый и десятый)
=
=3,15.
Определим
.
Число степеней свободы
=7–3=4,
тогда при уровне значимости
имеем
=9,5.
Имеем
<
.
Следовательно, в рассматриваемом примере
нет оснований отвергнуть гипотезу о
нормальном распределении изучаемой
случайной величины.
Вид функции плотности вероятности данной случайной величины, распределённой по нормальному закону в нашем случае:
.
Интегральная функция распределения такова
.
Построим кривую Гаусса данного распределения. Найдем максимум кривой Гаусса
.
Рисунок 6. –.Полигон частот и кривая Гаусса