- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
6.3 Критерий согласия Романовского
Критерием является
не сама случайная величина
(подробно описанная в п. 5.2), а новая
случайная величина
,
гдеr–число степеней
свободы . Критической точкой данного
критерия являетсяY=3.
Если величина
(r– число степеней
свободы), то нулевая гипотезаН0о виде распределенияотвергается,
данные согласуются плохо. В противном
случае Н0
не отвергается,
считают расхождение выборочных
данных с предложенным распределением
только случайными;
6.4 Критерий согласия Колмогорова
Для использования
критерия Колмогорова требуется в
качестве пар значений использовать
значения эмпирической функции
распределения
и значения функции распределения
из предложенного распределения. Если
даны не такие значения, то их можно найти
по п.3.5.
По значениям
и
находится вспомогательная величина
и с её помощью
.
Согласованность
данных – вероятность отклонения, не
меньшего наблюдаемого
,
находится из равенства
.
Для нахождения
используется таблица (приложение 7).
Если
мало, то нулевая гипотеза о виде
распределения Н0отвергается
, данные согласуются плохо.
В противном случае Н0 не отвергается , считают расхождение выборочных данных с предложенным распределением только случайными;
Критериями Пирсона, Романовского и Колмогорова можно не ограничиваться, существуют и другие критерии согласия.
Рекомендуем не ограничиваться одним видом распределения, можно для страховки предположить ещё и другой вид распределения. В таком случае придётся найти параметры и другого предполагаемого распределения, необходимые для критерия согласия теоретические значения и применить повторно уже использованный критерий согласия.
Среди нескольких
видов распределения выбирается наилучшее
с точки зрения использованного критерия
(имеющее наименьшее
либо наибольшее
);
Пример 11:
Воспользоваться критериями Пирсона, Романовского и Колмогорова для проверки гипотезы о согласованности наблюдаемых частот и вероятностей соответствующих вероятностей значений Х=хi(неизвестные) при предположении нормального распределения выборки, заданных таблицей:
|
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
|
1 |
3 |
4 |
6 |
11 |
10 |
7 |
5 |
2 |
1 |
|
|
0,02 |
0,04 |
0,09 |
0,15 |
0,20 |
0,20 |
0,15 |
0,09 |
0,04 |
0,02 |
Решение:
Объём выборки n= 1 + 3 + 4+ 6 + 11 + 10 + 7 + 5 + 2 + 1 = 50.
Результаты дальнейших вычислений представим в виде сводных таблиц.
1) Критерий Пирсона
Частоты крайних
промежутков малы, объединим их с соседними
промежутками, пока не получим частоты
,
соответствующие им вероятности
сложим. Число промежутков при этом
уменьшится, станетк=6.
Найдём значение
несколькими способами.
Сводная
таблица 1 для вычисления
![]()
-
i







1
8
0,15
7,5
0,5
0,25
0,03333
8,53333
2
6
0,15
7,5
–1,5
2,25
0,30000
4,80000
3
11
0,20
10
1,0
1,00
0,10000
12,10000
4
10
0,20
10
0,0
0,00
0,00000
10,00000
5
7
0,15
7,5
–0,5
0,25
0,03333
6,53333
6
8
0,15
7,5
0,5
0,25
0,03333
9,53333

50
1,00
50
–
–
0,49999
51,49999
По столбцу 7 сводной
таблицы 1 получим
.
Если сумма
выравнивающих частот мало отличается
от объёма выборки
,
то можно применять другое правило
вычисления
(столбец 8)
=51,49999
–50=0,49999.
Результаты не отличаются, что говорит об отсутствии ошибок.
Значение
можно было так же найти, сравнивая
относительные частоты
с вероятностями
из условия (см. сводную таблицу 2).
На каждом промежутке
найдём наблюдаемую относительную
частоту
(см. 3 столбец сводной таблицы 2),
,
.
Сводная
таблица 2 для вычисления
![]()
-
i






1
8
0,16
0,15
0,01
0,0001
0,000667
2
6
0,12
0,15
-0,03
0,0009
0,006000
3
11
0,22
0,20
0,02
0,0004
0,002000
4
10
0,20
0,20
0
0
0,000000
5
7
0,14
0,15
-0,01
0,0001
0,000667
6
8
0,16
0,15
0,01
0,0001
0,000667

50
1,00
1,00
–
–
0,010001
В результате
получим
=50ּ0,010001=0,50005.
Полученное значение
незначительно отличается от найденного
в сводной таблице 1 значения из-за
округления чисел.
По критерию Пирсона
найденное значение
сравниваем с критическим значением
.Число степеней свободы при нормальном
распределении
=6 – 3 = 3, (число промежутков из-за
объединения промежутков уменьшилось,
сталок=6).
Из таблицы значений
(приложение 4) находим
, что
,
,
.
Возьмём уровень
достоверности
=0,99
(т.е. 99%), тогда
=0,01
и
( 0,5 <11,3 ) , из чего следует, что
расхождение выборочных и теоретических
данных только случайное, данные
согласуются хорошо.
Вывод: Гипотеза Н0о нормальном распределении исследуемого признака не отвергается.
Критерий Романовского
Выше найдено
,
число степеней свободыr=к–3= 3, т.е.
,
нет оснований отвергать гипотезу Н0.
3) Критерий Колмогорова
Составим сводную
таблицу 3, в которой найдём значения
эмпирической функции распределения
выборки
и теоретическую функцию распределения
.
Если бы выборка была задана статистическим
рядом распределения, то
могли бы быть найдены точнее, из
нормального распределения
.
В данном случае её значения находим,
как сумму вероятностей для вариант, не
превосходящих
.
Сводная таблица
3 для вычисления
![]()
-
i





1
1
0,02
0,02
0,02
0
2
3
0,04
0,08
0,06
0,02
3
4
0,09
0,16
0,15
0,01
4
6
0,15
0,28
0,30
0,02
5
11
0,20
0,50
0,50
0
6
10
0,20
0,70
0,70
0
7
7
0,15
0,84
0,85
0,01
8
5
0,09
0,94
0,94
0
9
2
0,04
0,98
0,98
0
10
1
0,02
1,00
1,00
0

50
1,00
–
–
–
Наибольшая разность
=0,02.
При n=50
найдём
.
Табличное значение
(приложение 7)
,
что говорит о почти стопроцентном
согласовании выборочных и теоретических
данных.
Нет причины отвергать нулевую гипотезу о виде распределения.
