
- •1. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ
- •1.1. Законы распределения дискретных случайных величин
- •1.2. Числовые характеристики дискретных случайных величин, их свойства
- •1.3. Законы распределения непрерывных случайных величин
- •1.4. Числовые характеристики непрерывных случайных величин
- •1.5. Выборочные аналоги интегральной и дифференциальной функций распределения
- •1.6. Лабораторная работа № 1. Методы описательной статистики в пакете STATGRAPHICS
- •1.7. Нормальное распределение и его числовые характеристики
- •2. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ
- •2.1. -распределение
- •2.5. Гамма–распределение
- •2.7. Лабораторная работа № 2. Семейства вероятностных распределений в математических пакетах STATGRAPHICS и MAHTCAD
- •3. МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ (МЕТОД МОНТЕ-КАРЛО)
- •3.1. Общие принципы метода статистических испытаний
- •3.2. Датчики базовой случайной величины (БСВ)
- •3.3. Моделирование на ЭВМ стандартной равномерно распределенной случайной величины (базовой случайной величины)
- •3.5. Моделирование непрерывных случайных величин
- •3.6. Лабораторная работа № 3. Моделирование некоторых распределений с помощью базовых случайных величин в пакете MATHCAD
- •4. ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ И ИХ СВОЙСТВА
- •4.1. Статистические характеристики вариационных рядов и показатели их качества
- •4.3. Точечные оценки вероятности по частоте, математического ожидания и дисперсии
- •4.5. Методы получения точечных оценок
- •4.6. Сущность интервального оценивания
- •4.7. Приближенные и точные доверительные интервалы для параметров распределений
- •4.8. Лабораторная работа № 4. Оценивание параметров вероятностных распределений в пакетах STATGRAPHICS и MATHCAD
- •5. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ СОГЛАСИЯ
- •5.1. Понятие статистической гипотезы. Основные этапы проверки гипотез
- •5.2. Критерий Неймана – Пирсона
- •5.3. Проверка гипотез о числовых значениях параметров нормального распределения
- •5.4. Проверка гипотез о параметрах двух нормальных распределений
- •5.5. Лабораторная работа № 5. Проверка статистических гипотез о числовых значениях нормальных распределений в математических пакетах STATGRAPHICS и MATHCAD
- •5.6. Критерии согласия
- •Решение
- •5.7. Лабораторная работа № 6. Критерии согласия в статистическом пакете STATGRAPHICS
- •5.8. Лабораторная работа №7. Критерии согласия в математическом пакете MATHCAD
- •6. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
- •6.1. Постановка задачи
- •6.2. Дисперсионный анализ
- •Решение
- •6.3. Ранговый однофакторный анализ
- •6.4. Критерий Краскела - Уоллиса (Н-критерий)
- •Решение
- •6.5. Лабораторная работа № 8. Однофакторный ранговый и дисперсионный анализ в статистическом пакете STATGRAPHICS
- •7. РЕГРЕССИОННЫЙ АНАЛИЗ
- •7.1. Модели регрессии
- •7.4. Проверка адекватности линейной регрессии
- •7.5. Выбор наилучшей регрессии
- •8. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ
- •8.2. Критерий знаков
- •8.3. Критерий знаков для одномерной выборки
- •8.4. Ранговый критерий (одновыборочный критерий Вилкоксона)
- •8.5. Двухвыборочный ранговый критерий Вилкоксона

Рассмотрим статистику D |
= D |
(x , x ,...,x |
n |
) = n |
sup |
|
F (x)− F (x) |
|
. |
|
|
||||||||
n |
n |
1 2 |
|
−∞<x<+∞ |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
Критерий Колмогорова предписывает принять гипотезу H0 , если Dn < C и отвергнуть ее в противном случае, где C - критическое значение крите-
рия. При |
n → ∞ критическое значение C совпадает с (1 − α) % кванти- |
|||||||||||||||||||||||||
лью распределения Колмогорова. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
При |
практической |
реализации |
|
критерия |
|
сначала |
по |
выборке |
|||||||||||||||||
x , x |
2 |
,..., x |
n |
составляют |
вариационный ряд |
x , x ,..., x . |
Затем |
находят |
||||||||||||||||||
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
n |
|
|
|
|||||
значение статистики |
Dn . Для этого можно использовать несколько фор- |
|||||||||||||||||||||||||
мул. Например, |
|
i |
|
|
|
|
|
|
|
|
|
i −1 |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
Dn = |
n max |
|
− F0 (xi |
), F0 (xi ) |
− |
|
|
|
. |
|
|
|
(5.6.5) |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
1≤i≤n n |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
||||||
|
Другая употребительная формула имеет вид |
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
F0 (xi )− |
2i −1 |
|
|
|
|
1 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
Dn = |
n max |
|
|
|
+ |
. |
|
|
|
(5.6.6) |
||||||||||||
|
|
|
|
|
2n |
|
2n |
|
|
|
||||||||||||||||
|
|
|
|
|
|
1≤i≤n |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
После этого сравнивают полученное значение Dn |
с критическим зна- |
||||||||||||||||||||||||
чением C для заданного уровня значимости α и принимают или отвер- |
||||||||||||||||||||||||||
гают гипотезу H0 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
Пример. Дано следующее распределение успеваемости 100 студен- |
|||||||||||||||||||||||||
тов-заочников, сдавших четыре экзамена: |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Число сданных |
|
0 |
|
|
|
|
1 |
|
2 |
|
|
|
|
|
|
3 |
|
|
4 |
|||||||
экзаменов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Число студентов |
|
1 |
|
|
|
|
1 |
|
3 |
|
|
|
|
|
|
35 |
|
|
60 |
|||||||
|
|
|
|
|
|
|
||||||||||||||||||||
|
Проверить по критериям χ2 -Пирсона и Колмогорова гипотезу о том, |
|||||||||||||||||||||||||
что |
число сданных |
экзаменов распределено |
биномиально. |
Принять |
||||||||||||||||||||||
α = 0.1. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Решение
Здесь случайной величиной является число сданных экзаменов среди четырех. Обозначим ее X и установим сначала закон распределения этой величины. Для установления закона необходимо сделать некоторые допущения.
1. Процесс сдачи четырех экзаменов представим как четыре испытания. Будем считать эти испытания независимыми, т.е. пусть вероятность сдачи любым студентом любого экзамена не зависит от того, будет сдано или нет любое количество других экзаменов.
138

2. Вероятность сдачи студентом любого отдельно взятого экзамена одна и та же и равна p , а вероятность не сдачи равна q = 1 − p .
Если принять эти допущения, то перед нами схема Бернулли и число сданных экзаменов среди четырех сдаваемых будет иметь биномиальный закон распределения, т.е.
|
|
|
|
|
|
|
|
|
P(X = x) = C4x pxq4−x , |
x = 0,1,2,3,4 . |
|
|
|
(5.6.7) |
||||||||||
Для оценки вероятности |
p |
воспользуемся методом максимального |
||||||||||||||||||||||
правдоподобия. |
|
|
|
|
|
|
Получим |
|
L(x1, x2 ,..., xk ) = P(X = x1 )× |
|||||||||||||||
× P(X = x |
2 |
) ... P(X = x |
k |
) = C x1 p x1 qk −x1 C x2 p x2 qk −x2 |
... C xk p xk qk −xk = |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
k |
|
|
k |
|
|||
= (Ckx1 + Ckx2 + ... + Ckxk |
)p x1 +x2 +...+xk qk 2 −(x1 +x2 +...+xk ) = |
|
|
|
||||||||||||||||||||
= (Ckx1 + Ckx2 |
|
|
|
|
|
|
|
|
k |
|
k 2 |
k |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
∑ x |
− ∑ x |
|
|
|
|
|
||||||||||
+ ... + Ckxk )pi=1 i q |
i=1 i |
. Найдем логарифм функции прав- |
||||||||||||||||||||||
доподобия |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
k |
|
|
k2 |
k |
|
|
|
|
так как |
|
k |
|
|
k |
|
||
|
|
|
k |
|
i |
∑xi |
|
− ∑xi |
|
|
|
|
|
2 |
||||||||||
|
|
2 |
p |
=1 |
q |
i=1 |
|
|
|
n |
|
|
|
|
|
|
||||||||
lnL = ln |
|
|
|
|
|
|
= |
∑Cni = 2n |
= k ln2 + ∑xi ln p + k |
|
−∑xi lnq . |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
i=1 |
|
|
i=1 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂ln |
L |
|
|
1 |
|
k |
|
|
1 |
|
k |
|
|
) |
|
|
k |
|
|||||
Тогда |
|
∂p |
|
|
= |
|
|
∑xi − |
|
|
|
k |
2 |
− ∑xi |
= 0 . Отсюда p = p |
= ∑xi |
k 2 . |
|||||||
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
p i=1 |
|
q |
|
i=1 |
|
|
|
|
i =1 |
|
В рассматриваемой схеме практической случайной величиной является число экзаменов, сданных всеми 100 студентами, и xi наблюдается m
раз, т.е. |
в |
|
задаче |
задана |
сгруппированная |
|
выборка. |
Тогда |
||||||||
|
|
k |
|
|
l |
|
|
|
|
|
|
|
|
|
|
|
p = |
|
∑xi |
|
|
∑ximi |
|
k 2 = sn |
|
|
|
|
|
||||
|
i=1 |
= |
|
i=1 |
|
|
, |
где |
- число экзаменов, |
сдаваемых всеми |
||||||
|
k 2 |
|
|
|
||||||||||||
|
|
|
|
|
sn |
|
|
|
|
|
|
|
|
|
||
100 студентами, |
s = 4 |
- число сдаваемых экзаменов, |
n = 100 - число сту- |
|||||||||||||
дентов, l |
= 5 |
- |
|
число |
разрядов |
сгруппированной |
выборки. |
Тогда |
||||||||
|
|
l |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
p = |
∑xi mi |
0 |
1 +1 1 + 2 3 + 3 35 + 4 40 |
|
|
|
|
|||||||||
i =1 |
|
= |
= 0.88 . |
Вычислим |
теперь |
|||||||||||
sn |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
4 100 |
|
|
|
|
|
теоретические вероятности по формуле P(X = x) = C4x 0.88x 0.124 −x ,
139

x = 0,1,2,3,4 и относительные частоты p |
= m |
i |
n и поместим их в сле- |
||||
дующую таблицу: |
|
i |
|
|
|
||
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
X |
0 |
1 |
2 |
|
|
3 |
4 |
|
|
|
|
|
|
|
|
p |
0.00021 |
0.00608 |
0.06691 |
|
0.32711 |
0.59969 |
|
|
|
|
|
|
|
|
|
p |
0.01 |
0.01 |
0.03 |
|
|
0.35 |
0.60 |
Проверим теперь сначала с помощью критерия χ2 -Пирсона гипотезу
о соответствии теоретического биномиального распределения фактическим данным исходной таблицы. Итак, H0 : F(x) = B(p), p = 0.88 . Со-
ставим таблицу такой же структуры, как в предыдущем примере.
Но- |
Число |
Число |
Относи- |
Теоре- |
|
|
|
(mi − npi ) |
2 |
студен- |
тиче- |
|
|
|
|||||
мер |
сдан- |
тов mi |
тельные |
ские |
npi |
(mi − npi )2 |
|
|
|
интер |
npi |
|
|||||||
ных |
частоты |
частоты |
|
|
|
||||
вала |
экз. xi |
(часто- |
p |
|
|
|
|
|
|
pi |
|
|
|
|
|
||||
|
|
ты) |
i |
|
|
|
|
|
|
1 |
0 |
1 |
0.01 |
0.00021 |
0.021 |
|
|
|
|
2 |
1 |
1 |
1 |
0.00608 |
0.608 |
5.382 |
|
0.735 |
|
3 |
2 |
3 |
0.03 |
0.06691 |
6.691 |
|
|
|
|
4 |
3 |
35 |
0.35 |
0.32711 |
32.711 |
5.239 |
|
0.160 |
|
5 |
4 |
60 |
0.60 |
0.59969 |
59.969 |
0.001 |
|
0.000 |
|
χвыб2 = 0.895
Число степеней свободы статистики критерия χ2 -Пирсона равно
F0 (x)
1.0
2 |
3 |
4 |
x |
Рис. 5.22. График функции F0 (x)
140
3 −1 −1 = 1 . Тогда критиче-
ское |
значение |
критерия |
C = χ0.9,12 = 2.71 . |
Так как |
χвыб2 = 0.895 < χ02.9,1 = 2.71,
то гипотеза H0 принимается
с уровнем значимости
α = 0.1.
Проделаем то же самое с помощью критерия Колмогорова. Для этого построим
функцию распределения
F0 (x) (рис. 5.22).

X |
0-2 |
3 |
4 |
p |
0.0732 |
0.3271 |
0.5997 |
Так как |
|
|
F0 (x) = |
∑ pi |
, то гипотетическая функция распределения |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
xi <x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0, |
x ≤ 2, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
≤ 3, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
будет равна F0 (x) = |
0.0732, 2 < x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
≤ 4, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
0.4003, 3 < x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1, |
x > 4. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Рассчитаем |
|
теперь |
значение |
|
статистики |
|
|
|
Dn |
сначала |
по |
||||||||||||||||||||||||||||
формуле (5.6.5) |
|
|
|
|
i |
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
−1 |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
Dn |
= |
n max |
|
|
− F0 (xi |
), F0 (xi |
)− |
|
|
|
|
|
. |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1≤i≤n n |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|||||||||
|
|
|
|
1 |
− 0, 0 |
− |
1 −1 |
= 0.3333, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
i = 1 : max |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
3 |
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i = 2 : max |
|
|
|
− 0.0732, 0.0732 − |
|
|
= 0.5935, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
3 |
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i = 3 : max 1 − 0.4003, 0.4003 − |
|
|
|
= 0.5997. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Отсюда Dn = |
3 max(0.3333, 0.5935, 0.5997) = 1.0387 . |
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
При вычислении значения статистики по формуле (5.6.6) получим те |
|||||||||||||||||||||||||||||||||||||||
же |
значения. |
|
Действительно, |
Dn = |
n |
|
|
|
|
|
F0 (xi )− |
|
2i −1 |
|
|
|
1 |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
max |
|
|
|
|
+ |
, |
||||||||||||||||||||||||||||||||
|
|
|
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1≤i≤n |
|
|
|
|
|
|
|
2n |
|
|
2n |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
i = 1 : |
|
|
2 - 1 |
|
|
+ |
1 = 0.3333, |
|
|
|
|
|
|
i |
= 2 : |
|
0.0732 - |
3 |
|
|
|
+ 1 = 0.5935, |
|||||||||||||||||
|
0 - |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
6 |
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
|
6 |
|
|
|
|
|
||||||||
i = 3 : |
|
0.4003 - |
5 |
|
1 |
= 0.5997. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
6 |
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Dn = |
3 max(0.3333, 0.5935, 0.5997) = 1.0387 . |
|
|
Найдем |
|
критическое |
|||||||||||||||||||||||||||||||||
значение C критерия Колмогорова. Это 90% квантиль этого распределе- |
|||||||||||||||||||||||||||||||||||||||
ния, т.е. C = K −1(0.9) = 1.23 . Так как |
D |
< C , |
следовательно, D W \ ω |
n
и гипотеза H0 должна быть принята с уровнем значимости α = 0.1.
141