Загребаев Лектсии по теории вероятностеы и математическоы статистике 2015
.pdfРис. 12.2. Распределение Стьюдента при различном объеме выборки
При этом M[T ] = 0 и D[T ] = n −n 2 при n > 2.
Распределение Пирсона
Рассмотрим n нормально распределенных величин X1,..., Xn c нулевым математическим ожиданием и единичной дисперсией:
M[X1] = ... = M[Xn ] = 0; D[X1] = ... = D[Xn ] = 1 |
|
и функцию от них: |
|
χ2 = X12 + ... + Xn2. |
(12.14) |
Плотность распределения случайной величины χ2 носит назва-
ние «распределение Пирсона» или « χ2-распределение». На
рис. 12.3. показано распределение Пирсона для различного объема выборки n. Можно показать, что при n → ∞ распределение асимп-
тотически нормальное с центром в точке χ2 = n и дисперсией 2n.
|
Легко |
показать, |
что исправленная выборочная |
дисперсия |
||||||||
|
|
n |
n |
(X |
|
|
|
)2 |
|
|
|
|
|
|
− X |
|
|
|
|
||||||
S 2 |
= |
|
|
|
|
i n |
в |
связана с величиной χ2 соотношением |
||||
n − 1 |
|
|||||||||||
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
χ2 = |
S2 (n − 1) |
. |
(12.15) |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
σ2x |
|
|
|
|
|
|
|
|
|
|
|
|
111 |
|
|
Рис. 12.3. Распределение Пирсона
Лекция 13. ПОСТРОЕНИЕ ИНТЕРВАЛЬНЫХ ОЦЕНОК
Доверительный интервал для математического ожидания и дисперсии
Существует два подхода к построению доверительных интервалов при нахождении оценок параметров. Первый из них приводит к построению «точных» доверительных интервалов и основан на переходе от закона распределения оценки θ*, которая зависит от самого неизвестного параметра θ, к какой-нибудь другой функции от наблюдаемых величин X1,..., Xn , которая уже не зависит от неиз-
вестных параметров. Второй способ – приближенный. Продемонстрируем применение этих подходов на следующих примерах.
Пусть получена выборка x1,..., xn из нормальной генеральной совокупности с неизвестными параметрами mx и Dx . По этим дан-
|
n |
|
n |
|
|
xi2 |
и s2 = |
(xi − xв)2 |
|
ным получены оценки параметров x = |
i=1 |
i=1 |
. |
|
|
|
|||
в |
n |
|
n − 1 |
|
|
|
|
Требуется построить доверительный интервал для оценок этих параметров.
112
Доверительный интервал для математического ожидания
В соответствии с постановкой задачи необходимо найти такое , чтобы выполнялось соотношение P( Xв − mx < ) = β, то есть найти
такой доверительный интервал около среднего выборочного, который с заданной вероятностью β «накрывал» бы истинное значение
математического ожидания. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
в − mx |
|
||||||||
|
Домножим неравенство |
X |
< |
||||||||||||||||||||||||
на положительную величину |
|
|
|
|
|
n |
, тогда получим |
||||||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
S2 |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
n |
|
|
|
|
в |
− mx |
|
< |
|
n . |
|
|
|
|
|
||||||||
|
|
|
|
X |
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
S2 |
|
|
|
|
|
|
|
|
|
|
|
S2 |
|
|
|
|
|
||||||
|
|
|
в − mx ) |
, |
|
|
|
|
|
n . |
|||||||||||||||||
Обозначив T = |
n(X |
получим |
|
T |
|
< |
|||||||||||||||||||||
|
|
||||||||||||||||||||||||||
|
|
|
|
||||||||||||||||||||||||
|
|
|
S |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
S2 |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таким образом, исходная постановка задачи трансформировалась в следующую:
Найти такое , чтобы с заданной вероятностью β выполнялось неравенство T < tβ , где
t = |
n . То есть выполнялось равенство P( |
|
T |
|
< t ) = β. |
|
|
||||
β |
S2 |
|
|
|
β |
|
|
|
|
|
В этом соотношении T – статистика, подчиненная закону Стъюдента, то есть случайная величина с известной плотностью распределения f (t). С учетом четности функции плотности рас-
пределения f (t), условие P( T < tβ ) = β равносильно
tβ
β = 2 f (t)dt.
0
По таблице зависимости tβ от числа степеней свободы k = n − 1
изаданной вероятности β находим tβ , а затем
=tβ sn2 .
113
Пример. Пусть произведено пять независимых опытов со случайной величиной X, распределенной нормально с неизвестными па-
раметрами mx и σx , результаты опытов указаны в табл. 13.1.
Таблица 13.1
x1 |
x2 |
x3 |
x4 |
x5 |
−2,5 |
3,4 |
−2,0 |
1,0 |
2,1 |
|
|
|
|
|
Найти оценку математического ожидания и построить вокруг него 90 % доверительный интервал, т.е. доверительный интервал, соответствующий вероятности β = 0,9.
m* = |
n |
xi |
|
|
s2 = |
1 |
|
n (xi − m* )2 = 6, 445. |
|||||||||
i=1 |
|
= 0,4, |
|
||||||||||||||
n |
|
|
|||||||||||||||
|
|
|
|
|
|
n − 1 i=1 |
|
|
|
|
Таблица 13.2 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|||||||
Число степеней |
|
Доверительная вероятность |
|
|
|||||||||||||
свободы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
0,1 |
|
|
0,2 |
|
… |
|
0,9 |
|
… |
|
0,999 |
||||
1 |
|
|
|
… |
|
|
… |
|
… |
|
6,31 |
|
… |
|
….. |
||
2 |
|
|
|
…. |
|
|
…. |
|
…. |
|
2,92 |
|
|
|
|||
3 |
|
|
|
… |
|
|
… |
|
… |
|
2,35 |
|
… |
|
… |
||
4 |
|
|
|
0,134 |
|
0,217 |
|
|
|
|
|
|
|
|
8,61 |
||
|
|
|
|
2,13 |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
… |
|
|
… |
|
|
… |
|
… |
|
|
… |
… |
|
… |
|||
|
|
|
|
|
|
|
|
|
|
|
|
1,645 |
|
|
|
||
Число степеней свободы |
k = n − 1 = 4. |
По табл. 13.2 |
для дан- |
ного числа степеней свободы и доверительной вероятности оп-
ределяем |
tβ = 2,13 и величину |
|
= t |
s2 |
= 2,42, следовательно, |
|
||
β |
n |
|
|
|
истинное значение математического ожидания с вероятностью 90 % находится в интервале
(–2,02; 2,82) рис. 13.1.
114
Доверительный интервал для дисперсии
Несмещенной оценкой дисперсии является величина
|
1 |
n |
1 |
|
|||
S 2 = |
|
|
в)2. Известно, что величина |
(n − 1)S2 = χ2 |
|||
(Xi − X |
|||||||
|
|
||||||
|
n − 1 i=1 |
σ2x |
подчинена закону χ2 .
Рис. 13.2. Расположение доверительного интервала
На рис. 13.2 показана функция плотности распределения с указанием расположения интервала Iβ . Интервал Iβ можно выбрать
так, чтобы вероятность уклонения случайной величины χ2 влево и вправо за интервал была одинаковой и равна величине α2 = 1−2β ,
где β – доверительная вероятность. Действительно, так как функция плотности распределения f (χ2 ) при заданном числе степеней свободы k = n − 1 известна, то вероятность того, что случайная величи-
на χ2 выйдет за правую границу интервала χ2 |
есть площадь под |
||
кривой |
|
1 |
|
|
|
|
|
+∞ |
f (χ2 )dχ2 = |
α . |
|
|
(13.1) |
||
χ2 |
|
2 |
|
1 |
|
|
|
115
Вероятность того, что случайная величина χ2 будет правее точ-
ки χ22 , есть площадь под кривой правее точки χ22. Эту площадь
можно определить следующим образом. Из всей площади под кривой (которая равна 1) вычесть площадь под кривой между точками
0 и χ22 , которая равна |
α . То есть 1− α . Таким образом, левая гра- |
||
|
2 |
2 |
|
ница интервала Iβ находится из решения уравнения |
|
||
|
+∞ |
f (χ2 )dχ2 = 1− α . |
|
|
|
(13.2) |
|
|
χ22 |
2 |
|
|
|
|
Решение уравнений (13.1) и (13.2) возможно либо численно, либо уже затабулировано в соответствующих таблицах.
Теперь, считая χ12 и χ22 известными, найдем по Iβ искомый интервал для оценки дисперсии, который накрывает точку истинное
значение |
σ2 |
с вероятностью β. Из условия P(χ2 |
< χ2 < χ2 ) = β сле- |
||||||||||
|
|
|
|
x |
|
|
|
|
|
|
|
2 |
1 |
дует, что |
1 |
|
(n − 1)S2 < χ2 |
и |
1 |
(n − 1)S2 > χ2 |
. Это означает, что |
||||||
|
|
|
|
||||||||||
|
|
|
|
σ2x |
|
1 |
|
2 |
|
|
|||
|
|
|
|
|
|
|
σ2x |
|
|
||||
|
1 |
(n − 1)S2 < σ2 < |
1 |
(n − 1)S 2. |
Таким образом, |
получен довери- |
|||||||
|
|
χ2 |
|||||||||||
|
χ2 |
|
|
|
x |
|
|
|
|
|
|
||
1 |
|
|
|
|
|
2 |
|
|
|
|
|
|
тельный интервал для оценки дисперсии, внутри которого лежит истинное значение дисперсии с заданной доверительной вероятностью, т.е.
|
1 |
(n − 1)S2 |
|
1 |
(n − 1)S 2 |
|
|
|
|
P |
|
< Dx < |
|
|
= β. |
(13.3) |
|||
χ2 |
χ2 |
||||||||
|
|
|
|
|
|
|
|||
|
1 |
|
|
2 |
|
|
|
|
Пример. По данным выборки объема n = 20 из генеральной нормально распределенной совокупности найдена исправленная выбо-
рочная дисперсия s2 = 6,6. Найти доверительный интервал, по-
крывающий генеральную дисперсию с доверительной вероятностью β = 0,8.
Число степеней свободы k = n − 1 = 19. Для нахождения критических точек χ12 и χ22 с помощью программы Excel нужно восполь-
116
зоваться функцией ХИ2ОБР (Вставка → Функция → Мастер
функций → Статистические → ХИ2ОБР).
Критические точки для двустронней критической области находятся, если задать число степеней свободы и значения α2 = 0,1
и 1− α2 = 0,9. Тогда получим χ12 = 27, 2 и χ22 = 11,65.
Рис. 13.3
Проведя простые расчеты, получим 0,045 < Dx < 0,104.
Приближенное определение доверительных интервалов
В основе подхода к приближенному определению доверительных интервалов лежит возможность применения предельных теорем теории вероятностей при достаточно больших объемах выборки. Например, как установлено практикой, при объеме выборки n > 20 закон распределения суммы случайных величин можно считать нормальным. Рассмотрим несколько примеров приближенного определения доверительных интервалов.
Пример построения доверительного интервала для математического ожидания и дисперсии.
117
Пусть имеется выборка x1,..., xn , причем математическое ожидание и дисперсия неизвестны. Для них получены оценки
x* = |
1 n |
xi , (s *)2 = |
1 |
n |
(xi − x* )2. |
|
|||||
|
n i=1 |
|
n − 1 i=1 |
|
1. Доверительный интервал для математического ожидания.
Построим доверительный интервал Iβ для математического ожидания при заданной доверительной вероятности β . Воспользу-
емся тем, что X * пропорциональна сумме независимых случайных величин. Тогда, согласно предельной теореме, закон распределения суммы можно считать нормальным при n → ∞. Предположим, что и
при конкретном, конечном n сумма n Xi будет подчинена нор-
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
мальному |
|
закону распределения. |
Следовательно, оценка |
||||||||||
|
|
* = 1 n |
Xi |
также будет подчинена нормальному закону с мате- |
|||||||||
X |
|||||||||||||
|
|
n i=1 |
|
|
|
|
|
|
|
|
|
|
|
матическим ожиданием mx и дисперсией |
Dx = |
Dx |
. Предположим, |
||||||||||
|
|||||||||||||
что Dx известна, и найдем такую величину |
|
n |
|||||||||||
, для которой будет |
|||||||||||||
|
|
|
* − mx |
|
< |
) = β. |
Так как закон рас- |
||||||
выполняться неравенство P( |
X |
|
пределения оценки X * – нормальный, то эту вероятность можно выразить через функцию Лапласа (см. (7.7)), т.е.
|
( |
|
|
|
|
|
|
) |
|
|
|
|
|
|
|
|
|
|
D |
|
P |
X * − m |
x |
|
< |
= Φ |
|
|
|
, |
где |
σ |
x |
= |
. |
||||||
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
σx |
2 |
|
|
|
|
|
|
x |
|
||||
|
|
= Φ−1(β) |
|
|
|
|
|
|
D |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Тогда |
|
|
2σx , причем |
σx = |
|
x |
определяется тоже |
|||||||||||||
|
|
|
n |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
по данным выборки.
Таким образом, доверительный интервал для математического ожидания есть: Iβ = (X * − , X * + ), где величина затабулирована
в таблицах или находится численно. Φ−1(β) 2.
118
2. Доверительный интервал для дисперсии.
|
|
|
|
|
|
1 |
n |
||
Оценка дисперсии |
S 2 = |
|
|
|
* )2 представляет собой |
||||
|
(Xi − X |
||||||||
|
|
||||||||
|
|
|
|
|
n − 1 i=1 |
||||
|
(X |
|
|
|
* )2 |
|
|
|
|
сумму величин вида |
i |
− X |
. Эти величины не являются неза- |
||||||
|
n − 1 |
|
|||||||
|
|
|
|
|
|
|
висимыми, так как в любую из них входит оценка математического ожидания X *. Однако при достаточно большом n закон распреде-
ления суммы приближается к нормальному. Предположим, что это так, и найдем характеристики этого закона. Так как оценка исправленной выборочной дисперсии является несмещенной, то выполня-
ется соотношение M[S2 ] = Dx . Можно показать, что
D[S2 ] = |
1 |
μ |
|
− |
n − 3 |
D2 |
, |
(13.4) |
n |
|
n(n − 1) |
||||||
|
|
4 |
|
x |
|
|
+∞
где μ4 = (x − mx )4 f (x)dx – четвертый момент случайной величи-
−∞
ны X.
Заменим в выражении (13.4) истинные значения |
Dx |
и μ4 их |
||||||||||||||||||
оценками, полученными по конечной выборке объема n: |
|
|
||||||||||||||||||
S |
2 = |
1 |
|
n |
|
|
|
|
|
|
|
|
* )2 ; |
|
|
|
|
|||
(Xi − X |
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|||||||||||||||
|
|
n − 1 i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
( Xi |
|
|
|
* )4 |
|
|
|
|
|
||||||||
|
|
− X |
|
|
|
|
||||||||||||||
|
μ*4 = |
i=1 |
|
|
|
|
|
|
|
|
. |
|
|
|
|
|||||
|
|
|
n |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Можно показать, что |
D[S2 ] = |
|
2 |
|
|
S2 |
, откуда σD = S |
2 |
. |
|||||||||||
n |
− 1 |
n − 1 |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Затем доверительный интервал Iβ = (S 2 − |
, S 2 + ) |
строится так |
||||||||||||||||||
же, как для математического ожидания, где |
= Φ−1(β) |
2σD . |
|
119
Лекция 14. СТАТИСТИЧЕСКАЯ ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Статистическая гипотеза – это предположение относительно вида закона распределения или величины неизвестных параметров известного закона распределения.
Выдвинутая гипотеза называется нулевой и обозначается H0 .
Наряду с этой гипотезой рассматривают конкурирующую или альтернативную ей гипотезу H1 . Например, проверяется на нормаль-
ность закон распределения случайной величины X. Тогда математическая запись такова:
H0 − случайная величина X распределена по нормальному
закону;
H1 − случайная величина X распределена не по нормальному за-
кону.
Если исследуются параметры известного распределения, то в этом случае постановка задачи может выглядеть, например, так:
H0: M[X ] = 1 (математическое ожидание случайной величины X равно 1);
H1: M[X ] ≠ 1 (математическое ожидание случайной величины
X не равно 1).
Целью статистической проверки статистических гипотез является установления факта: не противоречит ли выдвинутая гипотеза,
имеющимся выборочным данным x1,..., xn .
Статистическая проверка гипотез – это процедура обосно-
ванного сопоставления (с помощью того или иного критерия) высказанной гипотезы H0 и экспериментальных выборочных данных.
При проверке выдвинутой гипотезы возможны ошибки двух видов:
первого рода – непринятие верной статистической гипотезы. второго рода – принятие неверной статистической гипотезы. Для наглядности в табл. 14.1 показаны введенные выше опреде-
ления ошибок при проверки гипотез.
120