Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Загребаев Лектсии по теории вероятностеы и математическоы статистике 2015

.pdf
Скачиваний:
6
Добавлен:
12.11.2022
Размер:
4.61 Mб
Скачать

Рис. 12.2. Распределение Стьюдента при различном объеме выборки

При этом M[T ] = 0 и D[T ] = n n 2 при n > 2.

Распределение Пирсона

Рассмотрим n нормально распределенных величин X1,..., Xn c нулевым математическим ожиданием и единичной дисперсией:

M[X1] = ... = M[Xn ] = 0; D[X1] = ... = D[Xn ] = 1

 

и функцию от них:

 

χ2 = X12 + ... + Xn2.

(12.14)

Плотность распределения случайной величины χ2 носит назва-

ние «распределение Пирсона» или « χ2-распределение». На

рис. 12.3. показано распределение Пирсона для различного объема выборки n. Можно показать, что при n → ∞ распределение асимп-

тотически нормальное с центром в точке χ2 = n и дисперсией 2n.

 

Легко

показать,

что исправленная выборочная

дисперсия

 

 

n

n

(X

 

 

 

)2

 

 

 

 

 

X

 

 

 

 

S 2

=

 

 

 

 

i n

в

связана с величиной χ2 соотношением

n 1

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ2 =

S2 (n 1)

.

(12.15)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2x

 

 

 

 

 

 

 

 

 

 

 

111

 

 

Рис. 12.3. Распределение Пирсона

Лекция 13. ПОСТРОЕНИЕ ИНТЕРВАЛЬНЫХ ОЦЕНОК

Доверительный интервал для математического ожидания и дисперсии

Существует два подхода к построению доверительных интервалов при нахождении оценок параметров. Первый из них приводит к построению «точных» доверительных интервалов и основан на переходе от закона распределения оценки θ*, которая зависит от самого неизвестного параметра θ, к какой-нибудь другой функции от наблюдаемых величин X1,..., Xn , которая уже не зависит от неиз-

вестных параметров. Второй способ – приближенный. Продемонстрируем применение этих подходов на следующих примерах.

Пусть получена выборка x1,..., xn из нормальной генеральной совокупности с неизвестными параметрами mx и Dx . По этим дан-

 

n

 

n

 

 

xi2

и s2 =

(xi xв)2

 

ным получены оценки параметров x =

i=1

i=1

.

 

 

в

n

 

n 1

 

 

 

 

Требуется построить доверительный интервал для оценок этих параметров.

112

Доверительный интервал для математического ожидания

В соответствии с постановкой задачи необходимо найти такое , чтобы выполнялось соотношение P( Xв mx < ) = β, то есть найти

такой доверительный интервал около среднего выборочного, который с заданной вероятностью β «накрывал» бы истинное значение

математического ожидания.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в mx

 

 

Домножим неравенство

X

<

на положительную величину

 

 

 

 

 

n

, тогда получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

в

mx

 

<

 

n .

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2

 

 

 

 

 

 

 

 

 

 

 

S2

 

 

 

 

 

 

 

 

в mx )

,

 

 

 

 

 

n .

Обозначив T =

n(X

получим

 

T

 

<

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, исходная постановка задачи трансформировалась в следующую:

Найти такое , чтобы с заданной вероятностью β выполнялось неравенство T < tβ , где

t =

n . То есть выполнялось равенство P(

 

T

 

< t ) = β.

 

 

β

S2

 

 

 

β

 

 

 

 

 

В этом соотношении T – статистика, подчиненная закону Стъюдента, то есть случайная величина с известной плотностью распределения f (t). С учетом четности функции плотности рас-

пределения f (t), условие P( T < tβ ) = β равносильно

tβ

β = 2 f (t)dt.

0

По таблице зависимости tβ от числа степеней свободы k = n 1

изаданной вероятности β находим tβ , а затем

=tβ sn2 .

113

Пример. Пусть произведено пять независимых опытов со случайной величиной X, распределенной нормально с неизвестными па-

раметрами mx и σx , результаты опытов указаны в табл. 13.1.

Таблица 13.1

x1

x2

x3

x4

x5

2,5

3,4

2,0

1,0

2,1

 

 

 

 

 

Найти оценку математического ожидания и построить вокруг него 90 % доверительный интервал, т.е. доверительный интервал, соответствующий вероятности β = 0,9.

m* =

n

xi

 

 

s2 =

1

 

n (xi m* )2 = 6, 445.

i=1

 

= 0,4,

 

n

 

 

 

 

 

 

 

 

n 1 i=1

 

 

 

 

Таблица 13.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число степеней

 

Доверительная вероятность

 

 

свободы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,1

 

 

0,2

 

 

0,9

 

 

0,999

1

 

 

 

 

 

 

 

6,31

 

 

…..

2

 

 

 

….

 

 

….

 

….

 

2,92

 

 

 

3

 

 

 

 

 

 

 

2,35

 

 

4

 

 

 

0,134

 

0,217

 

 

 

 

 

 

 

 

8,61

 

 

 

 

2,13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,645

 

 

 

Число степеней свободы

k = n 1 = 4.

По табл. 13.2

для дан-

ного числа степеней свободы и доверительной вероятности оп-

ределяем

tβ = 2,13 и величину

= t

s2

= 2,42, следовательно,

 

β

n

 

 

 

истинное значение математического ожидания с вероятностью 90 % находится в интервале

(–2,02; 2,82) рис. 13.1.

114

Доверительный интервал для дисперсии

Несмещенной оценкой дисперсии является величина

 

1

n

1

 

S 2 =

 

 

в)2. Известно, что величина

(n 1)S2 = χ2

(Xi X

 

 

 

n 1 i=1

σ2x

подчинена закону χ2 .

Рис. 13.2. Расположение доверительного интервала

На рис. 13.2 показана функция плотности распределения с указанием расположения интервала Iβ . Интервал Iβ можно выбрать

так, чтобы вероятность уклонения случайной величины χ2 влево и вправо за интервал была одинаковой и равна величине α2 = 12β ,

где β – доверительная вероятность. Действительно, так как функция плотности распределения f (χ2 ) при заданном числе степеней свободы k = n 1 известна, то вероятность того, что случайная величи-

на χ2 выйдет за правую границу интервала χ2

есть площадь под

кривой

 

1

 

 

 

 

+∞

f (χ2 )dχ2 =

α .

 

 

(13.1)

χ2

 

2

 

1

 

 

 

115

Вероятность того, что случайная величина χ2 будет правее точ-

ки χ22 , есть площадь под кривой правее точки χ22. Эту площадь

можно определить следующим образом. Из всей площади под кривой (которая равна 1) вычесть площадь под кривой между точками

0 и χ22 , которая равна

α . То есть 1α . Таким образом, левая гра-

 

2

2

 

ница интервала Iβ находится из решения уравнения

 

 

+∞

f (χ2 )dχ2 = 1α .

 

 

 

(13.2)

 

χ22

2

 

 

 

 

Решение уравнений (13.1) и (13.2) возможно либо численно, либо уже затабулировано в соответствующих таблицах.

Теперь, считая χ12 и χ22 известными, найдем по Iβ искомый интервал для оценки дисперсии, который накрывает точку истинное

значение

σ2

с вероятностью β. Из условия P(χ2

< χ2 < χ2 ) = β сле-

 

 

 

 

x

 

 

 

 

 

 

 

2

1

дует, что

1

 

(n 1)S2 < χ2

и

1

(n 1)S2 > χ2

. Это означает, что

 

 

 

 

 

 

 

 

σ2x

 

1

 

2

 

 

 

 

 

 

 

 

 

σ2x

 

 

 

1

(n 1)S2 < σ2 <

1

(n 1)S 2.

Таким образом,

получен довери-

 

 

χ2

 

χ2

 

 

 

x

 

 

 

 

 

 

1

 

 

 

 

 

2

 

 

 

 

 

 

тельный интервал для оценки дисперсии, внутри которого лежит истинное значение дисперсии с заданной доверительной вероятностью, т.е.

 

1

(n 1)S2

 

1

(n 1)S 2

 

 

 

P

 

< Dx <

 

 

= β.

(13.3)

χ2

χ2

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

Пример. По данным выборки объема n = 20 из генеральной нормально распределенной совокупности найдена исправленная выбо-

рочная дисперсия s2 = 6,6. Найти доверительный интервал, по-

крывающий генеральную дисперсию с доверительной вероятностью β = 0,8.

Число степеней свободы k = n 1 = 19. Для нахождения критических точек χ12 и χ22 с помощью программы Excel нужно восполь-

116

зоваться функцией ХИ2ОБР (Вставка → Функция → Мастер

функций → Статистические → ХИ2ОБР).

Критические точки для двустронней критической области находятся, если задать число степеней свободы и значения α2 = 0,1

и 1α2 = 0,9. Тогда получим χ12 = 27, 2 и χ22 = 11,65.

Рис. 13.3

Проведя простые расчеты, получим 0,045 < Dx < 0,104.

Приближенное определение доверительных интервалов

В основе подхода к приближенному определению доверительных интервалов лежит возможность применения предельных теорем теории вероятностей при достаточно больших объемах выборки. Например, как установлено практикой, при объеме выборки n > 20 закон распределения суммы случайных величин можно считать нормальным. Рассмотрим несколько примеров приближенного определения доверительных интервалов.

Пример построения доверительного интервала для математического ожидания и дисперсии.

117

Пусть имеется выборка x1,..., xn , причем математическое ожидание и дисперсия неизвестны. Для них получены оценки

x* =

1 n

xi , (s *)2 =

1

n

(xi x* )2.

 

 

n i=1

 

n 1 i=1

 

1. Доверительный интервал для математического ожидания.

Построим доверительный интервал Iβ для математического ожидания при заданной доверительной вероятности β . Воспользу-

емся тем, что X * пропорциональна сумме независимых случайных величин. Тогда, согласно предельной теореме, закон распределения суммы можно считать нормальным при n → ∞. Предположим, что и

при конкретном, конечном n сумма n Xi будет подчинена нор-

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

мальному

 

закону распределения.

Следовательно, оценка

 

 

* = 1 n

Xi

также будет подчинена нормальному закону с мате-

X

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

матическим ожиданием mx и дисперсией

Dx =

Dx

. Предположим,

 

что Dx известна, и найдем такую величину

 

n

, для которой будет

 

 

 

* mx

 

<

) = β.

Так как закон рас-

выполняться неравенство P(

X

 

пределения оценки X * – нормальный, то эту вероятность можно выразить через функцию Лапласа (см. (7.7)), т.е.

 

(

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

D

 

P

X * m

x

 

<

= Φ

 

 

 

,

где

σ

x

=

.

 

 

 

 

 

 

 

 

 

 

σx

2

 

 

 

 

 

 

x

 

 

 

= Φ1(β)

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда

 

 

2σx , причем

σx =

 

x

определяется тоже

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

по данным выборки.

Таким образом, доверительный интервал для математического ожидания есть: Iβ = (X * , X * + ), где величина затабулирована

в таблицах или находится численно. Φ1(β) 2.

118

2. Доверительный интервал для дисперсии.

 

 

 

 

 

 

1

n

Оценка дисперсии

S 2 =

 

 

 

* )2 представляет собой

 

(Xi X

 

 

 

 

 

 

 

n 1 i=1

 

(X

 

 

 

* )2

 

 

 

сумму величин вида

i

X

. Эти величины не являются неза-

 

n 1

 

 

 

 

 

 

 

 

висимыми, так как в любую из них входит оценка математического ожидания X *. Однако при достаточно большом n закон распреде-

ления суммы приближается к нормальному. Предположим, что это так, и найдем характеристики этого закона. Так как оценка исправленной выборочной дисперсии является несмещенной, то выполня-

ется соотношение M[S2 ] = Dx . Можно показать, что

D[S2 ] =

1

μ

 

n 3

D2

,

(13.4)

n

 

n(n 1)

 

 

4

 

x

 

 

+∞

где μ4 = (x mx )4 f (x)dx – четвертый момент случайной величи-

−∞

ны X.

Заменим в выражении (13.4) истинные значения

Dx

и μ4 их

оценками, полученными по конечной выборке объема n:

 

 

S

2 =

1

 

n

 

 

 

 

 

 

 

 

* )2 ;

 

 

 

 

(Xi X

 

 

 

 

 

 

 

 

 

 

 

 

n 1 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( Xi

 

 

 

* )4

 

 

 

 

 

 

 

X

 

 

 

 

 

μ*4 =

i=1

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Можно показать, что

D[S2 ] =

 

2

 

 

S2

, откуда σD = S

2

.

n

1

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Затем доверительный интервал Iβ = (S 2

, S 2 + )

строится так

же, как для математического ожидания, где

= Φ1(β)

2σD .

 

119

Лекция 14. СТАТИСТИЧЕСКАЯ ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Статистическая гипотеза это предположение относительно вида закона распределения или величины неизвестных параметров известного закона распределения.

Выдвинутая гипотеза называется нулевой и обозначается H0 .

Наряду с этой гипотезой рассматривают конкурирующую или альтернативную ей гипотезу H1 . Например, проверяется на нормаль-

ность закон распределения случайной величины X. Тогда математическая запись такова:

H0 случайная величина X распределена по нормальному

закону;

H1 случайная величина X распределена не по нормальному за-

кону.

Если исследуются параметры известного распределения, то в этом случае постановка задачи может выглядеть, например, так:

H0: M[X ] = 1 (математическое ожидание случайной величины X равно 1);

H1: M[X ] 1 (математическое ожидание случайной величины

X не равно 1).

Целью статистической проверки статистических гипотез является установления факта: не противоречит ли выдвинутая гипотеза,

имеющимся выборочным данным x1,..., xn .

Статистическая проверка гипотез это процедура обосно-

ванного сопоставления (с помощью того или иного критерия) высказанной гипотезы H0 и экспериментальных выборочных данных.

При проверке выдвинутой гипотезы возможны ошибки двух видов:

первого рода – непринятие верной статистической гипотезы. второго рода принятие неверной статистической гипотезы. Для наглядности в табл. 14.1 показаны введенные выше опреде-

ления ошибок при проверки гипотез.

120

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]