Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4сем / Лекции _4_сем pdf / ТВ_и_МС

.pdf
Скачиваний:
40
Добавлен:
23.02.2015
Размер:
1.72 Mб
Скачать

Статистические оценки параметров распределения

103

A =

2 ln L

 

 

 

, B

=

2 ln L

, C =

 

2 ln L

 

.

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

xy

 

 

 

 

y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

Пример:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Случайная величина

 

 

X

распределена по нормальному закону с плотностью

 

 

 

f (x)

 

 

 

 

 

1

 

 

 

e

(xa)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

распределения

=

 

 

 

 

 

 

2σ 2

 

и неизвестными параметрами a и σ . Ме-

σ

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1 ,x2 ,...,xn

 

 

 

 

 

 

 

тодом максимального правдоподобия по выборке

оценить значение

этих параметров.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Составим логарифмическую функцию правдоподобия:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

e

(x1 a)2

 

 

1

 

 

 

e

(x2 a)2

 

 

 

 

1

 

 

e

(xn a)2

ln L (x1 ,x2 ,...,xn ;a,σ )=ln

 

 

 

 

2σ 2

 

 

 

 

 

 

2σ 2 ...

 

 

 

 

2σ 2

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ 2π

 

 

 

σ

 

2π

 

 

 

 

 

 

 

 

 

 

σ

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

(xi a)2

 

 

 

 

 

n

ln (

2π )

1

 

 

(xi a)

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

=ln

 

 

 

 

 

 

e

 

2σ

 

 

 

 

 

= −n lnσ

 

 

 

 

 

 

 

.

 

n

(

2π )

n

 

 

 

 

 

2

 

2σ

2

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Уравнения правдоподобия:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ln L

=

xi

na

= 0 ,

 

 

ln L

 

 

 

 

 

n

 

 

(xi a)2

 

 

 

 

 

 

 

a

 

 

 

σ

2

 

 

 

 

 

 

 

 

= −

 

 

 

+

 

 

 

 

σ3

 

 

= 0 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

σ

 

 

 

 

 

 

 

 

 

их решение (критическая точка): a =

(xi )

=

 

 

, σ

2 =

(xi

a)2

= D .

 

 

x

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка выполнения достаточных условий экстремума показывает, что при этих значениях действительно достигается максимум функции правдоподобия.

10.1. Интервальные оценки

При получении точечной оценки необходимо знать лишь выражение для оценки Θ* (X1 ,X 2 ,...,X n ) как функцию данных выборки, а для получения интервальной оценки необходимо также знать закон распределения Θ* (X1 ,X 2 ,...,X n ), с помощью которого рассчитывается вероятность, вид ге-

нерального распределения и значение параметров распределения, которые и подлежат оценке.

Первое затруднение преодолевается тем, что иногда вид генерального распределения может постулироваться (нормальное распределение, равномерное распределение и т.д.). В некоторых случаях при достаточно большом объеме выборки реальную функцию распределения оценки с достаточной точностью можно заменить асимптотической (соответствующей n → ∞). В частности, из теоремы Ляпунова следует, что распределения выборочной

средней

 

=

X1 + X 2 + ...+ X n

или относительной частоты значения призна-

X B

n

 

 

 

 

104

Лекции 9 -10

ка wi = nni распределены асимптотически нормально независимо от вида ге-

нерального распределения.

Попытки разрешения второго затруднения приводят к двум способам построения интервальной оценки: приближенному и точному.

Приближенный способ состоит в замене неизвестных параметров гене-

ральной совокупности, от которых зависит распределение Θ* , на их точечные оценки, полученные в результате выборки. Далее оценка строится, как если бы параметры распределения были бы известны.

Точный способ может быть использован лишь в том случае, когда известен закон генерального распределения. При этом строятся вспомогательные случайные величины, распределение которых не зависит от неизвестных параметров генеральной совокупности, но зависит лишь от объема выборки. В частности, при оценке среднего значения нормально распределенной генеральной совокупности можно использовать оценку

 

M [X ]

 

 

 

*

X B

 

 

Θ = T =

 

 

 

 

 

 

n ,

 

n

 

D

 

 

 

 

 

 

 

n 1

 

 

 

 

 

B

 

 

которая подчиняется распределению Стьюдента, зависящему только от объема выборки n .

Синтервальной оценкой связано решение трех типов задач:

1)определение доверительной вероятности по заданному доверительному интервалу и объему выборки;

2)определение доверительного интервала по заданной доверительной вероятности и объему выборки;

3)определение необходимого объема выборки по заданным доверительной вероятности и доверительному интервалу.

10.2.Интервальная оценка математического ожидания нормально распределенной случайной величины

при известном σ.

Пусть случайная величина Х генеральной совокупности распределена по

 

 

 

1

e

( xa )2

нормальному закону

f ( x ) =

 

2σ2 , где σ = D[Х], a = M [Х] =

 

,

 

X

σ

2π

 

 

 

 

 

 

при этом среднее квадратическое отклонение σ считаем известным.

Пусть сделана выборка объема n и вычислена X B , которая является точечной оценкой математического ожидания a генеральной совокупности.

Статистические оценки параметров распределения

105

Так как

 

=

X1 + X 2 + ...+ X n

– среднее арифметическое случайных величин

X B

n

 

 

 

 

 

X1 ,X2 ,...,Xn , распределенных так же, как и признак генеральной совокупно-

сти X, то закон распределения

 

 

 

также нормален, M [X B ]= M [X ]= a , а

X B

дисперсия случайной величины

 

 

в n раз меньше дисперсии случайной

 

X B

величины X: σ2

 

 

 

= σ2 .

 

 

 

 

X

 

 

 

 

 

 

B

n

 

 

 

 

1). Определим, с какой надежностью математическое ожидание а покры-

вается

доверительным интервалом

 

при заданной точности ε, т.е. найдем

P (

 

 

a

 

< ε ) или P (

 

ε < a <

 

 

 

+ε).

 

 

 

 

 

 

 

X B

 

X B

X B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

ε n

 

 

 

ε n

 

Тогда,

P (

Хв a

< ε )= 2Ф

 

= 2Ф

 

= 2Ф(t )= γ , где

t =

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ (Хв )

 

 

σ

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Ф(t) – функция Лапласа. Зная σ, ε и n, можно найти по таблице значений функции Лапласа надежность γ оценки X B математического ожидания a.

2). По выборочному значению математического ожидания X B и извест-

ному σ найти доверительный интервал, который с заданной надежностью γ покрывает математическое ожидание а генеральной совокупности. Это и есть

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

задача получения интервальной оценки

 

X B .

Используя таблицы значений

функции Лапласа, по γ определяют t =

ε

 

n

, отсюда ε =

tσ

 

. Таким образом

 

 

 

n

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tσ

 

 

 

 

 

 

tσ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

получают искомый доверительный интервал

X B

 

,X B

+

 

, с надеж-

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

ностью γ

покрывающий неизвестный параметр а; точность оценки ε =

tσ

.

 

 

 

 

 

 

 

 

 

 

 

 

 

n

3).

 

По заданным σ, ε и γ, используя соотношение

 

ε

n

=

γ , найти

 

2Ф

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

объем выборки n. Решая уравнение 2Ф(t)=γ , по γ находим t ,

а затем из

t =

ε

n

 

 

tσ 2

 

 

 

 

 

 

 

σ

находим минимальный объем выборки n =

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

Пример:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Измерение массы 50 случайно отобранных после изготовления деталей дало

 

 

 

 

X B*

= 10 г. Есть основания полагать, что

генеральная

дисперсия

σ2 = 0,09.

Решение:

1) Определить с вероятностью P = 0,95 доверительные границы для средней

106

Лекции 9 -10

массы деталей X во всей партии. На основании теоремы Ляпунова можно исходить из предположения о нормальном распределении массы деталей.

Дано: n = 50,

 

X B*

= 10 г,

σ2 = 0,09 и P =

0,95.

Из равенства

P = 2Ф(t )= 0,95

по таблицам функции Лапласа находим t

= 1,96, откуда

ε =

tσ

= 1,96 0,3

= 0,083. Таким

образом, получаем,

что с

вероятностью

n

 

50

 

 

 

 

 

 

0,95 средняя масса содержится в промежутке [9,917; 10,083].

2) Определить при тех же условиях, с какой доверительной вероятностью можно гарантировать ошибку выборки, не превышающую 0,05. По величине

ε = 0,05 вычисляем t =

ε

n =

0,05 50

=1,1785 . По таблицам функ-

 

σ

 

0,3

 

ции Лапласа P = 2Ф(1,1785)0,76 .

3) Определить объем выборки, при котором указанная предельная ошибка ε = 0,05 гарантируется с вероятностью P = 0,95. Из P = 0,95 находим t =

tσ 2

1,96 0,3

2

140 .

1,96, откуда n =

ε

 

=

0,05

 

138,2976

 

 

 

 

 

 

10.3. Интервальная оценка математического ожидания нормально распределенной случайной величины при неизвестном σ.

Для решения поставленной в заголовке задачи используется закон рас-

пределения

случайной

величины

T={t},

t =

 

Х

в

a

,

где

s /

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

1

n

 

 

 

 

 

 

 

 

 

 

 

 

sв =

(xi

 

в )2 несмещенная оценка среднего квадратичного откло-

Х

 

 

n 1 i=1

 

 

 

 

 

 

 

 

 

 

 

 

нения.

Стьюдент (псевдоним английского математика Госсета) показал, что закон распределения случайной величины T (плотность вероятности) описыва-

 

n

 

 

 

 

 

 

n

 

Г

 

 

 

 

2

 

 

 

 

1 +

t

 

2 .

ется выражением fn (t ) =

 

2

 

 

 

 

n 1

 

n 1

 

 

 

 

 

 

π( n 1

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

Здесь Г( x ) = tx 1etdt - гамма–функция Эйлера. Это распределение на-

0

зывается распределением Стьюдента. График fn (t ) похож на график плотности вероятности нормального закона, но fn ( t ) определяется только объемом

Статистические оценки параметров распределения

107

выборки n и не зависит от неизвестных па-

 

 

 

 

 

 

 

1

t2

 

 

раметров а и σ lim fn (t )=

e2

. Оче-

 

2π

 

 

 

 

 

n→∞

 

 

 

 

 

 

 

 

 

 

 

 

 

видно, что P (

 

t

 

< tγ )= tγ

fn ( t )dt = γ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tγ

 

 

 

 

 

Функция fn ( t )

 

четная, поэтому можно за-

 

tγ

 

 

 

 

 

 

 

писать γ = 2fn ( t )dt . Это равенство по-

0

зволяет найти tγ по заданным n и γ. Во всех книгах по математической статистике имеются таблицы, по которым можно найти tγ , зная n и γ. Учитывая,

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

Х

в

 

 

 

 

 

Хв

 

 

 

 

что

 

t =

 

,

можно записать

P (

t

< tγ )= P

 

 

< tγ

 

= γ , или

 

s /

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

в

/

n

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

Хв a

<

 

γ

в

 

 

= γ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, определив tγ по таблице Стьюдента, можно найти дове-

рительный интервал, покрывающий c надежностью γ математическое ожидание а генеральной совокупности.

Итак, по имеющейся выборке x1 ,x2 ,...,xn находим Хв и sв . Затем, зада-

ваясь надежностью γ, определяем доверительный интервал, покрывающий математическое ожидание а. Другими словами, находим интервальную оценку математического ожидания.

Пример:

Случайная величина Х имеет нормальное распределение. С надежностью γ = 0,95 найти доверительный интервал для оценки неизвестного математиче-

ского ожидания a, если при объеме выборки n=36 получено Хв =24, s = 3. Решение. По таблицам распределения Стьюдента при n = 36 и γ = 0,95 нахо-

дим tγ = 2,03. Тогда точность оценки tγns = 2,0336 3 =1,015 .

Доверительный интервал для a (Хв 1,015; Хв +1,015)= (22,985;25,015).

!Так как при n→∞ распределение Стьюдента стремится к нормальному, то практически при n > 30 можно пользоваться вместо распределения Стьюдента нормальным распределением.

108

Лекции 9 -10

10.4.Интервальная оценка среднего квадратического отклонения σ нормального распределения

Пусть случайная величина Х распределена нормально и требуется оценить неизвестное генеральное среднее квадратическое отклонение (с.к.о.) σ по исправленному выборочному с.к.о. s . Как было показано при рассмотрении точечных оценок, выборочное с.к.о. служит точечной оценкой параметра σ . Поставим теперь вопрос об интервальной оценке σ , т.е., о построении доверительного интервала, покрывающего параметр σ с заданной надежностью γ .

При рассмотрении распределений, связанных с нормальным, обсуждалось распределение χ2 (Пирсона). Рассматривая выборку как совокупность случайных величин X1 ,X 2 ,...,X n , распределенных так же, как и признак гене-

ральной совокупности X, заметим, что величины Xi X B являются центри-

рованными M (Xi

 

)= 0 , а

Xi

X B

 

– стандартными ( m = 0 , σ =1). Сум-

X B

σ

 

 

 

 

 

 

ма квадратов этих величин пропорциональна исправленной выборочной дис-

 

1

n

 

 

 

 

 

 

 

 

 

персии, s2 =

(Xi

 

)2 , и распределена по закону χ2 . Поскольку эти

X B

 

 

n 1 i=1

 

 

 

 

 

 

 

X1 + X 2 + ...+ X n

 

величины связаны еще одной зависимостью,

 

=

, то число

X B

 

 

 

 

s2

(n 1)

 

 

 

n

степеней свободы –,

= χ2 равно n 1. Формула для плотности этого

 

σ2

 

 

 

 

 

 

 

 

 

распределения и примерный вид графиков приведены в соответствующем параграфе (распределения, связанные с нормальным).

Рассмотрим симметричный доверительный интервал

 

 

 

 

 

 

 

 

P (s δ < σ < s +δ ) = γ

 

 

 

 

и преобразуем двойное неравенство (учитывая, что σ > 0 ):

 

 

 

 

 

 

 

 

 

 

 

1 δ < σ <1 +

δ ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

s

 

 

s

 

 

 

 

обозначив

δ = q , получим

 

1 q <

σ

<1 + q , что дает

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

при q <1 : 1 q <

σ <1 + q ,

1

 

<

 

s

<

1

 

,

 

n 1

<

s

n 1

<

n 1

;

1+ q

σ

1q

 

 

σ

1q

 

0 < σ

s

 

 

 

 

 

1+ q

 

 

при q 1:

<1 + q (так как σ и s

положительны),

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

<

s

 

< ∞,

 

n 1

<

s n 1

< ∞.

 

 

 

 

 

1 + q

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

1+ q

 

 

σ

 

 

 

 

Статистические оценки параметров распределения

109

 

 

 

 

 

 

Величину

s

n 1

естественно обозначить через χ =

χ2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда полученные ранее неравенства можно записать в виде

 

 

 

 

 

χ

 

< χ < χ

 

( q <1 ) или χ

 

< χ < ∞ ( q 1), где χ =

 

n 1

, χ

 

=

n 1

.

1

2

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1+ q

1

q

Плотность распределения величины χ имеет вид:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xn2e

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f (x,n)=

 

2

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n3

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

Γ

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

не зависит от оцениваемого параметра σ , но зависит от объема выборки n . Ниже приведены графики плотности этой величины для нескольких значений объема выборки n .

Исходное условие для доверительного интервала принимает вид:

n1

1q

f (x,n)dx =γ .

n1

1+q

Решения этого уравнения q = q (n,γ ), также как и квантили нормально-

го и связанных с ним распределений можно найти в статистических таблицах и найти ширину симметричного доверительного интервала.

P (s δ<σ < s +δ+ )= γ ,

110

Лекции 9 -10

Так как более доступны таблицы квантилей распределения χ2 , изложим еще один способ построения доверительного интервала, покрывающего генеральное с.к.о. σ с заданной доверительной вероятностью. Запишем его в виде:

где границы s δ

и s +δ+

пока не определены. Неравенства для σ

могут

быть преобразованы в неравенства для χ2 =

s2

(n 1)

: P (χ2

< χ2 < χ2

+ )= γ

 

σ

2

 

 

 

 

 

 

 

 

 

 

 

 

)= 1 γ = α ,

и величины χ2

и

χ2

+

определяются из условий:

P (χ2

χ2

P (χ2 χ2

+ )= α ,

 

 

 

 

 

 

 

 

 

 

2

 

P (χ2

χ2

+ )=1 α , т.е. являются квантилями распределе-

ния χ2 уровня α и уровня 1α , соответственно.

! Часто в таблицах приводятся не квантили qp ( P (X < qp )= p ) , а кри-

тические точки распределений kp ( P (X > kp )= p ). Неравенства пре-

дыдущего раздела с использованием критических точек будут выглядеть так:

P (χ2кр() < χ2 < χ2кр(+) )= γ ,

P (χ2 > χ2кр(+) )= 12γ =α ,

P (χ2 > χ2кр() )=1 α .

Пример:

Известно,

что с.в. Х распределена нормально. По выборке объема n = 25

найдено исправленное выборочное с.к.о.

s = 0,8 . Найти доверительный ин-

тервал, покрывающий генеральное с.к.о. с надежностью 0,95.

Решение:

 

q = q (n,γ ) и данным n = 25

и γ = 0,95 находим

1). Способ. По таблице

q = 0,32 .

Искомый

доверительный

интервал

(симметричный):

s (1q)<σ < s (1+ q), 0,8(10,32q)<σ < 0,8(1+0,32) или 0,544 <σ <1,056 . 2). Способ. По γ = 0,95 находим α = 0,025 и критические точки для n = 25 :

 

χ2кр() =13,12 ,

χ2кр(+) = 40,65

и интервал (несимметричный) для σ :

 

 

s n 1

<σ <

s

n 1

,

0,625 <σ <1,113 .

 

 

 

 

 

χ2

χ2

 

 

кр(+)

кр()

 

Заметим, что оба полученных доверительных интервала с вероятностью 0,95 покрывают неизвестное генеральное с.к.о. σ ; второй интервал, несиммет-

ричный относительно s , несколько уже: 1,056 - 0,544 = 0,512; 1,113 - 0,625 = 0,488.

Лекции 11–12 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

11.1.Статистическая гипотеза. Параметрическая и непараметрическая, нулевая и конкурирующая, простая и сложная гипотезы

11.2.Ошибки первого и второго рода

11.3.Статистический критерий. Критическая область. Область принятия гипотезы. Критические точки

11.4.Уровень значимости и мощность критерия

11.5.Виды критических областей

11.6.Методика проверки гипотез

12.1.Некоторые типичные задачи проверки параметрических гипотез

12.1.1Проверка гипотез о доле признака

12.1.2Проверка гипотез о среднем значении

12.1.3Сравнение дисперсий двух совокупностей

12.1.4Сравнение исправленной выборочной дисперсии

с гипотетической генеральной дисперсией нормальной совокупности

12.2.Непараметрические гипотезы. Критерии согласия Пирсона и Колмогорова 12.2.1 Критерий Пирсона 12.2.2. Критерий Колмогорова

11.1.Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотезы

Задача проверки гипотезы в известном смысле напоминает задачу оценки параметров генеральной совокупности по данным выборки: высказывается некоторое утверждение и на основании данных выборки выносится суждение о справедливости этого утверждения.

Важно отметить, что вопрос должен подлежать рассмотрению методами теории вероятностей. Приведем пример, заимствованный из книги Я.И. Хургина: герой известной книги О. Бендер узнает о существовании в городе Черноморске подпольного миллионера (А.И. Корейко). Он может принять эту гипотезу (и начать преследовать предполагаемого миллионера), может отвергнуть гипотезу (и заняться чем-либо другим), но не может повторить обстоятельства, в которых он получил это известие: даже если он получит аналогичное сообщение от другого собеседника, уровень его информированности будет уже иным. Событие «Корейко – миллионер», несомненно, является

112

Лекции 11–12

неопределенным для Остапа Ибрагимовича к моменту начала его эскапады, но не является случайным (в смысле, вкладываемом в это понятие в рамках теории вероятности). Гипотеза, принятая О. Бендером («Корейко – миллионер») не является статистической и не подпадает под действие рассматриваемых далее методов.

Статистические гипотезы утверждают что-либо о статистически устойчи-

вых событиях (события, которые могут протекать многократно при идентичных условиях). Как правило, речь идет о виде функции распределения случайной величины или о параметрах, характеризующих эту функцию распределения.

Примеры статистических гипотез:

1)генеральная совокупность распределена по нормальному закону;

2)дисперсии двух нормальных распределений равны;

3) дисперсия признака, распределенного в генеральной совокупности

0 < D < 2.

Введем некоторые определения.

О Если в гипотезе утверждается что-то о значении какого-то параметра, гипотеза называется параметрической. Если гипотеза предполагает что-то, количественно не измеряемое (например, «признак имеет нормальное

распределение»), гипотеза называется непараметрической.

ООсновной (нулевой) гипотезой H0 называют выдвинутую гипотезу.

ОАльтернативной (конкурирующей) гипотезой H1 называют гипотезу, которая противоречит выдвинутой.

ОГипотеза называется простой, если ответ на нее однозначен («признак распределен нормально», «дисперсия распределения равна 2», «распре-

деления двух совокупностей одинаковы», и т.п.). Если ответ неоднозначен, гипотеза называется сложной («признак не распределен нормально», «дисперсия распределения не равна 2», «дисперсия распределения больше 2», «распределения двух совокупностей не одинаковы», и т.п.). Утверждение «дисперсия распределения больше 2» сводится к бесконечному количеству утверждений: «дисперсия распределения равна 2,1», «дисперсия распределения равна 2,2», и т.д.

11.2. Ошибки первого и второго рода

Выдвинутая гипотеза может быть правильной или не правильной, поэтому ее необходимо проверить по эмпирическим данным, т. е. по выборке. Поскольку содержимое выборки случайно, то и высказывания, сделанные на основании исследования выборки, случайны, т.е., они могут быть и правильны, и неправильны. В итоге проверки гипотезы могут быть приняты неверные решения в двух случаях, т.е. могут быть допущены ошибки двух типов. О Ошибкой первого рода называют ошибку, допускаемую в случае, когда

Соседние файлы в папке Лекции _4_сем pdf