Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 283

.pdf
Скачиваний:
6
Добавлен:
30.04.2022
Размер:
360.06 Кб
Скачать

1.5. Интервальные оценки параметров распределения. Доверительный интервал для математического ожидания

нормального распределения при известном s

Пусть СВ Х образует генеральную совокупность иq - неизвестный параметр СВ Х . Если статистическая оценка q * является состоятельной, то чем больше объем выборки, тем точнее получаем значение q . Однако на практике мы имеем выборки не очень большого объема, поэтому не можем гарантировать большую точность.

 

Пусть

q * -

статистическая

 

оценка

дляq . Величина

 

q * -q

 

 

называется точностью оценки. Ясно, что точность это

 

 

СВ,

т.к.

q *

-

случайная

величина.

Зададим

малое

положительное число d

и потребуем, чтобы точность оценки

 

q * -q

 

 

была меньше d ,

т.е.

 

q * -q

 

< d .

 

 

 

 

 

 

 

 

 

 

Мы не

можем

категорически

 

утверждать, что оценка q *

удовлетворяет неравенству q * -q < d ; можно лишь говорить о вероятности g , с которой это неравенство выполняется.

Надежностью g или доверительной вероятностью оценки q по q * называется вероятность g , с которой осуществляется

неравенство q * -q < d , т.е.

g = P{q * -q < d}.

Обычно надежность g задают наперед, причем за g берут число, близкое к 1 (0,9; 0,95; 0,99; …).

Так как

неравенство

q * -q

< d равносильно двойному

неравенству

q * -d £q £ q * +d , то получаем:

 

g = P{q * -d < q < q * +d}.

9

Интервал

(q * -d ,q * +d )

называется

доверительным

интервалом,

т.е. доверительный

интервал

покрывает

неизвестный

параметр q с

вероятностьюg .

Заметит, что

концы доверительного интервала являются случайными и изменяются от выборки к выборке, поэтому точнее говорить,

что

интервал

(q * -d ,q * +d )

покрывает

неизвестный

параметр q ,

а не q принадлежит этому интервалу.

 

 

 

Пусть

генеральная

совокупность

задана

случайной

величиной

Х,

распределенной

по

нормальному

закону,

причем, среднее

квадратическое

отклонение

s

неизвестно.

Неизвестным является математическое

ожиданиеa = M ( X ) .

Требуется найти доверительный интервал дляа при заданной надежности g .

Выборочная средняя

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

X1 +K+ X n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

является статистической оценкой для

 

 

 

 

= a .

 

 

 

 

 

xG

 

 

 

 

 

 

Теорема. Случайная величина

 

 

имеет нормальное

xB

распределение,

если Х имеет нормальное

 

распределение, и

M (

 

) = a , s (

 

 

) =

 

s

, где s =

D( X ) , a = M (

 

.

 

 

 

XB

XB

X )

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

a имеет вид:

 

Доверительный интервал для

 

 

 

 

 

 

 

 

 

 

 

 

 

-d < a <

 

+d

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

XB

XB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P {

 

 

 

 

 

 

 

 

< d}= g .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

XB - a

 

 

 

 

 

 

 

Находим d , пользуясь соотношением

 

 

 

 

 

 

 

 

{

 

 

 

 

 

 

 

 

}

 

 

 

 

 

 

æ d

ö

 

 

 

 

 

 

æ d

 

n ö

 

 

P

XB - a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ç

 

 

 

 

 

÷

 

 

 

 

 

 

ç

 

 

 

÷

 

 

 

 

 

 

< d

 

 

= 2F

è s B ø

= 2F ç

 

s

 

÷ ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

è

 

ø

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

где F(z) - функция Лапласа. Тогда имеем:

æ d

 

n ö

 

2

 

 

 

÷

= g .

 

s

 

ç

 

÷

 

è

 

 

ø

 

Обозначив

d n

= t , получим F(t) = g . Так как g

задана,

 

 

s

 

 

 

 

 

то по таблице

значений

функций Лапласа

находим

значение

t .

 

 

 

 

 

 

 

 

Из равенства t =

d n

находим d =

ts

-

точность оценки.

 

 

 

s

 

n

 

 

Значит, доверительный интервал для а имеет вид:

æ

 

 

s

 

 

 

s

ö

 

 

 

 

 

ç

XB -t ×

 

, XB + t ×

 

÷ .

n

 

è

 

 

 

 

 

n ø

Если задана выборка из генеральной совокупности Х

 

хi

 

 

х1

 

 

 

 

х2

 

 

 

 

 

 

хm

 

 

ni

 

 

n1

 

 

 

 

n2

 

 

 

 

 

 

nm

 

 

n = n1 +... + nm , то доверительный интервал будет:

æ

 

m

 

 

 

 

 

 

m

 

 

 

 

 

ö

 

 

 

 

 

 

ç åni × xi

 

 

 

 

s

 

åni × xi

 

 

 

 

s

÷

 

 

 

 

 

 

ç

i=1

 

- t ×

 

,

i =1

 

+ t ×

 

÷ ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

 

 

 

ç

 

n

 

 

 

 

 

 

 

 

 

 

n ÷

ç

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

÷

 

 

 

 

è

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ø

 

 

 

 

 

 

 

 

æ

 

 

 

 

s

 

 

 

 

 

 

s ö

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ç xB -t ×

 

 

< a < xB + t ×

 

 

÷ .

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

è

 

 

 

 

 

 

 

 

 

 

n ø

 

 

 

 

 

 

 

Пример 4. Найти доверительный интервал для оценки

математического

ожидания а

нормального

распределения с

надежностью 0,95, зная

выборочную

 

среднюю

XB

=10, 34 ,

объем выборки n = 100

и среднее квадратическое отклонение

s = 5 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

Решение. Воспользуемся формулой

 

 

 

 

 

 

 

 

 

 

 

 

 

- t ×

 

s

< a <

 

 

+ t ×

s

.

 

 

 

 

 

 

 

 

 

xB

xB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

Найдем

t

из

 

 

 

 

соотношения2F(t) = 0,95 ,

получим:

F(t) = 0, 475 .

По таблице находим t =1, 96 . Найдем

точность

оценки

 

 

 

 

 

 

 

ts

 

 

 

1,96 ×5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d =

=

= 0,98 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Искомый

 

 

 

 

 

 

 

 

 

n

100

 

доверительный

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(10, 43 - 0, 98 < a <10, 43 + 0, 98)

или

 

(9, 45 < a <11, 41).

s B = dB = 19, 96 = 4, 47 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Смысл

полученного

 

результата

:таковесли

будет

произведено

 

большое число выборок, то

95%

из

них

определяет

 

доверительные

 

 

 

 

интервалы,

которых

математическое ожидание будет заключено.

 

 

 

 

 

2. Методы расчета характеристик выборки

 

 

Рассмотрим

 

 

 

рациональные

 

 

методы

 

определени

характеристик выборки

 

 

и

dB .

 

 

 

 

 

 

 

 

 

 

 

 

xB

 

 

 

 

 

 

 

 

 

 

 

 

2.1. Условные варианты. Метод произведений

 

 

Пусть выборка из генеральной совокупностиХ является

вариационным рядом с равноотстоящими вариантами, т.е.

 

 

хi

 

 

х1

 

 

 

 

 

 

 

 

 

х2

 

 

 

 

 

 

 

хm

 

 

ni

 

 

n1

 

 

 

 

 

 

 

 

 

n2

 

 

 

 

 

 

 

nm

 

 

x1 < x2 < ... < xm, xi+1 - xi = h = const,

n = n1 + n2 +...+ nm .

Условными

 

называют

 

 

вариантыui ,

определяемые

равенством

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

u i

 

 

 

xi

- c

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

 

 

 

 

 

 

 

где С – ложный нуль. Обычно полагают С равным варианте с

наибольшей частотой.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Нетрудно

видеть, что

условные

 

варианты

принимают

только целые значения, и, если xi 0

= C , то uio = 0 .

 

 

 

 

Условные

варианты u1 , u 2 , ..., u n

 

 

образуют

условную

выборку

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ui

 

u1

 

u2

 

 

 

 

 

 

 

um

 

ui

 

u1

 

U2

 

 

 

 

 

 

 

um

 

Тогда можно определить условные эмпирические

 

 

моменты порядка k :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M k * =

åni ×ui

k

.

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определив условные выборочные моменты первого и

второго порядка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

M1* =

åni ×ui

 

 

 

; M 2 * =

åni ×ui 2

,

 

 

 

 

i=1

 

 

 

i =1

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

можно определить выборочные среднюю и дисперсию:

xB = M 1 *×h + C ,

dB = éM 2 * -(M 1*)2 ù ×h2 . ë û

13

Пример 5.

Даны

 

выборочные

 

вариантыxi и

соответствующие частоты ni

количественного признака X :

 

 

 

 

 

 

 

 

 

хi

10

15

 

20

 

25

 

30

ni

6

16

 

50

 

24

 

4

Найти методом произведений выборочные среднюю, дисперсию и среднее квадратическое отклонение.

Решение. Составим расчетную таблицу, для чего:

1)запишем варианты xi в первый столбец;

2)запишем частоты ni во второй столбец;

3)В качестве ложного нуляС выберем варианту 20 (эта

варианта

имеет

наибольшую

частоту); в

клетке

третьего

столбца,

которая

принадлежит

строке,

содержащей

варианту 20,

пишем

0; над

нулем

последовательно записываем условные варианты -1,-2,

а под нулем – последовательно 1,2;

4)Произведения частот на условные вариантыui записываем в четвертый столбец; находим сумму этих

произведений и помещаем ее в нижнюю клетку столбца;

5)Произведения частот на квадраты условных вариант запишем в пятый столбец; сумму чисел столбца(80) помещаем в нижнюю клетку столбца;

6)Произведения частот на квадраты условных вариант,

увеличенных

на

единицу, запишем

в

шестой

(контрольный)

столбец;

сумму чисел

столбца(188)

помещаем в нижнюю клетку столбца.

 

 

В итоге получим следующую расчетную таблицу:

14

xi

ni

ui

ni × ui

ni × ui 2

ni (ui +1)2

 

 

 

 

 

 

10

6

-2

-12

24

6

15

16

-1

-16

16

0

20

50

0

0

0

50

25

24

1

24

24

96

30

4

2

8

16

36

 

n = 100

 

åni ui = 4

åni ui 2 = 80

åni(ui +1)2 =188

 

 

 

 

 

 

Контроль

åni ×ni 2 + 2åni ×ui + n = 80 + 2 ×4 +100 =188 ;

2

åni (ui +1) =188

Совпадение найденных сумм свидетельствует о том, что вычисления произведены правильно.

Вычислим условные моменты первого и второг порядков:

 

åni ui

 

åni ui 2

 

 

80

 

 

M1 * =

 

 

 

=

4

= 0, 04 ; M 2 * =

 

 

=

= 0, 08 .

n

 

 

 

n

 

 

 

100

 

 

100

 

 

Найдем

шаг (разность

между

двумя

соседними

вариантами): h = 15 -10 = 5 .

 

 

 

 

 

 

 

Найдем искомую выборочную среднюю:

 

 

 

 

 

 

 

 

 

= M1 *×h + C = 0, 04 ×5 + 20 = 20, 2 .

 

 

 

 

xB

 

Найдем искомую выборочную дисперсию:

 

 

 

 

 

dB = éM 2 * -(M1*)2 ù×h = é0,8 - (0, 04)2

ù×52 =19, 96 .

ë

û

ë

 

û

 

 

 

Найдем искомое среднее квадратическое отклонение:

 

 

 

 

 

 

 

s B = dB =

19, 96 = 4, 47 .

 

 

 

15

2.2. Эмпирические и теоретические частоты

 

Пусть

значения

СВХ

образуют

генеральную

совокупность. Закон распределения Х неизвестен.

 

 

 

Рассмотрим некоторую выборку объема n из генеральной

совокупности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

хi

 

х1

х2

хm

 

ni

 

n1

n2

nm

 

n = n1 + ... + nm

 

 

 

 

 

Частоты

ni

появления

вариантxi

также

называют

эмпирическими частотами.

 

 

 

 

Пусть Х

дискретная

СВ

и

имеются

основания

предположить, что изучаемая величинаХ распределена по некоторому определенному закону. Зная закон распределения

Х, мы можем найти

вероятности pi появления значений xi ,

т.е.

pi = P {X = xi} .

 

 

 

 

 

Теоретическими

частотами ni

называют

частоты,

определяемые по формуле ni

= n × pi .

 

 

Нетрудно видеть,

что ni

указывает,

сколько раз

должно

появиться в среднем

значение xi случайной величины Х с

предполагаемым законом распределения.

Пусть теперь Х – непрерывная СВ. Рассмотрим более детально определение теоретических частот, предполагая, что

Х- нормально распределенная случайная величина. Пусть

хi

х1

х2

хm

ni

n1

n2

nm

16

 

n = n1 + ... + nm ,

равноотстоящая

выборка из

генеральной

 

совокупности Х, n1 ,..., nm - эмпирические частоты,

xi + 1 - xi = h .

 

Тогда теоретические частоты определяются по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n¢i = n × pi ,

 

 

 

 

 

 

 

 

где pi - вероятность X

в i -ом частичном интервале с концами

 

xi -

h

 

и xi

+

h

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

вероятности pi

 

 

 

 

 

 

 

 

 

 

Приближенно

могут

быть

найдены

по

 

 

 

 

 

 

 

h

 

 

 

=

xi -

 

 

 

 

 

формуле

pi =

 

×j(ui) ,

где

ui

xB

,

i =1, 2,..., m ,

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

s B

 

 

 

 

 

 

s B

 

 

 

 

 

j(u) =

 

×e-u 2 / 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значения функции (j) находится по таблице.

 

 

 

 

 

 

 

 

 

 

3. Статистическая проверка гипотез

 

 

 

Во многих случаях результаты наблюдений используются

 

для проверки предположений(гипотез) относительно либо

 

самого вида распределения генеральной совокупности, либо

 

значения

параметров

уже

 

известного

распределения–

 

статистических

 

гипотез.

Пусть

известно

распределение

СВ

 

X (например,

 

это

 

нормальный

 

 

закон), и

по

выборке

 

необходимо

 

 

 

проверить

гипотезу

о

значении

некоторого

параметра (

 

,

DG или s G ) этого распределения.

 

 

 

 

x G

 

 

 

 

В дальнейшем выдвигаемую и проверяемую гипотезу будем

 

называть нулевой гипотезой (или основной) и обозначать ее

 

H 0 .

Наряду

 

с

H 0

рассматривают

также

одну

из

альтернативных (конкурирующих) гипотез H1. Например,

 

если

 

проверяется

гипотеза

 

о

 

равенстве

параметраq

 

некоторому

заданному

значениюq 0 ,

т.е.

H0 :q =q0 ,

то

в

 

качестве альтернативной гипотезы можно рассмотреть одну из

 

17

следующих:

а)

H 1 :q > q 0 ;

б) H 1 :q <q 0 ; в) H 1 :q ¹ q 0 ;

 

г) H 0 :q = q1 , где q1

- другое заданное значение параметра q .

 

Выдвинутая

гипотеза H 0

может

соответствовать истине

 

или нет. При проверке гипотезы H 0

по результатам выборки

 

могут быть допущены ошибки двух родов: 1)ошибка первого

 

рода –

отвергнутая

правильная

гипотеза;

2)ошибка

второго

 

рода

принятая неправильная

гипотеза.

Последствия

этих

 

ошибок неравнозначны, и роль каждой оценивается до конца

 

по условиям конкретной задачи. Например, если при проверке

 

качества партии деталей по выборке из нее в качествеH 0

 

принята гипотеза, что доля брака не более0,1% ,

то

при

 

допущении здесь ошибки первого рода будет забракована

годная продукция, а допустив ошибку второго рода, выпустим

 

потребителю

 

партию

деталей

 

с

долей

брака

больш

допустимого. Перед началом анализа выборки фиксируют

 

очень

малое

 

числоa .

Вероятность

совершить

ошибку

 

первого рода называется уровнем значимостиa . Обычно

 

берут a =0,05; 0,01; 0,005.

 

 

 

 

 

 

 

 

 

Правило, по которому принимается решение принять или

 

отклонить

гипотезу H 0 ,

называется

критерием

или

статистическим критерием К. Выбор К зависит от конкретной

 

задачи.

 

 

 

 

 

 

 

 

 

 

 

 

 

Обычно критерий проверки гипотезы реализуется

с

помощью

 

некоторой

 

 

статистической

характеристики,

определенной

 

по

выборке, т.е.

с

помощью

некоторой

 

статистики q . Здесь q - некоторая СВ, закон распределения

 

которой известен.

 

 

 

 

 

 

 

статистикиq

 

В

множестве

всех

возможных

значений

 

критерия К выделим подмножество w0 , при котором гипотеза

H 0 отклоняется. Это подмножество называется критической областью. То множество значений q , при котором гипотезу H 0 не отклоняют, называется областью принятия гипотезы (допустимой областью). Точки, разделяющие эти области,

18