Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2003_-_Gmurman__TV_i_MS

.pdf
Скачиваний:
19
Добавлен:
27.03.2015
Размер:
16.8 Mб
Скачать

§ 4. Метод произведений для вычисления

выборочных средней и дисперсии

Метод произведений дает удобный способ вычис­

ления условных моментов различных порядков вариаци­

онного ряда с равноотстоящими вариантами. Зная же

u

условные моменты, нетрудно наити интересующие нас

начальные и центральные эмпирические моменты. В част­

ности, методом произведений удобно вычислять выбороч­ ную среднюю и выборочную дисперсию. Целесообразно

пользоваться расчетной таблицей, которая составляется

так:

1) в первый столбец таблицы записывают выборочные (первоначальные) варианты, располагая их в возрастаю­

щем порядке;

2) во второй столбец записывают частоты вариант;

складывают все частоты и их сумму (объем выборки n) помещают в нижнюю клетку столбца;

3) в третий столбец записывают условные варианты

и; = (xj-C)jh, причем в качестве ложиого нуля С выби­

рают варианту, которая расположеиа примерно в сере­

дине вариационного ряда, и полагают h равным разности

между любыми двумя соседними вариантами; практически же третий столбец заполняется так: в клетке строки,

содержащей выбранный

ложный

нуль, пишут О; в

клет­

ках

над нулем пишут

последовательно -1, -2, -3 и

т. д.,

а под нулем-l, 2, 3 и т. д.;

 

4) умиожают частоты на условные варианты и

запи­

сывают их произведения njUj в

четвертый столбец;

сло­

жив

все полученные числа, их

сумму ~ njU j помещают

внижнюю клетку столбца;

5)умншиают частоты на квадраты условных вариант

изаписывают их произведения njU~ в пятый стол~ец;

сложив все полученные числа, их сумму ~ nju1 поме­

щают в нижнюю клетку столбца;

6) умножают частоты на квадраты условных вариант,

увеличенных каждая на единицу, и записывают произве­

дения n; (и; + 1)2 В шестой контрольный столбец; сложив

все полученные числа, их сумму ~ nj ;+ 1)2 помещают

в нижнюю клетку столбца.

3 а м е ч а н и е 1. Целесообразно

отдельно

складывать отрица­

тельные числа четвертого

столбца

(их

сумму A 1

записывают в клет­

ку строки, содержащей

ложный

нуль) и отдеЛhНО ПО.'lOжительные

16

2730

241

числа (их сумму А.

записывают в предпоследнюю клетку столбца);

тогда ~niU{=Al+A .

 

 

 

3 а м е ч а и н е 2.

При вычислении произведеиий n/щпятого

столбца целесообразио

числа n/Щ четвертого

столбца умножать на щ.

3 а м е ч а и и е 3.

Шестой столбец служит для контроля вычис-

лений: если сумма ~,ц(щ+1)2 окажется

равиой сумме ~niUlt+

+ 2 ~ n,щ+n (как

и должно быть в

соответствии с

тождеСТ80М

~ n, (u; + 1)' = ~ n,и~+2 ~ n/щ+ n),

то

вычисления

проведены

hpави.llЬНО.

После того как расчетная таблица заполнена и про­ верена правильность вычислений, вычисляют условные

моменты:

M~ = (~n,uj)/n, м; = (~niuшn.

Наконец, вычисляют выборочные среднюю и диспер­

СИЮ по формулам (*) и (****) § 3:

х. = Mih+C. D. = [M;-(M~)I] h'.

Пример. Найти методом пронзведений выборочные среднюю и

дисперсию следующего СТатистического гаспределеиня:

варнаиты

частоты

10,2

10,4

10,6

10,8

11,0

11,2

1,4

11,6

11,8

12,0

2

3

8

13

25

20

12

10

6

1

Реш е н и е. Составим

расчетную таблицу, для чего:

 

1) запишем вариантЫ в первый столбец;

 

 

2) запишем частоТЫ 80 второй столбец; сумму

частот (100) по­

местим в нижиюю клетку столбца;

 

 

3) в качестве ложного нуля выберем варианту 11,0 (эта

вариан­

та расположена примерно

в середине вариационного

ряда);

в клетке

третьего столбца, которая

прииадлежит строке, содержащей

выбран­

ный ложныЙ иуль, пншем О; над нулем заПисываем

последовательно

-1, -2, -3, -4, а под иулем - 1, 2, 3, 4, 5;

4) произведения частот иа условиые варианты заПИсываем в чет­

вертый столбец; отдельно иаходим сумму (-46) отрицаТj>ЛЬНЫХ и от­

Дельно сумму (103) положительных чисел; сложив этн числа, их

сумму (57) помещаем в иижнюю клетку столбца;

5) произведеиия

частот на квадраты условных вариант запищем

в ПЯТЫЙ столбец; сумму чисел столбца

(383) ПОмещаем в нижнюю

клетку сто.,бца;

 

 

б) произведення

частот иа квадраты

УСЛО!JНЫХ варнант, увели­

чеННЫХ на единицу,

запншем в шестоЙ контрольиый столбец; сумму

(597) чнсел столбца помещаем в нижнюю клетку столбца.

В итоге получим

расчетную табл. 7.

 

I( о и т р о л ь: ~ nju~+2~ njUi+n=383+2·57 + 100= 597.

~ n( + 1)' =597.

Вычисления произведеИl~ правильио.

242

I I

х·I I

10,21

10,4 I

10,6 I

10,8 I

11 I

11,2 I

11 ,4 I

11,6 I

11 ,8 I

12,0 I

I

 

 

 

 

 

 

 

 

Таблица 7

2

I

3

I

4

I

5

1

 

б

n;

I

I

I

 

I

njul2

I

1

+l)2

 

и·

 

n{и;

I

I

nj(u

2

1-4

 

-8

32

18

3 I-3 I - 9

I 27

I

12

8

1-2

1

-16

I

32

1

 

8

 

 

 

 

 

I

 

I

 

 

13

1-1

1

-13

13

 

О

 

 

 

25

I

О

I A 1 = -461

 

I

25

20

I

1

I

20

I

20

I

80

12

I

2

I

24

I

48

I

108

10

I

3

I

30

I

90

I

160

6

I

4

I

24

I

96

I

150

1

I

5

I

5

I

25

I

36

 

I

 

I А2=103

I

 

I

 

 

n= 100 I

 

I~niщ=57 ~niU~=38З ~n{(щ+l)2=597

Вычислим условные моменты первого и второго порядков:

M~ = (~щи;)/n= 57/100 = 0,57;

м: = (~niu~)/n = 383/Н)()= 3,83.

Найдем шаг: h = 10,4-10,2 = 0,2.

Вычислим искомые.выборочиые среднюю и дисперсию:

- +

ХВ = M1h+C = 0,57 ·0,2 11,0 = 11,1;

DB =[M;_(M~)2] h2 = (3,83-(0,57)2] ·0,22 = 0,14.

§5. Сведение первоиачальиых вариант

кравиоотстояlЦИМ

Выше изложена методика расчета выборочных

характеристик для равноотстоящих вариант. На прак­ тике, как правило, данные наблюдений не являются рав-

16*

:мв

ноотстоящими числами. Естественно, возникает вопрос:

нельзя ли соответствующей обработкой наблюдаемых значений признака свести вычиc.neния к случаю равноот­

стоящих варнант? Оказывается, можно. С этой целью

интервал, в котором заключены все наблюдаемые значе­

ния признака (первоначальные варианты), делят на не­

сколько равных частичных интервалов. (Практически в

каждый частичный интервал должно попасть не менее

8-10 лервоначальных вариант.) Затем находят середины

частичных интервалов, которые и образуют последователь­

ность равноотстоящих вариант.

В качестве частоты каждой «новой» варианты (середины

частичного интервала) принимают общее число первона­

чальных вариант, попавших в соответствующий частичный

интервал.

Ясно, что замена первоначальных вариант серединами

частичных интервалов сопровождается ошибками (перво­ начальные варианты левой половины частичного интер­

вала будут увеличены, а варианты правой половины уменьшены), однако эти ошибки будут в основном пога­

шаться, поскольку они имеют разные знаки.

Пример. Выборочная совокупность объема n= 100 задана табл. 8.

Составить распределение равноотстоящих вариант.

 

Ре UI е н и е.

Разобьем

интервал

1,00-1,50, например, на

сле­

дующие 5 частичных интервалов.

 

 

 

 

1,00 -1,10;

1,10-1,20;

1,20-1,30; 1,30 -1,40;

1,40-1,50.

 

 

 

 

 

 

 

 

Таблица 8

Х{

I n,

I Х/

n{

I Х{

I n,

 

1,00

 

1

 

1,19

2

1,37

6

1,03

 

3

 

1,20

4

1,38

2

1,05

 

6

 

1,23

4

1,39

1

1,06

 

4

 

1,25

8

1,40

2

1,08

 

2

 

1,26

4

1,44

3

1,10

 

4

 

1,29

4

1,45

3

1,12

 

3

 

1,30

б

1.46

2

1,15

 

6

 

1,32

4

1,49

4

1,16

 

5

 

1.33

5

1,50

2

Приияв середины частичных интервалоц в качестве иовых вариант У{.

получим

раВНоотстоящне варианты: Уl= l,05i У.= 1,15; Ув = 1,25;

11. = 1,35;

у,::;: 1.45.

Ш

 

 

Найдем частоту

варианты Yl'

 

 

 

 

 

 

 

nl= 1+3+6+4+2+4/2= 18

 

 

(Поскольку

первоначальная

варианта

1,1 О Ьдновременно

является

концом первого

чаСТИЧНОГО

интервала

и началом второго,

частота 4

этой

варианты

поровну распределена между обоими частичными ии­

терваламн)

 

 

 

 

 

 

 

 

 

 

Найдем частоту варианты Уа'

 

 

 

 

 

 

 

nа =

4/2 + 3 + 6 + 5 + 2 + 4/2 = 20.

 

Аналогично вычислнм

частоты остальных вариант: nз=25; n,,=22:

n, =

15.

 

 

 

 

 

 

 

 

 

 

8 итоге

получим

следующее

распределение

равиоотстоящих ва-

риант:

 

 

 

 

 

 

 

 

 

 

 

 

У;

1,05

1,15

1,25

1,35

1,45

 

 

 

 

ni

 

18

20

25

22

15

 

Рекомендуем читателю убедиться, что выборочные средине и дис­

персии, вычисленные по первоначальным и равноотстоящим вариан­ там, окажутся соответственно РdВНЫМИ.

Хв = 1,250, Ув= 1.246; Dж =О,О18; DII =O,OI7.

Как видим, замена первоначальных вариант равноотстоящими не при­

вела к существенным ошибкам; прн этом объем вычислительноА

работы значительно уменьшается.

§ 6. Эмпирические и выравнивающие

(теоретические) частоты

А. Дискретное распределение. Рассмотрим дис­

кретную случайную величину Х, закон распределения

которой неизвестен. Пусть r1'pоизведено n испытаний, в которых величина Х приняла n1 раз значение X~ n2 раз

значение Х2, ••• , nlt раз значение XIt, причем ~ n. = n.

Эмпирическими частоm,ами называют фактически на­

блюдаемые частоты n •.

Пусть имеются основания предположить, что изуча­

емая величина Х распределена по некоторому определен­

ному закону. Чтобы яроверить, согласуется ли это пред;

положение с данными наблюдений, вычисляют частоты наблюдаемых значений, т. е. н а х од я т те орет и ч е с к и частоту n; каждого из наблюдаемых значений в предпо­

ложении, что величина Х распределена по предполагае­

мому закону.

Выравнивающими (теоретическими) в отличие от фак­

тически наблюдаемых эмпирических частот называют

частоты ni. найденные теоретически (вычислением). Вы-

245

равнивающие частоты находят с помощью равенства

n; =nР/.

где n-число испытаний; Р(-вероятность наблюдаемого

значения Xl. вычисленная при допущении, что Х имеет

предполагаемое распределение.

Итак, выравнивающая частота наблюдаемого значения Х, дискретного распределения РШJна nроиэведению числа ucnьuпaHий на вероятность этого наблюдаемого значения.

Пример. В результате зксперимеита, состоящего из n=520 испы­

таиий, в каждом из КОО'ОрЫХ perнстрировалось число Х/ ПОЯlI.IJеииЙ некоторого события, получено следующее эмпирическое распределенне:

набп. значения

.

Х(

О

 

1

2

3

4

5

6

7

змП. Частота

•• n/

120

167

130

69

27

5

1

1

Найти выравнивающие

частоты

n;

в предположении,

что

 

случайнаи

величина Х (генеральиая совокупность) распределена по закону

Пуассона.

Реш е и и е. Известно, <rro параметр А., кморым определяетси

распределеиие Пуассоиа, равен математическому ожиданию ЭТОГО

распределения. Поскольку в Ka'leCТ8e оцеики математического ожи­ даиия принимают выборочиую среднюю (см. гл. XVI, § 5), то и в

качестве оцеики А. можио прииять выборочиую среднюю ХВ. Легко иайти по условию, что выборочиая среднJUI равна 1,5, следовательно,

можно принять А.= 1,5.

Таким образом, формула Пуассоиа

Р,. (k)=(л"е-~)/kl

принимает вид

РiIQ (k)= (1 ,5" .e-l·~)/kl

Пonьзуись зтой формулой, наЙдем вероятности Р"20 (k) при k=O, 1,

2, 3, 4, 5, 6, 7

(дли простоты записи индекс 520

далее опущен):

Р (О) =0,22313,

р (1) =0.33469,

Р (2) = 0,251021,

Р (3) =0,125511,

Р(4)=0,047Об6,

P(5)=0,014120,

Р(6)=0.ООЗ530,

Р(7) =0,000755.

Найдем выравнивающие чаСТОТЫ (результаты умножения округ­ oIIеиы до едииицы):

n~= пР (О) =520·0,22313= 116, n; = пР (1) = 520· 0,33469 = 174.

Аналогично наХОJl.ЯТ и остальиые выравнивающие чаcтarы. В ито­

ге ПOollучим:

ЗМIJ. частота выр. чаcтarа

••

123

167

J30

69

27

5

1

J

••

116

174

IЗI

65

25

7

2

О

Сравнительно небольшое ра<:хождеиие змпирических и выравни­

вающих частот подтверждает предпonожение. что рассматриваемое

распределение подчинено закоиу nуассоиа.

Заметим, что если ПОДСЧИТать выборочную дисперсию по данному распределеиию, то окажется, что она равна выборочной средней,

т. е. 1,5. Эго служит еще одним подтверждеиием сделанного предпо­

ложения. поскольку дпя распределения Пуассоиа А.= М (Х) = D (Х).

i46

Сравиеиии 9мпирических и теоретических чаcroт «на глаз), ко­

нечио, неДостаточно.

Чтобы

сделать это более

обоснованно,

иадо

нСПOJ)ьзоВать, например, критернй

Пирсоиа (см.

гл. XIX,

§

23).

Проверка гипотезы о

распределении

случайной

величины по

закону

Пуассона изложена в

книге:

r м у р м а Н В. Е.

Руководство к

реше­

нию задач по теорни вероятностей и математнческой СТатистике.

М., «Высшая школа», 1972 (см. гл. XIII, § 17).

Б. Непрерывное распреде.ление. В случае непрерывного

распределения, вероятности отдельных возможных значе­

ний равны нулю (см. гл, Х, § 2, следствие 2). Поэтому весь интервал возможных значений делят на k непересе­

кающихся интервалов и вычисляют вероятности Рj попа­

дания Х в i-й частичный интервал, а затем, как и для дискретного распределения, умножают число испытаниА

на эти

вероятности.

Итак, ВЫ Р а в н и в а ю Щ и е ч а с т о т ы н е п ре р ы в­

Н О Г О

Р а с п р е Д е л е н и я находят по равенству

n; = nР{.

где n-число испытаний; Р,-вероятность попадания Х

в l-й частичный интервал, вычисленная при допущении. что Х имеет предполагаемое распределение.

В частности. если имеются основания предположить,

что случайная величина Х (генеральная совокупность)

распределена н о р м а л ь н о, то выравнивающие частоты

могут быть найдены по формуле

n; = nh (Uj),

ав

где n-число испытаний (объем выборки), h-длина час­

тичного интервала, О'в-выборочное среднее квадрати-

ческое отклонение, u,=(Xj-Хв)!О'в (х,-середина i-ro

частичного интервала),

<р (и) = 1 е- и·/9

Y2ii. .

Пример иа применение формулы (*) приведен в § 7.

П о я с н е н и е. Поясним происхождение формулы (*). Напишем плотность общего нормального распределения:

2-47

При а = О и а = 1 получим плотность нормированного

распределения:

или, изменив обозначение аргумента,

(j) (и) = у1_ е- ul/<j.

 

2п

 

Положив II = (х-а)/а,

имеем

 

(j) (и) =

1 е- (х-а)I/(2<1")

.

 

y2n

Сравнивая (**) и (***) , заключаем, что

f (х) = ~ (j) (и).

а

Если математическое ожидание а и среднее квадрати­

ческое отклонение а неизвестны, то в качестве оценок

9ТИХ параметров принимают соответственно выборочную

среднюю хв И выборочное среднее квадратическое откло­

нение ав (см. гл. XVI,

§ 5,9). Тогда

f

1

(х) =0 (j) (и),

 

в

где U = (х-хв)!ав.

Пусть х{-середина i-ro интервала (на которые раз­ бита совокупность всех наблюдаемых значений нормально

распределенной случайной величины Х) длиной h. Тогда

вероятность попадания Х в этот интервал приближенно

равна произведению длины интервала на значение плот­

ности распределения '(х) в любой точке интервала и, в

частности, при х = х{ (см. гл. XI, § 5):

P 1=hf (XI) =h 'Iо (j) (Ui)'

в

Следовательно, выравнивакхцая частота

n;=nР/= nh (j)(ttj),

ав

где Ul = (xj-х.)!ав' Мы получили формулу (*).

248

§ 7. Построение нормальной кривой

по опытным данным

Один из способов построения нормальной кривой

по данным наблюдений состоит в следующем:

1) находят Хв и О'в' например. по методу произведений;

2) находят ординаты У; (выравнивающие частоты)

теоретической кривой по формуле у,= nh (Ui)' где п-

ав

сумма наблюдаемых частот) h - разность между двумя

соседними вариантами: и; = (Xj-XB)/O'B И <Р (и) =

=(1/V 2n) е-иl/2 ;

3)строят точки (Х,. У,) в прямоугольной системе ко­ ординат и соединяют их плавной кривой.

Близость выравнивающих частот к наблюдаемым под­

тверждает правильность допущения о том. что обследуе­

мый признак распределен нормально.

Пример. Построить нормальную кривую по данному распределе­

иию:

вариаиты

частоты

•••

•••

х,

ni

15

20

25

30

з5

40

45

50

55

6

13

з8

74

106

85

зо

10

4

Реш е н и е. Польэуясь методом произведений (см. § 4), найдем

.%в=34,7,ов=7,38.

Вычислим выравнивающие частоты (табл. 9).

 

 

 

 

 

 

 

Таблица 9

 

 

 

 

-

 

 

n'"

 

n/

Xj- хв

 

Х,- Х

В

ер(и.-)

11/=-' ер (";)=

Х{

"/ -

 

ав

ав

 

 

 

 

.

 

 

= 248·ер (и/)

 

 

 

 

 

 

 

15

6

-19,7

-2,67

 

0,0113

3

20

13

-14,7

-1,99

 

0,0551

14

25

38

-9.7

-1,31

 

0,1691

42

зо

74

-47)

-0,63

 

0,3271

82

з5

106

0,3

 

0,05

 

0,3984

99

40

85

5,3

 

0,73

 

0,3056

76

45

30

10,3

 

1,41

 

0,1476

37

50

10

15,3

 

2,09

 

0,0449

11

55

4

20,3

 

2,77

 

0,0086

2

 

'n=366 \

 

I

 

 

 

I ~у/=З66

249

На рис. 22 построены нормальная (теоретическая)

кривая по выравнивающим частотам (они отмечены круж­

ками) и полигон наблюдаемых частот (они отмечены

 

 

крестиками). Сравнение

 

 

графиков

наглядно

по­

 

 

казывает, что построен-

~OO

 

ная

теоретнческая кри­

80

 

вая

удовлетворительно

 

отражает

данные

на­

 

 

60

 

блюдений.

 

 

 

 

 

Для того чтобы бо­

 

 

 

",О

 

лее

уверенно считать,

 

 

 

 

 

 

 

 

что данные наблюдений

%0

 

свидетельствуют

о нор­

 

 

мальном распределении

О~~'О~-Z~О~З~0~-'~0~~50~-6~0---~

признака,

пользуются

Рис. 22

 

специальными правила-

 

 

ми (их называют кри­

териями согласия),

понятие о

которых

можно

найти

далее (см. гл. XIX,

§ 23).

 

 

 

 

 

§ 8. Оценка отклонения змпнрнческого

распреде.rreния от нормального.

Асимметрия и ексцесс

Для оценки отклонения эмпирического распре­

деления от нормального используют различные характе­

ристики, к числу которых относятся асимметрия и эксцесс.

Смысл этих характеристик аналогнчен смыслу асимметрии

и эксцесса теоретического распределения (см. гл. ХН, §9).

Аси'мметрия Э'мnирического распределения определяется

равенством

а" = та/а:,

где тв-центральный эмпирический момент третьего порядка (см. § 2).

Эксцесс Э'мnирического распределения определяется ра­

венством

е. = т~a~-3,

где т.-центральныЙ эмпирический момент четвертого

порядка.

Моменты т. и т. удобно вычислять методом произ­

ведений (см. § 4). используя формулы (***) § 3.

250