Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2003_-_Gmurman__TV_i_MS

.pdf
Скачиваний:
19
Добавлен:
27.03.2015
Размер:
16.8 Mб
Скачать

Типическим называют отбор, при котором объекты

отбираются не из всей генеральной совокупности, а из

каждой ее «типической» части. Например, если детали

изготовляют на нескольких станках, то отбор производят

v

v

не из всеи совокупности деталеи, произведенных всеми

станками, а из продуки.ии каждого стаи:ка в отд~ьности.

Типическим отбором пользуются тогда, когда обследуемый

признак заметно .колеблется в различных типических частях генеральной совокупности. Например, если про­

дукция изготовляется на нескольких машинах, среди

которых есть более и менее изношенные. то здесь типи­

ческий отбор целесообра9ен.

Механ.u.чески/М называют отбор, при котором генераль­

ную совокупность «мехaJlИчески» де.лят на столько групп,

сколько объектов должно войти в выборку, а из каждой

группы отбирают один объект. Например, если нужно

отобрать 20% изготовленных станком деталей, то отби­

рают каждую пятую деталь; если требуется отобрать

5% деталей, то оroирают каждую двадцатую деталь, и т. д.

Следует указать, что иногда механическнй отбор может не

обеспечить репреэентативности выборки. Например, если

отбирают каждый двадцатый обтачиваемый валик, причем сразу же после отбора производят замену резца, то отобранными окажутся все вал.ики, обточенные затуплен­

ными резцами. В таком случае следует устранить совпа­ дение ритма отбора с ритмом замены резца, для чего

надо отбирать, скажем. каждый десятый валик из двад­

цати обточенных.

Серийньш называют отбор, при котором объекты от­

бирают из генеральной совокупности не по одному, а

«сериями», которые подвергаются сплошному обследова­ нию. Например, если И3ДеЛ}fЯ изготовляются большой группой станков-автоматов, то подвергают сплошному

обследованию продукцию только нескольких станков.

Серийным отбором пользуются тогда, когда обследуемый признак колеблется в раЗЛ}f'lНblX сериях незначитель­

но.

Подчеркнем, что на практике часто применяется ком­ бинированный отбор, при котором сочетаются указанные

выше способы. Например, иногда разбивают генеральную

совокупность на серпи одинакового объема, затем простым

случайным отбором выбирают lIесколько серий и. наконец. из каждой серии простым случайным oroором извлекают

отдельные объекты.

191

n i /1t

§ 6. Статистическое распределение выборки

Пусть из генеральной совокупности измечена

выборка, причем Х1 наблюдалось n1 раз,

х2-n. раз,

Xk- nk раз и ~ni=n-объем выборки.

Наблюдаемые

значения Х; называют вариантами, а последовательность

вариант, записанных в возрастающем порядке,- вариа­

циОННblМ рядом-. Числа наблюдений называют частотами, а их отношения к объему выборки = Wi-ОmнОСU­

тельным-и частотам-и.

Статистически'м распределением 8blборкu Н8зывают пе­

речень вариант и соответствующих им Ч8СТОТ или относи­

тельных частот. Статистическое распределение можно за­

дать также в виде последовательности интеРВ8ЛОВ и соответ­

ствующих им частот (в качестве частоты, соответствующей

интервалу, принимают сумму частот, попавших в этот

интервал).

Заметим, что в теории вероятностей под распределением

понимают соответствие между возможными значениями

случайной величины и их вероятностями, 8 В математи­

ческой статистике-соответствие между наблюдаемыми

вариантами и их частотами, или относительными частотами.

Пример. Задано распределение частот выборки объема n = 20:

Х/ 2 6 12 n; 3 10 7

Написать распределение относительных частот.

Реш е н и е. Найдем относительные частоты, для чего разделнм

частоты на объем выб<>рки:

Wt =3/20=0.15,

W.= 10/20=0,50, w. =7/20= 0,35.

Напишем распределение относнтельных частот:

Х;

2

6

12

Wi

0,15

0,50

0,35

К о н т р о JI ь: 0,15+0,50+0,36= J.

§ 7. Эмпиричеока. Функция распределения

Пусть известно статистическое распределение ча­

стот количественного призиака Х. Введем обозначения: n,,-число наблюдений, при которых наблюдалось значение

признака, меньшее х; n-общее число наблюдений (объем

выборки). Ясно, что относительная частота события Х < Х

раВИ8 n,,/n. Если х изменяется, то, вообще говоря, из­

меняется и относительная частота, т. е. относительная

192

частота nх/n есть ФУНКЦИЯ от х. Так как эта Функция

находится эмпирическим (опытным) путем, то ее называют

эмпи рическоЙ.

Эмпирической функцией распределения (функцией рас­

пределения выборки) называют Функцию р* (х), опреде­

ляющую для каждого значения х относительную частоту

события Х < х.

Итак, по определению,

р* (х) = nх/n,

где nх-число вариант, меньших х; n-объем выборки. Таким образом, для того чтобы найти, например, Р*(х2),

надо число вариант, меньших х2, разделить на объем выборки:

в отличие от эмпирической функции распределения

выборки функцию распределения Р (х) генеральной сово­

купности называют теоретической функцией распределе­

ния. Различие между эмпирической и теоретической функ­ циями состоит в том, что теоретическая функция Р (х)

определяет вероятность события Х < х, а эмпирическая функция р* (х) определяет относительную частоту этого

же события. Из теоремы Бернулли следует, что относи­

тельная частота события Х < Х, т. е. р* (х) стремится по

вероятности к вероятности Р (Х) этого события. Другими

словами, при больших n числа р* (Х) и Р (х) мало отли­

чаются одно от другого в том смысле, что liт Р [1 Р (х)-

- Р* (х) 1<

n ..... ао

8] = 1 (8 > О). Уже отсюда следует целесооб­

разность использования эмпирической Функции распреде­

ления выборки для приближенного представления теоре­ тической (интегральной) функции распределения гене­ ральной совокупности.

Такое заключение подтверждается 11 тем, что Р* (х)

обладает всеми свойствами Р (х). Действительно, из опре­

деления функции р* (х) вытекают следующие ее свойства: 1) значения эмпирической функции принадлежат от­

резку [О, 1];

2)р* (х)-неубывающая ФУНКЦИЯ;

3)если х1-наименьшая варианта, то р* (х) = О при X~Xl; если Хk-наибольшая варианта, то р* (х) = 1 при

Х> Xk'

13-2730

193

Итак, эмпирическая функция распределения выборки

служит для оценки теоретической функции распределения

генеральной совокупности.

Пример. Построить эмпирическую функцию по данному распре­

Аелению выборки:

 

варианты Х;

2

6

10

 

 

 

 

частоты ni

12

18

30

 

 

 

 

 

 

 

Реш е н и е.

Найдем

сб1,е'-1

 

 

 

выборки:

12 +

18 +

30 = 60.

 

 

 

Наименьшая варианта

равна 2,

1

 

 

следовательно,

 

 

 

 

 

 

р* (х) = О при х..;;; 2.

 

 

 

 

 

 

 

 

 

 

Значение Х < 6,

а нменио

 

 

 

хl = 2,

наблюдалось

12

раз,

 

 

 

следовательно,

 

 

 

--;;о-l-~2;==~6:---~IО:------.ж

р* (х) = 12/60=0,2 при

 

Рис. 19

 

 

 

2 < х<;;6.

 

 

 

 

 

 

 

 

 

 

Значения

Х < 10, а

именно

Хl=2

и Х2=6, иаблюдались

12+

+ 18 =30 раз,

следовательно,

 

 

 

 

 

 

 

F* (х)=3О/60=0,5 при 6 < X~ 10.

 

 

 

Так как х= IO-иаибольшая варианта, то

 

 

 

 

 

Е8 (х) = I

при х > 10.

 

 

 

 

Искомая эмпирическая функция

 

 

 

 

 

 

 

I

О

при

х <;; 2,

 

 

 

 

р*(х)={

0,2

при

2 < х..,;;;; 6,

 

 

 

 

 

 

 

 

 

 

 

 

 

0,5

при

6 <х<;;lO,

 

 

 

 

 

I

при

х> 10.

 

 

 

График этой функции изображен на рис. 19.

§ 8. Полигон и гистограмма

Для наглядности строят различные графики ста­

тистического распределения н, в частности, полигон и

гистограмму.

Полигоном частот называют ломаную. отрезки которой

соединяют точкн (Х1; n 1 ). (X1 ; n 2 ), ••• , (Xk; nk). Для по­

строения полнгона частот на оси абсцисс откладывают

варианты Xj. а на оси ординат-соответствующие нм

частоты n,. Точки (Х,; n,) соединяют отрезками прямых

и получают полигон частот.

Полuгоно.м относительных частот называют ломаную,

отрезки которой соеднняют точки (Х1; W 1)' 2; w1)' ...

194

• . " (Xk; Wk)' Для построения полигона относительных

частот на оси абсцисс отклаДывают варианты Xj, а на

оси ординат-соответствующие им относительные ча­

стоты W;. Точки (Х;; WJ соединяют отрезками прямых

иполучают полигон огно- W&

сительных частот.

На рис. 20 изображен

полигон относительных ча­ стот следующего распре­ деления:

Х

1,5

3,5

5,5

7,5

 

W

0,1

0,2

0,4

0,3

Рис. 20

в

случае

н е n р еры в н о г о

при з н а к а целесо­

образно

строить гистограмму, для

чего интервал, в ко­

тором заключены все наблюдаемые значения признака,

разбивают на несколько частичных

интервалов длиной h

 

и

находят для каждого

 

частичного интервала

7

n;-сумму частот вари­

ант,

попавших

в

i-A

 

6

интервал.

 

 

5

 

Гистограммой

ча-

,

стот

называют ступен­

 

 

чатую

фигу ру,

состоя­

3

2

щую из прямоугольни­ ков, основаниями кото­ рых служат частичные

~~-L~--~~~~----~~X

интервалы длиною h, а

высоты равны отноше­

о 5 10 15 20 25 30 35

Рис. 21

нию ni/h (плотность ча­

 

стоты).

Для построения гистограммы частот на оси абсцисс

откладывают частичные интервалы, а над ними проводят

отрезки, параллельные оси абсцисс на расстоянии n,/h.

Площадь i-ro частичного прямоугольника равна hn{/h = n{-сумме частот вариант i-ro интервала; следо­

вательно, площадь гистограм.мы. частот равна сумме всех

частот, т. е. объему выборки.

На рис. 21 изображена гистограмма частот распреде­

ления объема n = 100, приведенного в табл. 6. Гистограммой относительных частот называют сту­

пенчатую фигуру, состоящую из прямоугольников, ОСНО­

В8ниями которых служат частичные интервалы длиною h,

13*

195

а высоты равны отношению W;/h (плотность относитель­ ной частоты).

Для построения гистограммы относительных частот

на оси абсцисс откладывают частичные интервалы, а над

 

 

 

Таблица 6

Частнчныll ннтеfвал

Сумма частот

вариант

Плотность

частичиого

интер-

длиною h=

частоты nl/h

вала ni

 

 

5-10

4

 

0,8

10-15

6

 

1,2

15-20

16

 

3,2

20-25

36

 

7,2

25-30

24

 

4,8

30-35

10

 

2,0

35-40

4

 

0,8

ними проводят отрезки, параллельные оси абсцисс на

расстоянии W,/h. Площадь i-ro частичного прямоуголь­

ника равна hWi/h= Wi-относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гисто­

граммы относительных частот равна сумме всех отно­

сительных частот, т. е. единице.

з.",ачи

1. Построить график эмпирической функции распределения

 

х..

5

7

10

15

 

 

n'

2

3

8

7

 

2. Построить полигоны частот и ОТИl,)сительных частот распре.

делення

 

 

 

 

 

 

Х,

I

 

3

5

7

9

nl

10

 

15

30

12

3. Построить гистограммы частот н относительных частот рас­

пределення (8 первом столбце указан частнчиый интервал, во вто­ ром-сумма частот вариант частичного интервала)

2-5

9

5-8

10

8-11

25

11-14

6

196

rлава шестнадцатая

СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ

РАСПРЕДЕЛЕНИЯ

§ 1. Статистические оценки параметров

распределения

Пусть требуется изучить количественный признак

генеральной совокупности. Допустим, что из теоретичес­

ких соображений удалось установить, какое именно рас­

пределение имеет признак. Естественно возникает задача

оценки параметров, которыми определяется это распреде­

ление. Например, если наперед известно, что изучаемый

признак распределен в генеральной совокупности нормаль­

но, то необходимо оценить (приближенно найти) матема­

тическое ожидание и среднее квадратическое отклонение,

так как эти два параметра полностью определяют нормаль­

ное распределение; если же есть основания считать, что

признак имеет, например, распределение Пуассона, то

необходимо оценить параметр л, которым это распреде­

ление определяется.

Обычно в распоряжении исследователя имеются лишь

данные выборки, например значения количественного при­

знака X 1 , Х2, ••• , Хn' полученные в результате n наблюде­

ний (здесь и далее наблюдения предполагаются независимы­

ми). Через эти данные и выражают оцениваемый параметр. Рассматривая X 1 , Х2, •••• ХN как независимые случайные

величины Хн Х2' ••• , Хn' можно сказать, что найти

статистическую оценку неизвестного параметра теоретиче­

ского распределения - это значит найти функцию от

наблюдаемых случайных величин, которая и дает при­

ближенное значение оцениваемого параметра. Например, как будет показано далее, для оценки математического

ожидания нормального распределения служит функция

(среднее арифметическое наблюдаемых значений признака)

Итак, статистической оценкой неизвестного пара­

метра теоретического распределения называют функцню

от наблюдаемых случайных величин.

197

§ 2. Несмещенные, эффективные и состоятельные

оценки

Для того чтобы статистические оценки давали

«хорошие» приближения оцениваемых параметров, они

должны удовлетворять определенным требоваииям. Ниже указаны эти требования.

Пусть е*-статистическая оценка неизвестного пара­ метра е теоретического распределения. Допустим, что

по выборке объема n найдена оценка e~. Повторим опыт,

т. е. извлечем из генеральной совокупности другую вы­

борку того же объема и по ее данным найдем оценку е;.

Повторяя опыт многократно, получим числа е:, е;, ...• ez,

которые, вообще говоря, различны между собой. Таким образом. оценку 8* можно рассматривать как случайную

величину. а числа 8~, 8:, ...• eZ-как ее возможные

значения.

Представим себе, что оценка 8* дает приближенное

значение е с избытком; тогда каждое найденное по дан­ ным выборок число е; (i = 1. 2•... , k) больше истинного

значения е. Ясно, что в этом случае и математическое

ожидание (среднее значение) случайной величины е* боль­ ше, чем е, т. е. М (е*) > е. Очевидно, что если 8* дает

оценку с недостатком, то М (е*) < е.

Таким образом, использование статистической оценки,

u

математическое ожидание которои не равно оцениваемому

параметру, привело бы к систематическим *) (одного знака) ошибкам. По этой причине естественно потребовать, чтобы

математическое ожидание оценки 8* было равно оценива­

емому параметру. Хотя соблюдение этого требования Не устранит ошибок (одни значения е* больше, а другие

меньше е), однако ошибки разных знаков будут встреча1 Ь­

ся одинаково часто. Иными словами, соблюдение требова­

ний М (е*) = е гарантирует от получения систематических

ошибок.

Нес.мещенноЙ называют ~татистическую оценку е*, мате­

матическое ожидание которой равно оцениваемому пара­ метру е при любом объеме выборки, т. е.

М(8*)=е.

*) в теории ошибок измерений систематическими ошибками назы­

вают неслучайные ошибки, искажающие результаты измерений в одну определеиную сторону Например, измереиие длины растянутой рулет­ кой систематически дает заниженные результаты.

198

с.мещенноЙ называют оценку, математическое ШЫlДание

которой не равно оцениваемому параметру.

Однако было бы ошибочным считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения 8-- могут

быть сильно рассеяны вокруг своего среднего значения,

т е. дисперсия D (8*) может быть значительной. В 9ТОМ

случае найденная по данным одной выборки оценка, на­ пример 8;, может оказаться весьма удаленной от среднего

значения е*, а значит, и от самого оцениваемого пара­

метра 8; приняв 8; в качестве приближенного значения 8,

мы допустили бы большую ошибку. Если же потребовать, чтобы дисперсия 8* была малой, то возможность допустить большую ошибку будет исключена. По 9ТОЙ причине к

статистической оценке предъявляется требование 9ффек­

тивности.

Эффективной называют статистическую оценку, которая

(при заданном объеме выборки n) имеет наименьшую В03-

можную дисперсию.

При рассмотрении выборок большого объема (n вели­

Kol) к статистическим оценкам предъявляется требование

состоятельности.

Состоятельной называют статистическую оценку, кото­

рая при n - . 00 стремится по вероятности к оцениваемому

параметру. Например, если дисперсия несмещенной оценки

при n - + 00 етремится к нулю, то такая оценка оказы­

вается и состоятельной.

§ з. Генеральная средняя

Пусть изучается дискретная генеральная совокуп­

ность относительно количественного признака Х.

Генеральной средней хг называют среднее арифметичес­ hoe значений признака генеральной совокупности.

Если все значения Х1, Х2, ••• , XN признака генераль­

IIОЙ совокупности объема N р а э л и ч н ы, то

Xr =(X1 +X1 + ... +xN)/N.

Если же значения признака Х1,

Х2,

•••• Xk

имеют

соответственно частоты N l' N 2' . • . ,

N k'

причем

N 1 +

-j-- N 2 + ... + N k = N, то

 

 

 

Хг = (x1 N 1 +x2 N 2 + ... +XkNk)/N,

199

т. е. генеральная средняя есть средняя взвешенная зна­

чений признака с весами, равными соответствующим ча­

стотам.

3 а м е ч а н и е. Пусть генеральная совокупность объема N со­ держит объекты с различными зна чениями признака Х, равными

Х1, Х2, •• " XN. Представим себе, что из этой совокупности наудачу извлекается один объект. Вероятность того, что будет извлечен сбъект

со значением признака, например Xl, очевидно, равна I/N. С этой

же вероятностью может быть извлечен н любой другой объект. Таким

образом, величину признака Х можно рассматривать как случайную величнну, возможные значения которой Хl. Х2•••• ХN имеют одина­

ковые вероятности, равные 1/N. Найдем математическое ожидание М (Х):

М (Х) =x1·I/N +x2 ·I/N + ... +XN·I/N = (x1 2+ ... +xN)/N г

Итак, еслн рассматрнвать обследуемый признак Х генеральной

совокупности как случайную величину, то математическое ожидание

признака равио генеральнсй средней этого признака:

М (Х) Хг.

Этот вывод мы получили. считая. что все объекты генеральной

совокупности имеют различные значения прнзнака. Такой же итог

будет получен, еслн допустить, что генеральная совокупность содер­

жит по нескольку объектов с одинаковым значеНllем признака.

Обобщая полученный результат на генеральную совокупность

снепрерывным раСПРЕ'делением прианака Х, и в этом случае опре­

делим генеральную среднюю как математическое ожидание признака:

хг=М (Х).

§ 4. Выборочная средияя

Пусть для изучения генеральноА совокупности

относительно количественного признака Х извлечена вы-

борка объема n.

Выборочной средней ХВ называют среднее арифмети­

ческое значение признака выборочной совокупности.

Если

все значения

X1 ,

Х., ••• ,

ХN

признака выборки

объема n

различны, то

 

 

 

 

 

 

 

XB =(X1 +X2 +··· +хn)/n.

 

Если

же значения признака X 1

X 1 ,

••• , Xk

имеют соот"

ветственно

частоты n 1

n..

.. _. nk.

причем

n1 +nl + ...

... + nk =

n. то

 

 

 

 

 

ХВ = (n1X1 +n2Х. + ... +nJtXk)/n,

или

200