Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лобоцкая Н.Л. Основы высшей математики учеб. пособие для студентов высш. мед. учеб. заведений

.pdf
Скачиваний:
243
Добавлен:
25.10.2023
Размер:
13.51 Mб
Скачать

ней отнесены. Генеральная совокупность может состоять из та­ кого большого количества единиц, что изучить их практически невозможно. Чаще всего это имеет место в биологической, ме­ дицинской и сельскохозяйственной статистике. Например, при исследовании содержания белка в зерне пшеницы, определении веса того же зерна и т. д. Однако для того чтобы составить представление о распределении данной случайной величины или о ее важнейших характеристиках, нет необходимости обследо­

вать

каждый член данной обширной

совокупности.

Можно

об­

следовать Некоторую выборочную совокупность

ИЛИ

ПрОСТО

вЫ-

борку

случайно отобранных членов

объема,

достаточную

для

того, чтобы в ней были выражены существенные черты изучае­ мого распределения. Вопрос о том, каков должен быть объем выборки п для того чтобы по выборочным характеристикам можно было с достаточной точностью судить о неизвестных ха­ рактеристиках генеральной совокупности или о том, с какой

степенью точности

при заданном

объеме

выборки

можно

судить

о

характеристиках

генеральной

совокупности,

изложен

ниже

145).

 

 

 

быть репрезентативной

(пред­

 

Кроме того,

выборка

должна

ставительной),

В

силу

закона

больших

чисел

можно

утвер­

ждать, что выборка

будет репрезентативной, если ее осущест­

вить случайно. Каждый член выборки считается отобранным из генеральной совокупности случайно, если все числа имеют оди­ наковую вероятность попасть в выборку.

Выборки по технике отбора единиц из генеральной совокуп­ ности в выборочную делятся на повторные и бесповторные. Если каждая обследованная единица возвращается обратно в генеральную совокупность и, следовательно, может участвовать в дальнейшем отборе, то выборка называется повторной. Бес­ повторная выборка состоит в том, что отобранные члены обрат­ но в генеральную совокупность не возвращаются.

Если произвести группировку

вариант

по

отдельным

значе­

ниям признака

 

(дискретная

группировка)

и результат

ее

пред­

ставить рядом вариант в порядке, например,

их

 

возрастания и

рядом соответствующих частот или весов, то

получим

дискрет­

ный вариационный

ряд.

 

 

 

 

 

 

 

 

 

 

 

 

Под частотой или весом значения

признака

 

или

интервала

понимают

число

членов совокупности

с данной

 

вариантой,

или

число членов совокупности,

варианты

которых

лежат

в

данном

интервале.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример

1.

В

результате

отдельных

испытаний активности

тетрациклина

гидрохлорида

были

получены

[20]

значения

х1

ED/мг):

925,

940, 760,

905,

995,

965,

940,

925,

940,

940,

905. Располагая

значения

активности

и частоты

в

порядке

воз­

растания, получим

дискретный

вариационный ряд:

 

 

 

 

j

Частота j

760

905

925

940

965

995

 

 

 

 

 

1

2

2

3

1

1

 

 

 

 

 

Дискретный

вариационный ряд можно

представить

графиче­

ски в виде многоугольника,

называемого полигоном.

Для

этого

в прямоугольной системе координат на оси Ох откладывают

от­

дельные

значения признака

и восставляют перпендикуляры

к

оси Ох длиной, равной частоте варианты.

Затем

концы

перпен­

дикуляров соединяют прямыми (рис. 131).

 

 

 

 

 

 

 

При большом числе наблюдений дискретный

 

вариационный

ряд перестает быть удобной формой записи

статистического

ма­

териала. В этом случае производят группировку

вариант

по ин­

тервалам изменения признака (интервальная группировка)

и ре­

зультат

группировки представляют рядом

интервалов

вариации,

расположенных в порядке их возрастания,

и рядом

соответству­

ющих частот. Полученный ряд носит название

 

интервального

вариационного

ряда.

 

 

 

 

 

 

 

 

Пример 2. В таблице приведен интервальный вариационный ряд роста xt мужчин:

хь см

Частота m-L

Xh см

Частота m-L

150—154

1

170—174

22

154—158

3

174—178

11

158—162

11

178—182

3

162—166

23

182—186

1

166—170

25

 

 

По данному вариационному ряду можно судить не только о границах изменения изучаемого признака (роста мужчин), но и о характере вариации. Видно, что наибольшей частотой mt харак­ теризуется интервал роста (166—170) см.

Число интервалов, на которые следует группировать стати­ стический материал, не должно быть слишком большим, но не должно быть и малым. Практика показывает, что в большин­ стве случаев рационально выбирать число классов в зависимости от объема совокупности п, пользуясь табл. 7.

 

 

 

 

Т а б л и ц а 7

Объем совокупности п

25—40

40—60

6 0 - -100

100—200

более 200

Число интервалов

5 - 6

6—8

7 - 10

8—12

10—15

10 Лобоцкая Н. Л.

289

Чем богаче и однороднее статистический материал, тем боль­

шее число классов можно выбирать при

составлении вариацион­

ного ряда.

 

 

 

 

 

Интервальный вариационный ряд можно

изобразить графиче­

ски в виде так называемой гистограммы.

Для

этого

по

оси

абсцисс откладываются интервалы и на

каждом из классов,

как

на основании, строится прямоугольник,

площадь

которого

равна

частоте интервала.

 

 

 

 

 

§ 135. СРЕДНИЕ ЗНАЧЕНИЯ ВЕЛИЧИН И СПОСОБЫ ИХ ОПРЕДЕЛЕНИЯ

При обработке результатов экспериментальных наблюдений большое значение имеют средние величины.

Рассмотрим важнейшие средние величины.

I.Выборочная средняя арифметическая величина

В§ 128 было показано, что при большом числе испытаний среднее арифметическое значение случайной величины мало от­ личается от математического ожидания. Следовательно, выбороч­ ная средняя арифметическая величина является статистическим показателем совокупности и наивероятнейшим значением изме­ ряемой величины.

Средняя

величина,

 

вычисленная

на

основании

ряда

чисел,

каждое

из

которых

 

встречается

один раз,

называется

простой

средней

арифметической.

Для

ее

вычисления

надо

сложить

все

значения членов

ряда

хъ

хг, ...,

хп

и

сумму

разделить

на

об­

щее число

п членов

ряда.

 

 

 

 

 

я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v

 

Хі-\-Х%-\-Х3

-f-

• • -t~*n

 

t=l

 

 

 

 

Пример

3.

При

 

анализе содержания Si02 в шлаке были

получены

следующие

результаты: 28,6; 28,3; 28,4; 28,2. Сред­

ним значением

будет

величина

 

 

 

 

 

 

 

 

 

 

-

=

28,6

+

28,3

+

28,4 +

28,2

0 0

0

0

 

 

 

 

 

хв

 

 

^

 

\

 

^

'

=28,38.

 

 

 

В общем виде для распределения признака X,

представлен­

ного табл.

8,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

8

X

 

хх

 

хг

 

 

х3

 

 

 

 

Xl

 

 

 

x k

 

т

тх

пц

т3

mi

т.

е.

когда

значение

хл,

появилось

тг

раз,

значение

 

х2

пц раз, значение

xk

—• mk

раз, причем

тх + т2

+ ... + mk

= т,

вычисляется

средняя

арифметическая

взвешенная

по формуле

 

X = m i

.

.

 

.

 

2

niiXi

2 mLxi

 

 

 

 

 

X l + ЩХ" +

• • • +

Л=1

=

f=l

 

 

 

 

(1)

 

 

Е

m1-\-mi

+ . . . + mk

k

 

 

n

 

 

 

 

 

От;

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(=1

 

 

 

 

 

 

 

 

Пример 4. Измерение веса хь девочек

в

возрасте

10 лет

дало следующие

результаты:

 

 

 

 

 

 

 

 

 

 

 

 

19

20

 

21

22

23

24

25

26

27

28

29

30

Число лиц

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

частота

2

1

 

6

8

21

20

18

12

3

4

2

3

 

mL

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя арифметическая взвешенная хв веса девочек,

согласно

формуле (1),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

19-2 + 20-1 +

21 -6 + 22-8 + 23-21 + 24-20 +

25-18+26-12

+

 

 

2 + 1 + 6 + 8 + 2 1 + 2 0 + 1 8 + 1 2 + 3 + 4 + 2 + 3

 

 

 

 

 

 

 

27-3 +

28-4 + 29-2 +

30 - 3

 

 

2426

п л

0

 

 

 

2 + 1 + 6 + 8 + 2 1 + 2 0 + 1 8 + 1 2 + 3 + 4 + 2 + 3 100

= 24,26 кг.

 

 

 

 

 

Средняя арифметическая обладает важными свойствами:

 

 

1.

Алгебраическая

сумма

отклонений

значений

 

xL

от их

средней арифметической

равна

нулю.

 

 

 

 

 

 

 

 

 

 

 

 

 

і£(хів)

= 0.

 

 

 

 

 

 

Если каждое из отклонений наблюдалось тс раз, то

k _

2 mi(xi — хв) = 0.

2. Сумма квадратов отклонений значений хг от их средней арифметической хв меньше суммы квадратов отклонений от лю­ бой другой величины а той же совокупности, отличной от

средней арифметической,

а ф

хв,

2 ( * \ - 7 в ) 2 < 2 ( х ; - а ) 2

или

 

(=1

_

k

*

2 mi(xi

— х в ) 2 < 2 mi(xi — с) 2 .

10*

291

При наличии большой совокупности случайных значений измеряемой величины вычисление средней взвешенной по фор­ муле (1) становится громоздким (пример 4). В этом случае про­ ще пользоваться формулой:

2

tn^Xi—а)

 

i=i

(2)

где mi — частота; п= 2 m; ;

а — произвольно выбранное

число.

Величину а следует выбирать так, чтобы разности (xi — а) были возможно меньше, т. е. а следует взять приблизительно равным средней арифметической хв без вычислений.

Пример 5. Вычислить среднее взвешенное по данным при­ мера 4, используя формулу (2). Примем а = 24 кг и составим вспомогательную таблицу.

ХЬ кг

19

20

21

22

23

24

25

26

27

28

29

ЗО

Xi — a

- 5

—4 —3 —2 —1 0

1 2

3

4

5

6

ПІї

2

1

6

8

21

20

18

12

3

4

2

3 2=100

mlx-L — а)

— 10 —4

—18 —16 —21

0

18

24

9

16

10

18 2 = 2 6

Р е ш е н и е .

По формуле (2)

 

 

хв = 24 + ^

= 24,26 (кг).

Если при

обработке очень

большого экспериментального

материала составляется интервальный вариационный ряд, то средняя арифметическая взвешенная может быть вычислена

следующим

образом.

 

 

 

 

 

 

 

 

 

п наблюдавшихся

значений величины

Х(хх,

х2,...,

хп)

груп­

пируются

в

N интервалов

с одинаковой

длиной

интервала Ах.

Среднее

значение

интервала обозначим

через

х0

где і =

1, 2,

..., N.. Число

значений величины

X, попавшей

в данный

интер­

вал, обозначим через ть

 

тогда

средняя

арифметическая

взве­

шенная

определяется

так:

 

 

 

 

 

 

 

 

_

 

+

+

2 ~"

 

 

 

 

 

 

ххтх

х.гтг

... - f xNmN

г=1*<Ш£

 

 

 

 

 

Х„

=

m i

+ m2

+ - + ты

- N

mi

 

 

 

(3)

 

 

 

 

 

 

 

 

2

 

 

 

 

»=1

При группировке значений случайной величины по интерва­ лам может возникнуть вопрос, к какому интервалу отнести значение величин, находящееся в точности на границе двух интер­ валов. В этих случаях рекомендуют (чисто условно) считать данное значение принадлежащим в равной мере к обоим интер­ валам и прибавлять к числу того и другого интервала по - ~ .

Пример 6. Вычислить среднюю арифметическую взвешенную роста мужчин по следующим данным:

Х{, см

Число лиц

Среднее значение

xL mi

m-t

интервала

x-t

 

 

150-154

1

152

 

152

154—158

3

156

 

468

158—162

11

160

 

1760

162—166

23

164

 

3772

166—170

25

168

 

4200

170—174

22

172

 

3784

174—178

11

176

 

1936

178—182

3

180

 

540

182—186

1

184

 

184

2

100

 

 

16796

Средняя арифметическая взвешенная роста мужчин, согласно формуле (3),

 

 

2

mLxi

16796

 

 

 

 

 

N=9

 

 

== 167,96 см.

 

 

 

 

100

 

 

 

 

 

2 ті

 

 

 

 

 

 

 

 

і=і

 

 

 

 

 

 

 

Из примера 6 видно, что вычисление средней взвешенной

громоздко.

 

 

 

 

 

 

 

 

В таких

случаях проще

 

пользоваться

формулой

 

 

 

 

N

Z

 

 

 

 

 

 

хп

= а

і=і

Ах

-Ах,

(4)

 

 

 

N

 

 

 

 

 

 

 

2

m-L

 

 

 

 

 

 

i=i

 

 

 

где

Ах — ширина интервала;

а—число,

приблизительно равное

средней арифметической хв

 

без вычислений. За величину а ча­

ще

всего

принимают среднее

 

значение

серединного интервала

или

число,

которое

имеет наибольшее значение.

Пример 7. Вычислить среднее взвешенное по данным при­ мера 6, используя формулу (4). Примем а =168, ширина ин­ тервала Дх = 4 и составим вспомогательную таблицу для ве­ личин, входящих в формулу (4).

Xi а

— 16

—12

—8

—4

0

4

8

12

16

x-t — а

—4

—3

—2

—1

0

1

2

3

4

Ах

 

 

 

 

 

 

 

 

 

Ах 1

—4

—9

—22

—23

0

22

22

9

4

 

 

 

 

 

 

 

 

 

Согласно

формуле (4),

 

 

 

 

 

 

 

 

хв

= 1 6 8 + щ < 4 = 167,96

см.

 

 

 

При увеличении объема выборки п выборочная средняя со­ вокупность стремится к генеральной средней, а это означает, что выборочная средняя есть состоятельная оценка генеральной средней. Кроме того, если по нескольким выборкам достаточно большого объема из одной и той же совокупности будут най­ дены выборочные средние, то они будут приближенно равны между собой. В этом и состоит свойство устойчивости выбороч­ ных средних.

 

 

 

 

 

 

 

 

. II . Медиана

 

 

 

 

 

 

 

 

Медианой

(Me)

называется

такое

среднее

значение,

которое

делит

совокупность

значений

величин

хі

на

две равные

по ко­

личеству членов

части,

причем

в одной

из

них

все значения

xt

меньше

медианы,

а

в другой

больше.

 

 

 

 

 

 

 

 

Вариационный

 

ряд называется

ранжированным,

если

вариан­

ты

его расположены

в определенном

порядке

по

возрастающим

или

убывающим

 

значениям.

 

 

 

 

 

 

 

 

 

 

 

 

Для

ранжированного вариационного ряда при нечетном

числе

членов,

т.

е.

при п—2т-\-\,

 

 

медианой

будет

значение

сред­

него

ряда,

т.

е.

Me = x m + i .

Например,

для ряда

3,

6,

7,

9,

10,

12,

13,

15,

17

М е = 10.

 

 

 

 

т. е. п = 2т, то за ме­

Если же число членов ряда

четное,

диану

принимается

среднее

арифметическое

двух значений

хт

и хт+\,

находящихся

в середине

ряда,

т. е. Me =

*>"+*m+'.

Например,

для ряда

2, 4, 5, 7, 11, 14, 15, 18

 

 

 

 

 

 

 

 

 

 

 

 

 

Ме=Ц^

 

=

9.

 

 

 

 

 

 

 

 

 

Если в данном ряду члены, достаточно удаленные от медиа­

ны,

подвергаются малым изменениям, то медиана при этом

не

меняется, а меняется средняя арифметическая. В этом слу­

чае лучше пользоваться медианой. Так, в качестве среднего показателя какого-то вида инфекционной заболеваемости по

странам

земного

шара используете^

медиана.

 

 

 

 

 

 

 

 

 

III. Мода

 

 

 

 

 

 

Модой

(Мо)

называется

наиболее

вероятное

 

значение

слу­

чайной

величины

или

то

значение этой

величины,

частота

ко­

торого

наибольшая.

 

 

 

 

 

 

 

 

 

 

 

Пример 8. Распределение лейкоцитов по числу поглощенных

ими бактерий приведено

ниже:

 

 

 

 

 

 

 

 

Число поглощен­

0

1

2

3

4

5

6

7

8

9

10

ных бактерий

 

 

 

 

 

 

 

 

 

 

 

 

Количество лей­

180

220

241

138

90

71

40

32

20

10

2

коцитов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Наибольшая частота 241 отвечает признаку, равному 2, сле­

довательно,

Мо = 2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

IV. Средняя геометрическая

 

 

 

 

Средней

геометрической

п

положительных

величин хъ

х2,

хп

называется

положительное

значение

корня

п-й

степени

из их

произведения.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ХСР. геом. = уГХ12-...-ХП

 

' .

 

 

 

 

(5)

Среднюю геометрическую удобнее вычислять по [формуле,

полученной

логарифмированием

формулы (5):

 

 

 

 

 

 

 

' б

л е р .

геом.

 

 

п

 

 

 

 

 

 

Средняя геометрическая более точно определяет среднюю вели­ чину ряда в том случае, когда ряд отражает изменение при­ знака в геометрической прогрессии. Например, при титровании биологических, фармакологических агентов, при изучении тем­ пов прироста или снижения величины признака во времени.

Определения средней логарифмической, средней квадратической и средней гармонической читатель может найти в учеб­ никах [12], [33], [48].

§ 136. ВЫБОРОЧНАЯ ДИСПЕРСИЯ И ВЫБОРОЧНОЕ СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ, ИЛИ СТАНДАРТ

Для того чтобы охарактеризовать рассеяние значений изу­ чаемого признака выборки вокруг своего среднего значения хв, вводят характеристику, называемую выборочной дисперсией.

 

Выборочной

дисперсией

DB

называют

среднее

арифметиче­

ское

квадратов

отклонения полученных

значений

признака

от

их

среднего

значения.

 

 

п

 

 

 

 

 

 

Если

все объекты

выборки

объема

имеют

различные

зна­

чения

хъ

х«,...

хп,

то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 (*—~xBf

 

 

 

 

 

 

 

 

 

 

 

 

D» = —

n

 

 

 

 

 

(6)

 

Если

тх

объектов

выборки

имеют

значение

признака

хх,

гп2

объектов — значение

х2,... ,

mk

объектов — значение xk,

причем

тх

+

т2

+

... +

mk

= п, то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

mi(xi—xBf

 

 

 

 

 

 

 

 

 

 

 

 

D B = ' ^ L _

.

 

 

 

 

 

( 7 )

Выборочным средним квадратическим отклонением или стандартом отклонения называют корень квадратный из вы­ борочной дисперсии

ав= ] / д Г .

Дисперсию генеральной совокупности оказывается нельзя оценить по значениям выборочной дисперсии, потому что мате­ матическое ожидание выборочной дисперсии не равно генераль­ ной дисперсии DT. При этом оказывается, что M(DB) — ^~^ Dr.

Доказательство этого положения читатель может найти в учеб­

никах

[14],

[18], [19].

 

 

 

 

Чтобы математическое ожидание выборочной дисперсии было

равно

генеральной дисперсии,

достаточно

DB умножить

на

дробь

п п_

. При этом получим «исправленную

дисперсию»,

ко­

торая

обычно обозначается

через

S2 .

 

 

 

 

S2

= — ~ D B .

 

 

Исправленная дисперсия для выборки, объекты которой име­ ют разные значения, согласно (6),

п_

^ (х1

хв)2

/о\

с 2 _

 

(8 >

л — п — 1

Исправленная дисперсия для DB, определяемой по формуле (7),

 

 

 

 

k

_

 

 

 

S2

 

±±

2 mi (xt

х в ) 2

 

(9)

 

=

п 1

 

 

 

 

 

 

 

 

 

Для

оценки среднего

квадратического

отклонения

генераль­

ной совокупности пользуются

исправленным

средним

квадрати-

ческим

отклонением или

стандартом

S =

|/S2 .

 

Согласно формулам

(8)

и

(9), для

5 получаем

 

 

 

 

 

 

1

 

(10)

 

 

 

 

 

 

 

j/".J«;(*—*в)2

п 1

Сравнивая формулы (6) и (8), видим, что они отличаются лишь знаменателями. При достаточно больших п объема выборки вы­ борочная и исправленная дисперсии будут равны. На практике исправленной дисперсией пользуются в тех случаях, когда чис­ ло членов выборки п < 30.

При достаточном количестве выборочных средних хв их рас­ пределение близко к нормальному. Рассеяние значений выбороч­ ных средних вокруг средней арифметической генеральной сово­ купности (А может быть измерено своим средним квадратическим отклонением, которое получило название средней ошибки или средней квадратической ошибки (§ 129)

 

 

с - _

0

 

 

 

 

 

в

у п

 

 

 

где

о — среднее квадратическое

генеральной

совокупности. Что­

бы получить о, нужно изучить

всю генеральную

совокупность,

что

на

практике невозможно.

Кроме

того,

тогда

не было бы

смысла

определять среднюю ошибку выборки.

 

 

Однако оказалось, что для расчета

вместо о можно взять

с небольшой погрешностью исправленное среднее квадратическое

отклонение

выборочной

совокупности

при

количестве наблюде­

ний, равном

нескольким десяткам. Тогда средняя ошибка или

стандарт

отклонения

среднего

арифметического, согласно выра­

жениям

(10)

и (11),

равны:

 

 

 

 

 

' S-

= —

= V

i=i{Xt~~x°*'

(12)

 

 

 

*в

У~п

¥

п(п —

1)

Соседние файлы в папке книги из ГПНТБ