Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Вариационная статистика

.pdf
Скачиваний:
50
Добавлен:
11.03.2016
Размер:
6.2 Mб
Скачать

Такое размещение значений признака в порядке их возра-·

стания (или убывания) с указанием числа повторяемости их

называют в а р и а ц и о н н ы м ряд о м. Значения признака Х,

построенные в

ряд, называют класс-вариантами, или просто

вариантами, а

числа

повторяемости отдельных вариант

назы­

вают ч а с т о т а м и,

или ч и с л е н н о с т я м и. Общее

число

вариант называют о б ъ е м о м ряд а. Его обозначают бук­

вой N (иногда п), в настоящем пособии принято N=n1+n2+

+ ... +nn.

§ 3. ПОСТРОЕНИЕ ВАРИАЦИОННЫХ РЯДОВ

Вариационный ряд получают путем определения величины

класса или интервала, размещения классов и распределения

в них всех единиц наблюдений.

Величину интервала определяют по формуле

k = (ХтахXmlп)fi, (III.1)

где Xmax. Xmin- соответственно, наибольшее и наименьшее зна­

чения вариант; i - предварительно принимаемое число классов

(обычно от 7 до 13).

Число классов можно определить, исходя из выражения: i= = 1+3,3221g N, где N- число наблюдений.

Тогда величина класса определится:

k = (Хтах- Xmiп)/(1-+ 3,3221g N). (III.2)

Результат, получаемый по формуле (111.2), не следует рас­

сматривать как однозначное решение вследствие эксперимен­

тальной основы формулы. Следует иметь в виду, что при боль­ шом k наблюдается неравномерное распределение вариант внут­

ри класса, а при маломнеправильность в строении кривой

распределения.

В качестве k принимают круглое число. Действительное число

классов определится как частное от Xmax-Xmin на величину

класса k. Округление числа классов делают в большую сторону. Величина интервала для диаметров сосны (см. табл. 2), уста­

новленная по этой формуле, оказывается равной

k = (42,0- 15,5)/(1 +3,3221g94) =

= 26,5/(1 + 3,322·1,973) = 3,51 см.

Округляем до 4,0 см".

Величина интервала для высот при 10 классах равна:

k = (29,8 -19,6)/10 = 10,2/10 = 1,02 ~ 1 м.

l

Действительное количество классов оказывается равным:

,(округляем в большую сторону)

по

диаметру

 

26,5: 4= 7,

по

высоте

. . . . . . . .

10,2: 1= 11

22

Границы и срединные значения классов лучше устанавливать

следующим образом. В качестве·среднего значения первого клас­

са принимают число кратное классовому промежутку k и бли­ жайшее к наименьшей (в возрастающем ряду) или наибольшей (в убывающем ряду) вариантам ряда распределения. Для диа­

метров при составлении возрастающего ряда таким числом ока­

зывается 16,0. Срединные значения последующих классов полу­

чают путем последовательного прнбавления величины интерва­ ла. Для ряда диаметров они окажутся равными: 20, 24, 28

и т. д. Эти значения называют классовыми вариантами, так как

они представляют собой классы.

Нижние границы классов определяют путем вычитания поло­

вины величины интервала из срединных значений каждого клас­

са, а верхние границыпутем прибавления этой половины. Для первого класса получим соответственно числа 14,0 и 18,0; для второго-18,0 и 22,0 (см. таб.л. 3).

При таком указании границ классов ваблюденные значения, совпадающие с границей интервала, должны быть разделены

пополам, и в каждом из смежных классов помещена половина

их. Чтобы ис-ключить перекрытие верхней границы предыдущего класса с нижней границей последующего класса (например, чисел 18,0 и 18,0, входящих в первый и второй классы), нижние

границы классов увеличивают на величину, равную точности

измерения признака. Для диаметра она равна 0,1 см, для высоты 0,1 м. Можно верхние границы классов уменьшить на такую же величину и таким образом получить значения границ классов:

14,0-17,9; 18-21,9 и т. д. После того, как положение. границ

классов фиксировано, находят и указывают в таблице срединные

их значения. Они равны полусумме принятых значений нижней

и верхней границ каждого класса. В зависимости от указанных вариант фиксирования верхних и нижних границ получим в качестве срединных значений числа 16, 20, 24 и т. д., или 16,05;

20,05; 24,05 И Т. Д., ИЛИ 15,95; 19,95; 23,95 И Т. Д.

Срединные значения в виде некруглых чисел не должны сму­

щать исследователя, так как это их качество не связано с ослож­

нением последующих расчетов. Однако для целей иллюстрации

ианализа предпочтительнее иметь ряды распределения с кру~

лыми значениями классовых вариант (для диаметра, например, числа 16, 20, 24 и т. д.). Во многих случаях, как в нашем, изме­

нение срединного значения от круглых чисел настолько мало, что

им можно пренебречь и указать срединные значения границ

в круглых числах, при любом из вышеуказанных написаний верхней и нижней границ.

После того как положение классов установлено, приступают

к распределению вариант по классам. Варианты распределяют

последовательно, просматривая их, начиная с 1-й, и помещая в тот или иной класс в соответствии с ее размером. Рекомендуется

23

.-:)

следующая система записи вариант в классе, в порядке их

нарастания (от l до 10).

Варианты

1

2

3

4

5

5

7

8

9

10

Отметки

• •

.: :: 1: t: Z::

t:2

И

181

В табл. 2 приведены результаты измерений диаметров и вы­ сот 94 стволов сосны.

2. Ведомость измеренных диаметров и высот ство.nов сосны

.N!

Дна-

Высо-

Дна-

Высо-

.Nr

ДнаВысо-

.N!

Дна-

Высо-

дере-

метр,

та,

дере-

метр,

та,

дере-

метр,

та,

дере-

метр,

та,

ва

см

м

ва

см

м

ва

см

м

в а

см

м

1

28,5

26,5

24

36,5

27,6

47

16,5

22,6

70

31,2

25,6

2

28,5

25,8

25

42,0

27,0

48

22,0

27,6

71

31,5

29,6

3

29,2

28,7

26

36,5

27,3

49

39,0

28,4

72

J1,2

25,6

4

22,5

22,7

27

15,5

19,6

50

34,0

29,6

73

30,0

29,6

5

34,5

29,6

28

38,5

29,4

51

37,5

29,8

74

27,5

28,5

6

32,5

28,1

29

31,0

29,0

52

36,0

29,8

·75

29,7

27,9

7

30,0

25,9

30

34,2

29,0

53

33,0

28,6

76

23,0

25,0

8

32,5

27,6

31

38,0

29,8

54

40,7

27,7

77

19,5

20,5

9

41,0

28,6

32

33,5

29,1

55

36,4

28,2

78

28,0

25,8

10

28,5

25,6

33

25,2

25,8

56

28,5

24,8

79

28,7

28,6

11

29,2

27,8

34

42,0

29,6

57

31,7

26,8

80

37,2

29,1

12

31,0

27,6

35

31,5

26,8

58

29,5

27,2

81

26,5

26,6

13

27,5

27,8

36

35,7

28,4

59

26,0

26,6

82

41,5

28,6

14

29,5

28,6

37

27,5

26.2

60

28,0

25,9

83

35,5

27,6

15

37,5

28,0

38

29,0

25,8

61

27,7

23,8

84

27,0

27,6

16

34,0

28,6

39

28,0

28,0

62

32,0

27,7

85

28,5

26,6

17

20,5

22,6

40

23,0

27,0

63

32,6

28,0

86

31,5

29,0

18

17,0

21,7

41

26,1

27,5

64

21,0

27,0

87

36,0

28,6

19

26,4

28,1

42

18,0

24,0

65

28,5

28,0

88

36,5

29,5

20

29,0

28,4

43

38,5

28,6

66

34,2

27,0

89

29,0

27,5

21

37,2

29,3

44

41,5

29,6

67

26,0

26,0

90

20,0

24,0

22

24,5

26,4

45

33,0

25,6

68

34,2

29,6

91

20,5

20,6

23

23,5

26,0

46

33,5

28,5

69

31,2

27,9

92

34,0

29,5

 

 

 

 

 

 

 

 

 

93

19,7

23,6

 

 

 

 

 

 

 

 

 

94

28,0

21,6

Результаты измерений разнесены в табл. 3 и 4. По окончании

разноски вариант ряды их подсчитывают отдельно для каждого

24

класса и обозначают числами. Эти числа (численности) показы­ вают, как часто встречались варианты в классах. Общее число

численностей должно равняться числу измеренных значений при­

знака. В нашем случае ~n=94.

3. Рабочая таблица распределения количества стволов сосны

по классам диаметра

 

Средин-

1

1астота (чнслu стволов)

 

 

 

 

 

 

 

Грашща

ное эна-

 

 

 

 

1 "циф-

 

 

 

 

 

t\ласса, см

чение

"

 

 

 

 

рабочей заnнси

 

1~ласса,

 

 

 

.

 

 

рах

 

см

 

 

 

 

14,0-18,0

1G

 

. .

 

4

18,0-22,0

20

 

r:::

 

 

7

22,0-26,0

24

 

D

 

 

8

26,0-30,0

28

1:8%

 

J:!:S:I

t:1

28

30,0-34,0

32

 

l8I

 

%81

20

34,0-38,0

36

 

I81

 

D

18

38,0-42,0

40

 

t2j

 

 

9

 

~

 

 

 

 

94

4. Рабочая таблица распределения количества стволов сосны

по классам высоты

 

Средин­

Гр<I1-ШЦ3

ное зна­

чение

нласса, м

класса,

 

 

м

19,5-20,5

20

20,5-21,5

21

21,5-22,5

22

22,5-23,5

23

23,5-24,5

24

24,5-25,5

25

25,5-26,5

2G

26,5-27,5

27

27,5-28,5

28

28,5-29,5

29

29,5-30,5

30

Частота (чнсло стnолов)

 

в рабочей записн

1

в циф-

 

рах

 

 

 

1

 

2

 

2

 

3

 

4

 

 

 

 

 

 

 

 

 

13

 

 

 

14

25

18

10

---------1------l-------------------------------------------

94

25

Для последующего статистического анализа результатов

наблюдений из рабочих таблиц используют данные двух С1~лб­ цов: срединные значения классов (классовые варианты), обозна­ ченные буквой Х, и значения частот, обозначенные буквой n (см. формулу III.2 и пояснения к ней). Иногда значения классов ука­

зывают в таблицах записью начальных вариант, сопровождая их

постановкой черточек. Для диаметров значения классов были бы записаны так: 14,0; 18,0; 22,0 и т. д. За расчетные значения

классовых вариант, однако, и в этом случае принимают средин­

ные значения классов. Полученные таким образом двойные ряды

чисел, состоящие из обозначения классов и соответствующw:х им

частот, называют ряд а м и распре д е л е н и я числе н н о­

с т ей,

или вар и а ц и о н н ы м и

ряд а м и

(табл. 5, 6).

 

 

5. Вариационный ряд диаметров стволов сосны

 

 

Классовые

варианты

Частота n

Классовые варианты

 

n

х. см

11

х. см

 

Частота

16,0

4

 

32,0

 

20

 

20,0

7

 

36,0

 

18

 

24,0

8

 

40,0

 

9

 

28,0

28

 

 

 

94

 

 

б.

Вариационный ряд высот стволов сосны

 

 

Классовые

Частота n

Классовые

Частота n

варианты Х,

варианты Х,

Классовые

Частота n

варианты Х,

м м м

20,0

1

24,0

4

28,0

25

21,0

2

25,0

2

29,0

18

22,0

2

26,0

13

30,0

10

23,0

3

27,0

14

~

94

1

Дискретные ряды составляют аналогичным образом. Грани­

цы классов принимают, например, такие значения: 8-10; 11-13; 14-16 и т. д., а срединные значения 9, 12, 15 и т. д. В других

.случаях срединные значения могут быть и дробными числами.

Когда размах варьирования мал (6-10 единиц варьирующего

.признака), в класс объединяют наблюдения, имеющие одинако­

вые значения.

26

§ 4. ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ РЯДОВ РАСПРЕДЕЛЕНИЯ ЧИСЛЕННОСТЕП

Составленные ряды распределения часто изображают графи­ чески, чтобы нагляднее представить особенности распределения чис.1енностей. Наиболее распространенными графиками явля~.

ются гистограмма, многоугольник распределения, кумулята

и огива (рис. 4 и 5). Кумулята и огива отражают распределение накопленных (кумулированных) численностей или частот.

q

о

{i

n

~JO

!::Z5

~го

~1.1

~10

'::>:.;

Рис. 4. Гистограмма (а) и многоуголь· ник распределения (б)

:1

n

~100

~ 80

~50

~4

с..;

-§2

Рис. 5. Кумулята (а) и огива (б)

Г л а в а IV

СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ (ПОКАЗАТЕЛИ) РАСПРЕДЕЛЕНИЯ ЧИСЛЕННОСТЕй

§ 1. ПОКАЗАТЕЛИ ЦЕНТРАЛЬНОЯ ТЕНДЕJЩИИ.

СРЕДНИЕ ВЕЛИЧИНЫ.

ОПРЕДЕЛЯЮЩЕЕ СВОйСТВО СОВОКУПНОСТИ

Ряды распределения численностей, приведеиные в табл. 5, 6

и изображенные на рис. 4 и 5, показывают, что варианты кон·

центрируются около некоторого центрального их значения. Сле­

довательно, можнсi найти такое значение варианты или абстракт­

ное среднее число, которое будет наиболее представительной

характеристикой данного коллектива.

27

Существует ряд характеристик или показателей центральной

тенденции, ряд средних величин: средняя арифметическая, сред­

няя квадратическая, средняя геометрическая, средняя гармони­

ческая, мода и медиана. Назначение средних величин состоит

в том, чтобы отразить какое-нибудь одно свойство коллектива, например, среднюю длину, среднюю массу, средний объем

изучаемой группы индивидуумов.

Тот признак или то свойство совокупности, которое остается uеизменным при замене индивидуальных значений их средним

значением, называется

определяющим

с в ой с т в о м.

Средняя должна отразить

определяющее свойство

так, чтобы

образуемый с ее помощью

абстрактный коллектив

равных

ей

чисел по величине определяющего свойства не

отличался

от

реального. Из этого требования средней вытекает следующее ее

общее определение. Средняя есть величина признака, характери­

зующая индивидуумы в абстрактном уравненном коллективе,

замещающем реальный коллектив, но при этом сохраняющем

неизменным его определяющее свойство (общую длину, массу,

объем и т. д.).

К этому определению мы будем обращаться каждый раз, когда будем обсуждать реальное содержание различных

средних.

Средняя арифметическая. Средняя арифметическаянаибо­

лее часто употребляемый статистический показатель централь­ ной тенденции. Она является центром тяжести распределения.

Средняя арифметическая была бы значением величины в точке

равновесия кривой численностей, если бы модель кривой была сделана в виде массивной формы.

Среднюю арифметическую генеральной совокупности обычно обозначают fl, а ее выборочную оценку, т. е. ,среднюю арифме­

тическую выборочных наблюдений-х (или М). Она имеет то же

наименование, что и варианты.

Средняя арифметическая получается от деления суммы всех

вариант (Xt, Х2, ..., Хп) на число N:

 

х= 1 + Х2 + ... + Хп)/N= (~X)(N,

(IV.l)

где N- общее Число вариант; ~-знак суммирования.

Здесь и в последующем его применении без указания преде­

лов суммирования он означает, что должно быть произведено суммирование всех измеренных (наблюденных) вариант ряда

от 1 до N. Для вариант (предположим, это длина растений, см)

3,4, 4,4, 5

х = (3 + 4 + 4 +4 +5)/5 = 20/5 = 4 см.

Реальный смысл средней арифметической и ее главное назна­

чение лучше уяснить, если данное выше определение всем сред­

ним применить к рассматриваемому примеру ее расЧета.

28

Благодаря полученной средней возможно реальный коллек­

тив длин растений из Xt, Х2, Хз, Х4, Xs (N=5) заменить

абстрактным выравненным коллективом из х, х, Х, Х, х- (N=5),

не изменяя при этом определяющего свойства, выражаемого 1:Х

и также Nх, откуда полученох (1:Х)N (см. IV.l).

Для ряда, разделенного на классы, т. е. для вариационного

ряда, среднюю арифметическую вычисляют как взвешенную

величину:

х= (n 1X 1 1- n~X~ + ... + nnXп)i(n1 + n~ +

+ ... + пп) = (~ nX)fN,

(IV.2)

где Х1, Х2, ... , Х"- классовые варианты (срединные

значения

классов); n 1, n2, •.. , nпчастоты соответствующих классов; N- общее число вариант (объем ряда) или общее число наблю­

дений.

Группируя варианты рассмотренного примера по их величи­

не, получим следующий ряд:

Х:3 4 5

n: l 3 l

x=(l·3+3·4+1·5);5=4 см.

В дальнейшем рассмотрим другие формулы вычисления

.арифметической средней, основанные на использовании ее основ­

ного свойства. Это свойство состоит в том, что сумма отклоне­ ний всех вариант от арифметической средней равна нулю. Оно

вытекает из содержания средней арифметической как центра

тяжести ряда. Сумма вариант, которые больше среднейХ, равна

сумме вариант, которые меньше ее.

Средняя геометрическая. При изучении среднего темпа роста

изучаемого признака средняя арифметическая не пригодна. Вме­ сто нее вычисляют среднюю геометрическую Mg (или Xg) по фор-

муле:

 

 

~

-

!!:!

Х1Х2Хз о о. xn'

(IV.3)

Xg =

v

где Xt, Х2, ... , Xn- темпы роста (величины,

показывающие, во

сколько раз увеличивалея признак от Периода к периоду); n -

число периодов.

При n>2 формулу удобнее применять в логарифмическом

виде:

 

 

-

1

(IV.4)

.lg Xg =

n (lg х! + lg х2 + . о. + lg Хп).

Если данные, для которых вычисляют среднюю геометриче­

скую, должны быть взвешены, формула в логарифмическом виде

будет:

(IV.S)

29

Исходя из содержания формул (IV.4) и (IV.5), среднюю гео­ метрическую называют также средней логарифмической, так как ее логарифм есть арифметическая средняя логарифмов состав­

ляющих величин.

Следующий пример поясняет применение средней геометриче­

ской.

П р и м е р. Измеренное растение в конце 1, 2, 3 н 4-й декады роста

имело объем в дм3: 1, 2, 8, 64.

Относительный темп прироста, как отношение ~езультатов двух последо­

вательных наблюдений, выразится

числами

2/1 =2;

/2=4; 64/в=8. В формулах

(IV.3)-(IV.5) они обозначены Х1, Х2, Хэ.

 

 

 

 

 

Средняя геометрическая чисел

2, 4, 8

(n=3)

по формуле

(IV.3)

равна

-

v--

=

4.

 

 

 

Xg =

2·4·8

 

 

 

 

По формуле (IV.4) имеем:

 

 

 

 

 

 

lg хк = (1/3) (О,зою + 0,6021 + 0,9031) = 0,6020.

 

 

Средняя геометрическая, как

антилогарифм числа 0,6020, равна 3,999 ~ 4.

Если бы значения темпа прироста, т. е. варианты 2, 4, 8, были получены

на основе разного числа наблюдений, например,

соответственно

n 1 = 5,

n2 = 3.

n3 =2, ~n=N=10, то, применяя формулу (IV.5), имели бы

 

 

lg хк = (5·0,3010 + 3·0,6021 + 2·0,9031)/10 = 0,5118,

Xg = 3,25.

Отметим, что арифметическая средняя из дат 2, 4, 8 равна

х = 14/3 = 4,7.

Для примера с разными· весами этих дат она равна х=3,8, тогда как

х8=3,25.

Проверим пригодность двух видов найденных среднихгеометрической

и арифметической - для выражения среднего темпа роста. . Определяющи~1 свойством здесь будет объем, достигаемый к концу последнего периода. Он равен первоначальному объему, умноженному последовательно на отношения

Х1, Х2, Хз, т. е. на числа 2, 4, 8. Эти числа показывают, во сколько раз

увеличивалея объем за каждый последующий период.

Для примера, в котором каждое значение Х получено на основе одного

или равного числа наблюдений, истинный объем в конце третьего периода

равен 1 дмХ2Х4Х8=.64 дм3.

 

 

 

 

 

Используя среднюю геометрическую, имеем

таJ(ое же

значение

объема

1 дмХ4Х4Х4=64 дм3

 

 

 

 

 

 

Применеине

средней

арифметической

дает

объем

к

концу

третьего

периода, равный

1 дмХ4,7Х4,7Х4,7=103,8

дм3,

что не

отражает

действн­

тельности.

 

 

 

 

 

 

 

Следовательно, для

геометрической средней

характерно ра­

венство произведений из первоначальных данных измерений (Х1 ,

Х2, ..., Xn) и ИЗ геометрических средних Xg, Xg, ... , х~. представ­

ленных n раз.

Для средней арифметической величины было характерно

постоянство суммы вариант или дат.

Средняя квадратическая. В лесном хозяйстве нередкс прихо­

дится находить сумму площадей сечений деревьев в дrевостое,

зная средний диаметр одного среднего дерева и число деревьев.

'

30

Какую величину должен представлять диаметр, чтобы он был репрезентативным показателем в указанной цели?

Для ряда диаметров 94 деревьев (N =94, табл. 2) сумма пло­ щадей сечений всех деревьев равна 69 586 см2. Средний ариф­

метический диаметр по формуле (IV.2) равен 30,08 см. Площадь

сечения g дерева, соответствующая этому диаметру, равна

710,7 см2, а площадь оснований 94 деревьев, найденная как про­

изведение gN=G составляет 66806 см2. Она на 4% меньше

истинной площади сечений.

Такое же расхождение наблюдалось бы и в объеме деревьев.

Определяющее свойствоплощадь сечения всех деревьев

древостоя выражается формулой:

1

 

,.

О=

(1t/4) (n1di + n2d~ + ... + nпd~).

 

 

где

л=3,14;

n1,

n2, ... , nпчисло деревьев в классах; d1,

d 2,

••• , dn- диаметры деревьев в классах. Очевидно, что G про­

порционально не диаметрам, а их квадратам.

Поэтому истинная площадь сечений может быть получена

через число деревьев и величину среднего квадратического диа­

метра.

(IV.7)

где Х2 - квадраты диаметров; n - численности деревьев в клас­

сах или группах; N- общее число деревьев в выборке.

Найденный по формуле (IV.7) среднеквадратический диа-

метр равен Xg=30,7 см. Площадь сечения, соответствующая это­

му диаметру равна 740,3 см2, а сумма площадей сечений 94 та­ ких деревьев, равна 69 586 см2.

Таким образом, для получения истинного значения площади

сечений или объемов всех деревьев посредством среднего дерева

и числа деревьев диаметр дерева - модели следует находить как

среднюю квадратическую величину. В лесной таксации его нахо­ дят через среднюю арифметическую площадь сечения, что то же

самое.

Средняя гармоническая. Для вычисления средней характе­

ристики признаков, которые представляют собой отношение двух

других варьирующих величин, пользуются средней гармониче­

~кой. Среднюю гармоническую определяют по формуле:

~ = Nj(~ 1/Х),

(IV.8)

или xh = Nj(~njx),

(IV.9)

где n - веса отд~льных значений.

Мода и медиана. Модой (Мо) называют наиболее часто

встречающуюся варианту. В нормально распределенных сово­ купностях мода численно равна средней арифметической.

31