Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математические методы.doc
Скачиваний:
57
Добавлен:
30.07.2019
Размер:
7.16 Mб
Скачать

2.4.1. Показатели центральной тенденции

Ряды распределения численностей, изображенные на рис. 2.5 и 2.7, показывают, что варианты концентрируются около некоторого центрального их значения. Следовательно, можно найти такое значение варианты или абстрактное среднее число, которое будет наиболее представительной характеристикой данной совокупности.

Ряд показателей центральной тенденции включает:

  • среднюю арифметическую;

  • среднюю квадратическую;

  • среднюю геометрическую;

  • среднюю гармоническую;

  • моду;

  • медиану.

Назначение средних величин состоит в том, чтобы отразить какое-нибудь одно свойство совокупности, например, среднюю длину, среднюю массу, средний объем. То свойство (или тот признак) совокупности, которое остается неизменным при замене индивидуальных значений их средним значением, называется определяющим свойством. Средняя отражает определяющее свойство так, что образуемая с ее помощью абстрактная совокупность равных ей чисел по величине определяющего свойства не отличался от реальной.

Средняя арифметическая. Средняя арифметическая - наиболее часто употребляемый статистический показатель центральной тенденции. Она является центром тяжести распределения.

Среднюю арифметическую генеральной совокупности обычно обозначают , а ее выборочную оценку, т. е. среднюю арифметическую выборочных наблюдений - М (или ). Она имеет ту же размерность, что и варианты.

Средняя арифметическая получается путем деления суммы всех вариант (x1, x2, ..., xn) на объём выборки:

M = (x1+ x2 + ... + xn)/N= (x)/N, (2.1)

где

N - общее число вариант;

 - знак суммирования.

Без указания в знаке пределов суммирования производится суммирование всех измеренных (наблюденных) вариант ряда от 1 до N.

Пример 2.4. Для вариант (предположим, это высота деревьев, м) 15, 20, 20, 20, 25

M=(15+20+20+20+25)/5 = 100/5 = 20 м.

Для ряда, разделенного на классы, т. е. для вариационного ряда, среднюю арифметическую вычисляют как взвешенную величину:

M= (n1x1+ n2x2 + ... + nnxn)/N= (nx)/N, (2.2)

где

x1, x2, ..., xn - классовые варианты (срединные значения классов);

n1, n2, ..., nn - частоты соответствующих классов;

N - общее число вариант (объем ряда) или общее число наблюдений.

Группируя варианты рассмотренного примера 2.4 по их величине, получим следующий ряд:

x

15

20

25

n

1

3

1

M= (1*15+3*20+ 1*25)/5 = 20 см.

В дальнейшем рассмотрим другие формулы вычисления арифметической средней, основанные на использовании ее основного свойства. Это свойство состоит в том, что сумма отклонений всех вариант от арифметической средней равна нулю. Оно вытекает из содержания средней арифметической как центра тяжести ряда. Сумма вариант, которые больше средней M, равна сумме вариант, которые меньше ее.

Пример 2.5 использована функция СРЗНАЧ() MS Excel для расчета средней арифметической своих аргументов.

Синтаксис: СРЗНАЧ(число1; число2; ...), число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее.

Замечания:

  • Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.

  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются.

  • Вычисляя средние значения ячеек, следует учитывать различие между пустыми ячейками и ячейками, содержащими нулевые значения, особенно если не установлен флажок "Нулевые Значения" на панели "Вид" в диалоговом окне "Параметры". Пустые ячейки не учитываются, но нулевые ячейки учитываются. Чтобы открыть диалоговое окно "Параметры", выберите команду "Параметры" в меню "Сервис".

Н а рис. 2.8 приведено окно программы MS Excel, демонстрирующее применение функции СРЗНАЧ() для определения выборочной средней арифметической M распределения диаметров деревьев сосны, записанных в ячейках А2-А21 (см. пример 2.1). СРЗНАЧ(A2:A21) равняется 35,5 см.

Рис. 2.8.

Средняя геометрическая. При рассмотрении среднего темпа роста изучаемого признака средняя арифметическая не пригодна. Вместо нее вычисляют среднюю геометрическую Mg (или g) по формуле:

Mg = (2.3)

где

x1, x2, ..., xn - темпы роста (величины, показывающие, во сколько раз увеличивался признак от периода к периоду);

n - число периодов.

При n>2 формулу удобнее применять в логарифмическом виде:

lgMg = (lgx1+ lgx2 + ... + lgxn)/n. (2.4)

Если данные, для которых вычисляют среднюю геометрическую, должны быть взвешены, то формула имеет вид:

lgMg = (n1lgx1+n2 lgx2 + ... +nn lgxn)/N. (2.5)

Исходя из содержания формул (2.4) и (2.5), среднюю геометрическую называют также средней логарифмической, так как ее логарифм есть арифметическая средняя логарифмов составляющих величин.

Поясним применение средней геометрической примером.

Пример 2.6. Измеренное растение в конце 1-й, 2-й, 3-й и 4-й декад роста имело объем в дм3: 1, 2, 8, 64.

Относительный темп прироста как отношение результатов двух последо­вательных наблюдений выразится числами 2/l=2; 8/2=4; 64/8=8. В формулах (2.3)-(2.5) они обозначены x1, x2, ..., xn. Средняя геометрическая чисел 2, 4, 8 (n=3) no формуле (2.3) равна:

Mg =

По формуле (2.4) имеем:

lg Мg = (1/3) (0,3010 + 0,6021 + 0,9031) = 0,6020.

Если бы значения темпа прироста, т. е. варианты 2, 4, 8, были получены на основе разного числа наблюдении, например, соответственно n1=5, n2=3, n3=2, n=N=10, то, применяя формулу (2.5), имеем:

lgMg = (50,3010 + 30,6021 + 20,9031)/10 = 0,5118,

Mg = 3,25.

Отметим, что арифметическая средняя из дат 2, 4, 8 равна 4,7

M= 14/3 = 4,7.

Для примера с разными весами этих дат она равна M=3,8, тогда как Mg=3,25.

Проверим пригодность двух видов найденных средних - геометрической и арифметической - для выражения среднего темпа роста. Определяющим свойством здесь будет объем, достигаемый к концу последнего периода. Он равен первоначальному объему, умноженному последовательно на x1, x2, x3, т. е. на числа 2, 4, 8. Эти числа показывают, во сколько раз увеличивался объем за каждый последующий период.

Для примера, в котором каждое значение x получено на основе одного или равного числа наблюдений, истинный объем в конце третьего периода равен 1дм248=64 дм3.

Используя среднюю геометрическую, имеем такое же значение объема 1дм444=64 дм3.

Применение средней арифметической дает объем к концу третьего периода, равный 1дм4,74,74,7 = 103,8 дм3, что не соответствует действительности.

Следовательно, для средней арифметической величины характерно постоянство суммы вариант, а для геометрической средней характерно равенство произведений из первоначальных данных измерений (x1, x2, ..., xn) и из геометрических средних Mg1, Mg2, ..., Mgn, представленных n раз.

Пример 2.7 использования функции СРГЕОМ() MS Excel для расчета среднего геометрическое значений массива или интервала положительных чисел. Например, функцию СРГЕОМ можно использовать для вычисления средних темпов роста, если задан составной доход с переменными ставками.

Синтаксис: СРГЕОМ(число1;число2; ...), где число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее геометрическое. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Замечания:

  • Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.

  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки с нулевыми значениями учитываются.

На рис. 2.8 приведено окно программы MS Excel, демонстрирующее применение функции СРГЕОМ() для определения выборочной средней геометрической Mg распределения диаметра деревьев сосны, записанных в ячейках А2-А21 (см. пример 2.1). СРГЕОМ(A2:A21) равняется 35,0.

Средняя квадратическая. В лесном хозяйстве нередко приходится находить сумму площадей сечений деревьев в древостое располагая распределением числа деревьев по ступеням толщины.

Так, для ряда распределения 94 деревьев по ступеням толщины:

X

16

20

24

28

32

36

40

N

4

7

8

28

20

18

9

n

4

11

19

47

67

85

94

получена сумма площадей сечений всех деревьев равная 69586 см2. Средний арифметический диаметр по формуле (2.2) равен 30,08 см. Площадь сечения g дерева, соответствующая этому диаметру, равна 710,7 см2, а площадь сечений 94 деревьев, найденная как про­изведение gN=G, составляет 66806 см2. Она на 4% меньше истинной площади сечений.

Такое же расхождение наблюдалось бы и в объеме деревьев. Определяющее свойство - площадь сечения всех деревьев древостоя выражается формулой:

G = (/4) (n1d12 + n2d22 +…+ nndn2),

где

=3,14;

n1 n2, ..., nn - количество деревьев в ступенях толщины;

d1, d2, ..., dn - диаметры ступени толщины, см.

Очевидно, что величина G пропорциональна не диаметрам, а их квадратам.

Поэтому истинная площадь сечений может быть получена через число деревьев и величину среднего квадратического диаметра.

Mq = (2.6)

или

Mq = , (2.7)

где

x2 - квадраты диаметров;

n - численности деревьев в классах или группах;

N - общее число деревьев в выборке.

Найденный по формуле (2.7) среднеквадратический диаметр равен Mg=30,7 см. Площадь сечения, соответствующая этому диаметру, равна 740,3 см2, а сумма площадей сечений 94 таких деревьев, равна 69586 см2.

Таким образом, для получения истинного значения площади сечений или объемов всех деревьев посредством среднего дерева и числа деревьев диаметр дерева - модели следует находить как среднюю квадратическую величину. В лесной таксации его находят через среднюю арифметическую площадь сечения, что то же самое.

Средняя гармоническая. Для вычисления средней характеристики признаков, которые представляют собой отношение двух других варьирующих величин, пользуются средней гармонической. Среднюю гармоническую определяют по формуле:

Mh = N/(1/x), (2.8)

или

Mh = N/(n/x), (2.9)

где

n - веса отдельных значений.

Так, например, при проведении рубок главного пользования пять лесозаготовительных бригад в одинаковых условиях заготовили за рабочую смену следующие количество древесины (кбм):

1-150, 2-180, 3-130, 4-200, 5-160.

Средняя производительность труда в смену составляет:

Mh = 5/(1/150+1/180+1/130+1/200+1/160) = 160,4.

Мода и медиана. Модой (Мо) называют наиболее часто встречающуюся варианту. В нормально распределенных совокупностях мода численно равна средней арифметической.

В положительно асимметричных рядах Мо>М, а в отрицательно асимметричных Мо<М.

В ряду:

X

16

20

24

28

32

36

40

n

4

7

8

28

20

18

9

Mo=28 см.

Медианой (Mе) называют значение признака, занимающее срединное положение в ряду и делящее все распределение на две равные по численности части.

Среди значений 5; 6; 7; 8; 9 Mе = 7.

Для вариационного ряда

Me = x0 + k[( S1-S2 ) / n ], (2.10)

где

x0 - значение нижней границы класса, в котором содержится половина накопленных частот;

k - интервал;

S1 - полусумма общей численности ряда, S1 =N/2;

S2 - накопленная частота, предшествующая группе, в которой находится медиана.

Для ряда распределения 94 деревьев по ступеням толщины Ме = 30

X

16

20

24

28

32

36

40

n

4

7

8

28

20

18

9

n

4

11

19

47

67

85

94

Me = 26 + 4 [(47 - 19)/28] = 30 см.

Пример 2.8 использования функции МОДА() и МЕДИАНА() MS Excel для расчета моды и медианы, которые являются характеристиками центральной тенденции выборки. Они не имеют своего аналога в генеральной совокупности и поэтому рассматриваются как показатели относительного характера.

Функция МОДА() возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Так же, как и функция МЕДИАНА, функция МОДА является мерой взаимного расположения значений.

Синтаксис: МОДА(число1;число2; ...), где число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется мода. Можно использовать один массив или одну ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Замечания:

  • Аргументы должны быть числами, именами, массивами или ссылками, которые содержат числа.

  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.

В наборе значений мода - это наиболее часто встречающееся значение; медиана - это значение в середине массива; среднее - это среднее арифметическое значение. Ни одно из этих чисел не характеризует в полной мере то, в какой степени центрированы данные. Пусть данные сгруппированы в трех областях, одна половина данных близка к некоторому малому значению, а другая половина данных близка к двум другим большим значениям. Обе функции СРЗНАЧ и МЕДИАНА могут вернуть значение из относительно пустой середины, а функция МОДА скорее всего вернет доминирующее малое значение. МОДА({5,6; 4; 4; 3; 2; 4}) равняется 4.

Функция МЕДИАНА() возвращает медиану заданных чисел. Медиана - это число, которое является серединой множества чисел, то есть половина чисел имеет значения большие, чем медиана, а половина чисел имеет значения меньшие, чем медиана.

Синтаксис: МЕДИАНА(число1;число2; ...), где число1, число2, ... - это от 1 до 30 чисел, для которых определяется медиана.

Замечания:

  • Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Microsoft Excel проверяет все числа, содержащиеся в аргументах, которые являются массивами или ссылками.

  • Если аргумент, который является ссылкой, содержит пустые ячейки, текстовые или логические значения, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются.

  • Если в множестве четное количеств чисел, то функция МЕДИАНА вычисляет среднее двух чисел, находящихся в середине множества. См. второй из следующих примеров.

Примеры:

МЕДИАНА(1; 2; 3; 4; 5) равняется 3.

МЕДИАНА(1; 2; 3; 4; 5; 6) равняется 3,5, среднее 3 и 4.

Расчет Mo и Me с использованием MS Excel для исходных данных примера 2.1 представлены на рис. 2.8.