Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математические методы.doc
Скачиваний:
57
Добавлен:
30.07.2019
Размер:
7.16 Mб
Скачать

2.4.2. Показатели вариации

Средняя величина не дает достаточного представления о свойствах изучаемой совокупности. Являясь показателем центральной тенденции, т. е. наиболее представительной характеристикой изучаемого объекта, она не характеризует степени разнообразия (изменчивости, варьирования) составляющих его единиц. Действительно, ряды из вариант 1, 3, 4, 5, 7 и 3, 4, 4, 4, 5 характеризуются одинаковой средней арифметической х=4, но отличаются по степени вариации значений признака.

Определение меры изменчивости признака или качества рассматриваемого объекта или явления считается не менее важной задачей, чем характеристика средних величин. Более того, доверие к средней величине может быть определено лишь постольку, поскольку дана оценка варьированию величин в рассматриваемой совокупности вариант.

Главной целью статистических методов является выявление вариации, которая характеризуется рядом показателей:

  • размах варьирования;

  • дисперсия;

  • среднее квадратическое отклонение;

  • коэффициент вариации.

Размах варьирования. Разность между наибольшим и наименьшим значением признака называется размахом, который является грубым показателем варьирования признака. В двух вышеприведенных рядах, состоящих из пяти вариант, он равен 7-1=6 и 5-3=2, т. е. указывает, что в общем вариация в первой группе цифр в 3 раза больше, чем во второй. Однако, опираясь лишь на два крайних члена ряда, величина размаха не учитывает внутреннего, между этими крайними значениями, рассеяния вариант. Кроме того, крайние значения как редко встречающиеся члены ряда весьма неустойчивы по своему размеру и сильно зависят от объема выборочных наблюдений. Несмотря на это, при малых выборках, повторяемых несколько раз, размах варьирования нашел широкое применение.

Среднее квадратическое отклонение и дисперсия. Основным показателем вариации (изменчивости) считается среднее квадратическое отклонение, которое определяется как корень квадратный из средней арифметической квадратов отклонений вариант от их средней арифметической величины.

Среднее квадратическое отклонение для выборки обозначают через s, а для генеральной совокупности -. Согласно определению:

s = = , (2.11)

В математической статистике оперируют средним квадратом отклонений (s2 для выборки и 2 для генеральной совокупности), называемым дисперсией, которая рассчитывается по формуле (2.12).

s2 = = (2.12)

Для расчетов по вариационному ряду среднее квадратическое отклонение выразится формулой:

s= =

= , (2.13)

а дисперсия

s2 = =

= (2.14)

В уравнениях (2.11-2.14)

x1, x2, ..., xn - варианты ряда (средние значения классов);

M - средняя арифметическая;

n1, n2, ..., nn - частоты в классах;

N - общий объем ряда.

Оценивая величину  по выборочному значению s, при обработке выборки с числом наблюдений N меньше 100 в качестве делителя в формулах (2.11) - (2.14) принимают не N, а N-1. Это число называют числом степеней свободы. Такое название объясняется тем, что в статистике при вычислении любых средних величин используют число независимых величин. При вычислении s одно из отклонений оказывается несвободным. Оно равно сумме всех остальных, взятых с обратным знаком.

Таким образом, общей формулой для нахождения среднего квадратического отклонения будет:

s = = , (2.15)

а для дисперсии

s2 = = (2.16)

При обработке вариационных рядов формулы принимают вид:

s= =

= , (2.17)

s2 = =

= (2.18)

Среднее квадратическое отклонение называется также стандартным отклонением. Полученная величина является именованной и выражается в тех же единицах измерения, что и отдельные значения признака.

Средняя величина M и среднее квадратическое отклонение s дают полную количественную характеристику любой эмпирической совокупности, подчиняющейся закону нормального распределения. Средняя арифметическая отображает действие на признак основных факторов. Среднее квадратическое отклонение, характеризующее варьирование значений признака вокруг центра распределения, является мерой степени влияния на признак различных второстепенных причин, вызывающих варьирование.

В результате действия этих причин наиболее частыми будут варианты с небольшими отклонениями. Чем отклонения больше, тем варианты встречаются реже. Это положение подробно рассмотрено в учебной литературе при анализе свойств нормального распределения вероятностей случайного события x. В статистических совокупностях с нормальным (или близким к нормальному) распределением частот 68,3% вариант имеют значения, не превосходящие ± и только 31,7% вариант по своей величине выходят за эти пределы. Отсюда вероятность того, что любая взятая наугад варианта ряда находится вне пределов ± равна 0,317. За пределами ±2 лежит всего 4,5%, а за пределами ±3 - 0,3% общего числа вариант. Следовательно, вероятность того, что взятая наугад варианта ряда окажется отклоняющейся от  на величину, большую 2 и З, соответственно равна 0,045 и 0,003.

Пример 2.9 использования функции ДИСП() MS Excel для оценивания дисперсии по выборке.

Синтаксис: ДИСП(число1;число2; ...), где число1, число2, ... - это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности.

Замечания:

  • ДИСП предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, вычисляйте дисперсию, используя функцию ДИСПР.

  • Логические значения, такие, как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, пользуйтесь функцией рабочего листа ДИСПА.

Пример. На рис. 2.7 приведено окно программы MS Excel, демонстрирующее применение функции ДИСП() для определения выборочной средней арифметической s2 распределения диаметров деревьев, записанных в ячейках А2-А21 (см. пример 2.1).

ДИСП (A2:A21) равняется 34,5 см2.

Коэффициент вариации. Коэффициент вариации, как и s или, является показателем изменчивости признака, выражая ее в относительных единицах. Он представляет собой среднее квадратическое отклонение отдельных вариант ряда от средней ве­личины, выраженное в процентах:

v = (s / M) 100%. (2.19)

Являясь показателем, не зависящим от принятых единиц изме­рения вариант, коэффициент вариации может применяться для сравнительной оценки величины варьирования различных при­знаков. Вместе с тем он в значительной степени зависит от величины средней арифметической, и поэтому его применение должно быть ограничено случаями, когда имеет место естественное от нуля начало отсчета или когда ряды распределения имеют сходные начала отсчета.

Коэффициент дифференциации. Устранить указанное ограничение позволяет коэффициент дифференциации, который без группировки вариант в классы рассчитывается по формуле:

. (2.20)

Для совокупностей со сгруппированными вариантами формула принимает вид:

, (2.21)

где

Xo значение первого класса ряда распределения;

С – ширина классового промежутка.

При начале ряда распределения в пересечении осей координат, величины коэффициентов вариации и дифференциации совпадают.

Поскольку в лесоводственных и таксационных исследованиях для нормальной кривой распределения применяется вероятность 0,99865 ( 3), то на ее основе разработана классификация степени дифференциации:

Величина коэффициента Степень дифференциации

дифференцаации

до 13% слабая

14 - 27% умеренная

28 – 38% средняя (нормальная)

39- 53% значительная

54-70% большая

более 70% очень большая