
Тема 4 Показатели вариации
§ 4.1. Размах вариации r
Средние величины не являются универсальными характеристиками варьирующих объектов. При одинаковых средних признаки могут отличаться по величине и характеру варьирования. Поэтому наряду со средними для характеристики варьирующих признаков используют так же показатели вариации. Одним из таких показателей являются лимиты (от лат. limes – предел). В биометрии под этим термином понимают значения минимальной xmin и максимальный xmax вариант совокупности.
Размах
вариации R
представляет собой
разность между максимальной и минимальной
вариантами совокупности, т.е.
.
Чем сильнее варьирует признак, тем
больше размах вариации, и, наоборот, чем
слабее вариация признака, тем меньше
будет размах вариации.
Лимиты и размах вариации – простые и наглядные характеристики варьирования, однако им присущи существенные недостатки:
при повторных измерениях однако и того же группового объекта они могут значительно изменятся;
они не отражают существенные черты варьирования.
Например, возьмем два ряда распределения с одним и тем же весом входящих в их состав вариант, равным единице:
x1 |
10 |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
50 |
|
x2 |
10 |
28 |
28 |
30 |
30 |
30 |
32 |
32 |
50 |
|
По числу вариант (n = 9), лимитам и размаху вариации эти ряды не отличаются друг от друга; их средние также равны между собой. Отличает их друг от друга характер варьирования, но эта особенность никак не отражается на лимитах и размахе вариации.
Более
удобной характерной вариации мог бы
служить показатель, который строится
на основании отклонений вариант от их
средней, т.е.
.
Сумма таких отклонений, взятая без учета
знаков и отнесенная к числу наблюденийn,
называется средним
линейным отклонением
.
Так,
если взять суммы отклонений вариант от
их средней от их средней ()
для первогоx1
и
второго x2
приведенных здесь рядов, то получим
следующие результаты:
d1 = 20 |
15 |
10 |
5 |
0 |
5 |
10 |
15 |
20 |
∑d1 = 100 |
d2 = 20 |
2 |
2 |
0 |
0 |
0 |
2 |
2 |
20 |
∑d2 = 48 |
Отсюда
и
.
Таким образом в первом случае варьирование
сильнее, чем во втором.
§ 4.2 Дисперсия s2 и ее свойства
Несмотря на явное преимущество среднего линейного отклонения перед лимитами и размахом вариации, этот показатель не получил широкого применения в биометрии. Наиболее подходящим оказался показатель, построенный не на отклонениях вариант от их средних, а на квадратах этих отклонений, его называют дисперсией (от лат. dispersio – рассеяние) и определяют по формулам:
или
(12)
, (13)
где
xi
– i-я
варианта;
– среднее
значение; fi
– частоты или веса; k
– класс; n
– общее число наблюдений.
Преимущество дисперсии заключается:
Во-первых, в том, что, являясь мерой варьирования числовых значений признака вокруг их средней арифметической, она измеряет и внутреннюю изменчивость значений признака, зависящую от разности между наблюдениями.
Во-вторых, дисперсия разлагается на составные компоненты, позволяя тем самым оценивать влияние различных факторов на величину учитываемого признака.
Но
вместе с тем установлено, что рассчитываемая
по формуле (13) дисперсия оказывается
смещенной по отношению к своему
генеральному параметру на величину,
равную
.
Чтобы получить не смещенную дисперсию,
нужно в формулу (13) ввести в качестве
множителя поправки на смещенность,
называемуюпоправкой
Бесселя.
В результате формула (13) преобразуется
следующим образом:
(14)
Разность
,
в дальнейшем обозначаемаяk,
называется числом
степеней свободы,
под которым понимают число варьирующих
единиц в составе численно ограниченной
статистической совокупности.
Так,
если совокупность состоит из n-го
числа членов и характеризуется средней
величиной
,
то любой член этой совокупности может
иметь какое угодно значение, не изменяя
при этом среднюю
,
кроме одной варианты, значение которой
определяется разностью между суммой
значений всех остальных вариант и
величиной
.
Следовательно, одна варианта численно
ограниченной статистической совокупности
не имеет свободы вариации. Отсюда число
степеней свободы для такой совокупности
будет равно
.
А при наличии не одного, а нескольких
ограничений свободы вариации число
степеней свободы вариации будет равно
,
гдеν
– обозначается число ограничений
свободы вариации.
Дисперсия обладает рядом важных свойств:
Если каждую варианту совокупности уменьшить или увеличить на одно и тоже постоянное число A, то дисперсия не изменится:
Отсюда следует, что дисперсию можно вычислять не только по значениям варьирующего признака, но и по их отклонениям от какой-либо постоянной величины A (например, предельно допустимой концентрации вредного вещества в какой-либо среде).
Если каждую варианту совокупности разделить или умножить на одно и тоже постоянной число A, то дисперсию уменьшается или увеличивается в A2 раз.
Доказательство:
А также:
Из этого свойства следует, что при наличии в совокупности многозначных вариант их можно сократить на какое-то постоянное число A и по полученным результатам вычислить дисперсию. Затем полученную величину умножить на квадрат общего делителя A2, что даст искомую величину дисперсии.
На основании математических свойств средней арифметической и дисперсии нетрудно составить сводку правил по преобразованию многозначных и дробных чисел, которую полезно использовать при обработке биометрических данных (табл.9).
Таблица 9
Способы преобразования чисел |
Какие поправки нужно внести в конечный результат | |
при вычислении дисперсии |
при вычислении средней арифметической | |
x-A |
поправка не нужна |
прибавить число A |
(x-A)K |
разделить на K2 |
разделить на K и прибавить число A |
(x-A)/K |
умножить на K2 |
умножить на K и прибавить число A |
x/К |
умножить на A2 |
умножить на число A |
xA |
разделить на A2 |
разделить на число A |
В этой таблице A – произвольно взятое число, обычно близкое к величине минимальной варианты xmin; K – произвольное число, позволяющее преобразовывать дробные числа; x – отдельные числовые значения признака, т.е. варианты.
Следует
также иметь в виду, что вместо
можно
использовать
;
или
Отсюда можно вывести следующие рабочие формулы, удобные при вычислении дисперсии непосредственно по значениям варьирующего признака:
или при повторяемости отдельных вариант: