Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5-стат2015(ср_велич)

.pdf
Скачиваний:
8
Добавлен:
02.03.2016
Размер:
1.74 Mб
Скачать

Показатели варьирования или разброса.

Глядя на график частотного распределения приблизительно нормально распределенных данных можно заметить две характерные особенности: 1) кривая имеет пик, обычно недалеко от центра и 2) кривая плавно спадает по обе стороны от пика. Подобно тому, как средние величины использовались для описания местоположения пика, показатели варьирования указывают насколько велик разброс (варьирование) данных вокруг центрального значения.

Существует несколько показателей варьирования.

Размах, минимальное значение, максимальное значение.

Размахом набора данных наибольшим (максимальным) значениями набора данных. выражают одним числом минимального значений.

называется разница между

инаименьшим (минимальным)

Встатистике размах обычно -разностью максимального и

17.02.2015

bea4ver7

31

Процентили, квартили и межквартильный размах.

Максимальное значение частотного распределения можно рассматривать как такое значение набора данных, с которым совпадают или являются меньше него 100% наблюдений. Когда максимальное значение рассматривают таким образом, его называют сотым процентилем. Используя такой же подход, говорят, что медиана, с которой совпадают или являются меньше ее 50% данных, является 50-тым процентилем. N-ым процентилем распределения называется значение, с которым совпадают или находятся ниже N процентов данных. Помимо медианы часто используются 25-й и 75-й процентили. 25-й процентиль называется также первым квартилем, медиана или 50-й процентиль является одновременно вторым квартилем, 75-й процентиль -третьим, а 100-й процентиль соответственно является четвертым квартилем.

17.02.2015

bea4ver7

32

Межквартильный размах представляет собой центральную часть распределения и подсчитывается как разность между третьим и первым квартилями. В этом диапазоне лежит примерно половина набора нормально распределенных данных, вне его с каждой стороны находится примерно по четверти наблюдений.

Чтобы подсчитать межквартильный размах, вначале нужно найти первый и третий квартили. Подобно нахождению медианы, вначале нужно упорядочить наблюдения, затем найти позицию квартиля. Значением квартиля является значение наблюдения на этой позиции, а в случае, когда квартиль попадает между двумя наблюдениями, его значение находится между значениями этих наблюдений с одной из двух сторон от этой точки.

17.02.2015

bea4ver7

33

1.Упорядочьте наблюдения по возрастанию.

2.Найдите позиции первого и третьего квартилей по формулам:

позиция 1-го квартиля (Q1) = (n+1)/4

позиция 3-го квартиля (Q3) = 3*(n+1)/4 = 3-Q1

3. Определите значения 1-го и 3-го квартилей

-Если квартиль приходится на наблюдение (то есть если его позиция - целое число), значение квартиля будет равно величине этого наблюдения. Например, если квартиль находится в 20-й позиции, его значение будет равно значению 20-го наблюдения.

-Если квартиль попадает между двумя наблюдениями, значением квартиля будет значение меньшего наблюдения плюс указанная часть разности между двумя наблюдениями. Например, если позиция квартиля равна 20 1/4, квартиль попадает между 20-

ми 21-м наблюдениями, и его значение будет равно значению 20го наблюдения плюс 1/4 разности между значением 20-го и 21-го наблюдений.

4. Межквартильный размах равен разности значений Q3 и Q1

17.02.2015

bea4ver7

34

квартиль Q3

17.02.2015

bea4ver7

35

Пример

Предположим, что имеются такие данные: 13, 7, 9, 15, 11, 5, 8,4

Упорядочим их по возрастанию: 4, 5, 7, 8, 9, 11, 13, 15

Найдем позиции 1-го и 3-го квартилей. Всего имеется 8 наблюдений, поэтому n=8.

Позиция 1-го квартиля (Q1) = (n+l)/4 = (8+1 )/4 = 2,25

Позиция 3-го квартиля (Q3)=3*(n+1)/4=3*(8+1)/4 =6,75

Таким образом, Q1 находится на четверти пути между 2- м и 3-м наблюдениями, а Q3 находится на три четверти пути между 6-м и 7-м наблюдениями.

Определим значения 1-го и 3-го квартилей.

Значение Q1: Позиция Q1 была 2 1/4; поэтому значение Q1 равно значению 2-го наблюдения плюс одна четвертая разности между значениями 3-го и 2-го наблюдений.

17.02.2015

bea4ver7

36

Значение 3-го наблюдения (смотрите пункт1): 7 Значение 2-го наблюдения: 5

Q1 =5 +(1/4)*(7-5) =5 +2/4 =5,5

Значение Q3: Позиция Q3 была 6 и 3/4; поэтому значение Q3 равно значению 6-го наблюдения плюс три четвертых разности между значениями 7-го и 6-го наблюдений.

Значение 7-го наблюдения (смотрите пункт 1) : 13 Значение 6-го наблюдения: 11

Q3=11 +(3/4)*(13-11)=11 +(3-2)/4=11 +6/4=12,5

Подсчитаем межквартильный размах по формуле

Q3 - Q1.

Q3 = 12,5 (смотрите пункт 3)

Q1=5,5

Межквартильный размах = 12,5 - 5,5 = 7

17.02.2015

bea4ver7

37

Выводы

Описанный выше метод подсчета квартилей не является единственным.

Как правило, квартили и межквартильный размах используются для описания вариабельности признака при использовании медианы в качестве меры центрального расположения. При использовании средней арифметической вместе с ней используется стандартное отклонение, описываемое в следующем разделе.

17.02.2015

bea4ver7

38

Выводы

Таким образом, любой набор данных можно описать при помощи 5 основных значений:

(1)наименьшего наблюдения (минимум)

(2)первого квартиля

(3)медианы

(4)третьего квартиля

(5)наибольшего наблюдения (максимум)

Взятые вместе эти значения дают очень хорошее описание центра, разброса и формы распределения.

17.02.2015

bea4ver7

39

Дисперсия и стандартное отклонение

• Ранее было показано, что если вычесть среднюю арифметическую из каждого наблюдения, сумма полученных разностей будет равна 0. Эта идея вычитания средней из каждого наблюдения лежит в основе расчета двух показателей варьирования -

дисперсии (называемой еще вариансой) и стандартного отклонения. Для получения этих показателей разности возводятся в квадрат с целью устранения отрицательных чисел. Затем квадраты разностей складываются и делятся на п-1 для нахождения "среднего" квадрата разности.

17.02.2015

bea4ver7

40