
10-03-2015_20-50-09 / 2. Описательный анализ данных
.pdf
3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
2.3Дисперсия выборки
•Дисперсия выборки – среднее арифметическое квадратов отклонений значений выборки от выборочного среднего.
•Вычисляем по формуле:
s2 (x x)2 n 1
•Чем формула отличается от обычной формулы определения дисперсии?
•Деление на n-1, а не на n позволяет учесть, что истинное среднее значение случайной величины нам известно лишь приблизительно, так как расчет ведется не по элементам совокупности, а по выборке.

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
• |
Имеется выборка из четырех значений: |
2, 3, 6, 9 |
||||
• |
Сначала находим среднее: |
|
|
|||
|
|
n 4 |
|
|
||
|
|
|
|
2 3 6 9 |
5 |
|
|
|
x |
|
|||
|
|
|
|
|||
|
4 |
|
|
Теперь по формуле вычисляем дисперсию:
s2 (2 5)2 (3 5)2 (6 5)2 (9 5)2 10 4 1

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
• Для выборки 2, 3, 6, 9 подсчитаем дисперсию при помощи таблицы.
|
x |
x x |
(x x)2 |
n 4 |
|
||||||||||
|
2 |
-3 |
9 |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||
3 |
-2 |
4 |
|
|
|
|
|
20 |
5 |
||||||
6 |
1 |
1 |
|
|
x |
||||||||||
|
|
|
|||||||||||||
|
|
|
|
|
|
|
4 |
|
|
|
|||||
9 |
4 |
16 |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
30 |
|
|
||||||
|
|
|
|
|
|
s |
2 |
|
|
10 |
|||||
20 |
|
30 |
|
|
|
||||||||||
|
|
|
|
|
|
|
|||||||||
|
|
|
|
4 1 |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
• Дисперсия вычисляется также по эквивалентной формуле:
s2 n x2 x 2 n (n 1)
• Эта формула более пригодна для ручного счета.

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
•Пример вычисления дисперсии по второй формуле. В таблице рассчитываются лишь квадраты значений.
x |
x2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
4 |
|
|
|
|
|
n x |
2 |
|
|
2 |
|||
|
|
|
|
2 |
|
|
||||||||
3 |
9 |
|
s |
|
|
|
|
x |
|
|
||||
|
|
|
n (n |
1) |
|
|||||||||
6 |
36 |
|
|
|
|
|
|
|
||||||
9 |
81 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
4 130 20 |
|
10 |
||||||||||
|
|
|
|
|||||||||||
20 |
130 |
|
||||||||||||
|
|
4 (4 1) |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
• Дисперсия для сгруппированных данных вычисляется по формуле:
s2 n ( f x2 ) ( f x) 2 n (n 1)

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ
ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
Период |
f |
x |
f x |
f x2 |
2–4 |
2 |
3 |
6 |
18 |
5–7 |
5 |
6 |
30 |
180 |
8–10 |
10 |
9 |
90 |
810 |
11–13 |
4 |
12 |
48 |
576 |
14–16 |
2 |
15 |
30 |
450 |
|
|
|
|
|
|
23 |
45 |
204 |
2034 |
|
|
|
|
|
s2 23 2034 (204)2 10,2 23 (23 1)

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
2.4 Стандартное отклонение
Стандартное отклонение вычисляется как корень из дисперсии:
s s2
•Стандартное отклонение имеет исключительную важность для описания распределения данных.

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
2.5 Коэффициент вариации
Коэффициент вариации вычисляется как отношение стандартного отклонения к среднему: CV s / x
Коэффициент вариации полезен, если:
•1. Сравниваются несколько совокупностей, измеряемых в разных величинах.
•2. Сравниваются совокупности, измеряемые в одинаковых величинах, но имеющие сильно отличающиеся средние.

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ
ПРИМЕР: Какие данные имеют большую вариацию:
•имеющие стандартное отклонение 20 при среднем 200 или
•имеющие стандартное отклонение 3 при среднем 30?
CV s / x 20/ 200 0,1
CV s / x 3/ 30 0,1
• Ответ. Коэффициенты вариации равны. Вариация одинакова.