Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

10-03-2015_20-50-09 / 2. Описательный анализ данных

.pdf
Скачиваний:
56
Добавлен:
20.04.2015
Размер:
2.15 Mб
Скачать

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

2.3Дисперсия выборки

Дисперсия выборки – среднее арифметическое квадратов отклонений значений выборки от выборочного среднего.

Вычисляем по формуле:

s2 (x x)2 n 1

Чем формула отличается от обычной формулы определения дисперсии?

Деление на n-1, а не на n позволяет учесть, что истинное среднее значение случайной величины нам известно лишь приблизительно, так как расчет ведется не по элементам совокупности, а по выборке.

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

Имеется выборка из четырех значений:

2, 3, 6, 9

Сначала находим среднее:

 

 

 

 

n 4

 

 

 

 

 

 

2 3 6 9

5

 

 

 

x

 

 

 

 

 

 

4

 

 

Теперь по формуле вычисляем дисперсию:

s2 (2 5)2 (3 5)2 (6 5)2 (9 5)2 10 4 1

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

Для выборки 2, 3, 6, 9 подсчитаем дисперсию при помощи таблицы.

 

x

x x

(x x)2

n 4

 

 

2

-3

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

-2

4

 

 

 

 

 

20

5

6

1

1

 

 

x

 

 

 

 

 

 

 

 

 

 

4

 

 

 

9

4

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

s

2

 

 

10

20

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

Дисперсия вычисляется также по эквивалентной формуле:

s2 n x2 x 2 n (n 1)

Эта формула более пригодна для ручного счета.

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

Пример вычисления дисперсии по второй формуле. В таблице рассчитываются лишь квадраты значений.

x

x2

 

 

 

 

 

 

 

 

 

 

 

 

2

4

 

 

 

 

 

n x

2

 

 

2

 

 

 

 

2

 

 

3

9

 

s

 

 

 

 

x

 

 

 

 

 

n (n

1)

 

6

36

 

 

 

 

 

 

 

9

81

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

4 130 20

 

10

 

 

 

 

20

130

 

 

 

4 (4 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

Дисперсия для сгруппированных данных вычисляется по формуле:

s2 n ( f x2 ) ( f x) 2 n (n 1)

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ

ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

Период

f

x

f x

f x2

2–4

2

3

6

18

5–7

5

6

30

180

8–10

10

9

90

810

11–13

4

12

48

576

14–16

2

15

30

450

 

 

 

 

 

 

23

45

204

2034

 

 

 

 

 

s2 23 2034 (204)2 10,2 23 (23 1)

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

2.4 Стандартное отклонение

Стандартное отклонение вычисляется как корень из дисперсии:

s s2

Стандартное отклонение имеет исключительную важность для описания распределения данных.

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

2.5 Коэффициент вариации

Коэффициент вариации вычисляется как отношение стандартного отклонения к среднему: CV s / x

Коэффициент вариации полезен, если:

1. Сравниваются несколько совокупностей, измеряемых в разных величинах.

2. Сравниваются совокупности, измеряемые в одинаковых величинах, но имеющие сильно отличающиеся средние.

3. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИЗУЧАЕМОЙ ПЕРЕМЕННОЙ

ПРИМЕР: Какие данные имеют большую вариацию:

имеющие стандартное отклонение 20 при среднем 200 или

имеющие стандартное отклонение 3 при среднем 30?

CV s / x 20/ 200 0,1

CV s / x 3/ 30 0,1

Ответ. Коэффициенты вариации равны. Вариация одинакова.