Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по статистике_верстка.doc
Скачиваний:
136
Добавлен:
07.06.2015
Размер:
4.23 Mб
Скачать

Раздел3. Показатели вариации

3.1. Методические указания и решение типовых задач

Для измерения степени колеблемости отдельных значений признака от средней исчисляются основные обобщающие показатели вариации.

Размах вариации является наиболее простым измерителем вариации признака и определяется как разность между наибольшим и наименьшим значениями признака:

R = xmaxxmin . (3.1)

Среднее линейное отклонение представляет собой среднюю величину из отклонений вариантов признака от средней с учетом различия всех единиц совокупности:

–простое (для дискретного ряда значений признака), (3.2)

взвешенное (для интервального ряда). (3.3)

Дисперсия – это средний квадрат отклонений, определяемый как средняя из отклонений, возведенных в квадрат.

–простая (для дискретного ряда); (3.4)

–взвешенная (для интервального ряда). (3.5)

Среднее квадратическое отклонение:

. (3.6)

Коэффициент вариации – относительное среднее квадратическое отклонение, определяющее колеблемость признака:

(3.7)

Если >40%, это говорит о большой колеблемости признака.

Здесь:

xmax – максимальное значение признака;

xmin – минимальное значение признака;

n – число вариантов в дискретном ряду;

m – число интервалов в интервальном ряду;

xii-тое значение варьирующего признака (варианта);

xjзначение варьирующего признака в серединеj-того интервала;

fj – частота.

По величине коэффициента вариации можно судить о степени вариации признаков, а следовательно, и об однородности состава совокупности. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по составу.

Пример 3.1

Имеются выборочные данные о стаже работников коммерческих банков (табл. 3.1).

Определите:

  1. средний стаж работников;

  2. дисперсию;

  3. среднее квадратическое отклонение;

  4. коэффициент вариации.

Таблица 3.1

Стаж, лет

Среднесписочная численность

работников, чел.

f

Середина интервала

xi

xif

До 3

10

2

20

-3

9

90

3 – 5

48

4

192

-1

1

48

5 – 7

28

6

168

1

1

28

7 – 9

10

8

80

3

9

90

Свыше 9

4

10

40

5

25

100

Итого

100

-

500

-

-

356

Решение

  1. Средний стаж работников по формуле (2.10)

тыс.руб.

  1. Дисперсия по формуле (3.4)

.

  1. Среднее квадратическое отклонение по формуле (3.6)

  1. Коэффициент вариации по формуле (3.7)

.

Статистическую совокупность можно считать однородной по рассматриваемому признаку, если коэффициент вариации не превышает 33% [17].

Статистическое изучение вариации многих социально-экономических явлений проводится и при помощи дисперсии альтернативного признака. Обозначим наличие данного признака через 1, отсутствие – 0, долю вариантов, обладающих данным признаком, – p, а не обладающих им – q.

Дисперсия альтернативного признака , (3.8)

где ; (3.9)

n– число наблюдений;

m– число единиц совокупности, обладающее данным признаком,

q = 1p.(3.10)

Пример 3.2

Определим дисперсию альтернативного признака по следующим данным: налоговой инспекцией одного из районов города проверено 172 коммерческих киоска и в 146 обнаружены финансовые нарушения. Тогда

п = 172, т = 146; ;q = 10,85 = 0,15;

.

Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.

Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую, межгрупповую и внутригрупповую.

Общая дисперсия () измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:

. (3.11)

Межгрупповая дисперсия () характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле

(3.12)

где и ni – соответственно групповые средние и численности по отдельным группам.

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

(3.13)

Средняя из внутригрупповых дисперсий :

. (3.14)

Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсии:

. (3.15)

Данное соотношение называют правилом сложения дисперсий. Согласно этому правилу общая дисперсия, возникающая под действием всех факторов, равна сумме дисперсии, появляющейся под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или проверить правильность расчета третьего вида.

Пример 3.3

Определим групповые дисперсии, среднюю из групповых дисперсий, межгрупповую дисперсию, общую дисперсию по данным табл. 3.2.

Таблица 3.2

Производительность труда двух бригад рабочих-токарей

1-я бригада

2-я бригада

№ п/п

Изготовлено деталей за час, шт.

xi

xi

(xi )2

№ п/п

Изготовлено деталей за час, шт.

xi

xi

(xi )2

1

2

3

4

5

6

13

14

15

17

16

15

-2

-1

0

2

1

0

4

1

0

4

1

0

7

8

9

10

11

12

18

19

22

20

24

23

-3

-2

1

-1

3

2

9

4

1

1

9

4

90

10

126

24

Решение. Для расчета групповых дисперсий вычислим средние по каждой группе:

шт.; шт.

Промежуточные расчеты дисперсий по группам представлены в табл. 3.2. Подставив полученные значения в формулу (3.4), получим:

Средняя из групповых дисперсий

.

Затем рассчитаем межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешенную из групповых средних:

шт.

Теперь определим межгрупповую дисперсию

.

Таким образом, общая дисперсия по правилу сложения дисперсий:

.

Проверим полученный результат, вычислив общую дисперсию обычным способом:

.

На основании правила сложения дисперсий можно определить показатель тесноты связи между группировочным (факторным) и результативным признаками. Он называется эмпирическим корреляционным отношением, обозначается («эта») и рассчитывается по формуле

. (3.16)