Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 4. Средние величины и показатели вариации.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.84 Mб
Скачать
    1. Показатели размера и интенсивности вариации

Для характеристики размера вариации в статистике применяются абсолютные показатели вариации: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение и дисперсия.

Размах вариации (размах колебаний) представляет собой разность между максимальным и минимальным значениями признака в совокупности:

Величина R показывает, в каких пределах колеблется размер признака, образующего ряд распределения. Показатель R выражается в тех же единицах измерения, что и варианты ряда. Но размах вариации как показатель колеблемости имеет существенный недостаток. Его величина определяется двумя крайними значениями признака, в то время как колеблемость последнего в целом складывается из суммы всех его значений. Поэтому размах вариации может в ряде случаев неправильно характеризовать колеблемость признака. Если, например, на большой посевной площади с равномерной в целом урожайностью встречаются отдельные небольшие участки с исключительно высокой и низкой урожайностью, то размах вариации будет иметь значительный размер, хотя колеблемость урожайности в целом незначительна. Следовательно, размах вариации не отражает варьирования признака основной массы единиц совокупности.

Пример. Вычислить размах вариации:

Группы предприятий по объему товарооборота, млн.руб.

Число предприятий

90 — 100

28

100 — 110

48

110 — 120

20

120 — 130

4

ИТОГО

100

Определяем показатель размаха вариации:

R = 130 - 90 = 40 млн. руб.

В связи с тем, что каждое индивидуальное значение признака отклоняется от средней на определенную величину, очевидно, что мерой вариации может служить средняя из отклонений каждой отдельной варианты от их средней. Такими показателями являются среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

Среднее линейное отклонение представляет собой среднюю из абсолютных значений отклонений отдельных вариант от их средней. Так как алгебраическая сумма отклонений индивидуальных значений признака от средней равна нулю, т. е. (второе свойство средней арифметической), при исчислении среднего линейного отклонения принимаются во внимание только абсолютные значения отклонения без учета знаков («+» или «-»). Среднее линейное отклонение рассчитывается по формуле средней арифметической простой:

,

или средней арифметической взвешенной:

.

Пример. Вычислить среднее линейное отклонение:

Табельный номер рабочего

/ /

1

2

- 8

8

2

3

- 7

7

3

12

2

2

4

15

5

5

5

18

8

8

Итого

50

0

30

X= =

Средним квадратическим отклонением случайной величины называется корень квадратный из ее дисперсии:

Среднее квадратическое отклонение, равно корню квадратному из дисперсии. Оно может быть простым или взвешенным.

 (хi - х)

 = ------------------

n

или

 (хi - x) i

 = -------------------- .

 i

Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные варианты признака от среднего значения. Они выражаются в тех же единицах измерения, что и признак (в метрах, тоннах, рублях и т.д.).

Среднее квадратическое отклонение часто используется в качестве единицы измерения отклонений от средней арифметической. В зарубежной литературе этот показатель называется нормированным, или стандартизированным, отклонением.

По свойству мажорантности средних величин среднее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака близко к нормальному или симметричному распределению, то между  и d существует взаимосвязь: d = 0,8 или  = 1,25 d .

Среднее квадратическое отклонение играет важную роль в анализе вариационных рядов распределения. В условиях нормального распределения существует следующая взаимосвязь между величиной среднего квадратического отклонения и количеством наблюдений:

  • В пределах x + 1 располагается 0,683, или 68,3% количества наблюдений;

  • В пределах х + 2 - 0,954, или 95,4%;

  • В пределах х + 3 - 0,997, или 99,7% количества наблюдений.

В действительности на практике почти не встречаются отклонения, которые превышают +3. Отклонение 3 может считаться максимально возможным. Это положение называют правилом трех сигм.

Дисперсия – представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам простой дисперсии и взвешенной дисперсии.

Пример. Рассмотрим расчет дисперсии и среднего квадратического отклонения по данным нижеприведенной таблицы о выпуске промышленной продукции фирмами отрасли.

Вычисление  и  по несгруппированным данным

Номер фирмы

Выпущено промышленной продукции за год, млн.руб. х

xi - x

хi - х)

А

1

2

3

1

2

3

4

5

6

60

52

40

60

50

38

+10

+2

-10

+10

0

-12

100

4

100

100

0

144

Итого

300

__

448

Алгоритм расчета следующий:

  1. Определим среднюю величину по исходным данным (графа 1) по формуле средней арифметической простой:

.

  1. Найдем отклонения (xi - х) и запишем их в графе 2.

Пример. Вычислить дисперсию:

Произведено продукции одним рабочим, шт. ( варианта)

Число рабочих,

8

7

56

-2

4

28

9

10

90

1

1

10

10

15

150

0

0

0

11

12

132

1

1

12

12

6

72

2

4

24

ИТОГО

50

500

74

Исчислим среднюю арифметическую взвешенную:

шт.

Значения отклонений от средней и их квадратов представлены в таблице. Определим дисперсию:

=1,48

Среднее квадратическое отклонение будет равно:

шт.

Пример. Рассчитать дисперсию для интервального ряда по данным о распределении посевной площади по урожайности пшеницы:

Урожайность пшеницы, ц/га

Посевная площадь, га

14 - 16

100

5

1500

-3,4

11,56

1156

16 - 18

300

17

5100

-1,4

1,96

588

18 - 20

400

19

7600

0,6

0,36

144

20 - 22

200

21

4200

2,6

6,76

1352

ИТОГО

1000

18400

3240

Средняя арифметическая равна:

ц с 1га.

Исчислим дисперсию:

Важнейшие математические свойства дисперсии:

  • Если от всех вариант отнять какое-то постоянное число А, то дисперсия не изменится. Это значит, что дисперсию можно вычислить не по заданным вариантам, а по отклонениям их от какого-то постоянного числа.

  • Если все значения вариант разделить на какое-то постоянное число А, то дисперсия уменьшится в раз, а среднее квадратическое отклонение – в А раз. Значит, можно разделить все варианты на какое-то постоянное число, исчислить среднее квадратическое отклонение, а затем умножить на это постоянное число.

  • Если исчислить дисперсию от любой величины А, отличающейся от средней арифметической, то она всегда будет больше дисперсии, исчисленной от средней арифметической, причем на величину квадрата разности между средней и величиной А. Это значит, что дисперсия от средней всегда меньше дисперсий, исчисленных от любых других величин, то есть она имеет свойство минимальности.

  • Дисперсия равна разности между средним квадратом значений и квадратом среднего значения признака. Этим способом расчета дисперсии широко пользуются на практике.

В статистическом исследовании очень часто бывает необходимо не только изучить вариации признака по всей совокупности, но и проследить количественные изменения признака по однородным группам совокупности, а также и между группами. Следовательно, помимо общей средней для всей совокупности необходимо просчитывать и частные средние величины по отдельным группам.

Различают четыре вида дисперсий:

- общая;

- межгрупповая;

- внутригрупповая (частная);

- дисперсия средняя из внутригрупповых.

Общая дисперсия ( ) характеризует вариацию признака всей совокупности под влиянием всех тех факторов, которые обусловили данную вариацию, а именно: влияние признака-фактора, положенного в основание группировки и влияние других незначительных факторов. Эта величина определяется по формулам:

- простая.

– взвешенная

Межгрупповая дисперсия (дисперсия групповых средних) характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле:

Внутригрупповая (частная) дисперсия:

.

Дисперсия средняя из внутригрупповых определяет случайную вариацию результативного признака, обусловленную влиянием неучтенных факторов. Эта дисперсия рассчитывается по формуле:

Указанные дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме межгрупповой дисперсии и средней внутригрупповой дисперсии:

Это тождество отражает закон (правило) сложения дисперсии. Опираясь на это правило, можно определить, какая часть (доля) общей дисперсии складывается под влиянием признака-фактора, положенного в основу группировки.

Правило сложения дисперсий легло в основу расчета коэффициента детерминации и эмпирического корреляционного отношения, используемых при изучении связей между явлениями.

Коэффициент детерминации рассчитывается как отношение межгрупповой дисперсии к общей дисперсии. Он показывает, какую долю общей вариации признака составляет вариация, обусловленная фактором, положенным в основание группировки.

Этот показатель характеризует тесноту связи.

Если коэффициент детерминации:

- равен нулю, то фактор-признак не оказывает влияния на результативный признак.

– равен единице, то изменение результативного признака полностью обусловлено изменением факторного признака.

- меньше 0,3, то связь невыражена;

- от 0,3 до 0,5, то связь слабая;

- от 0,5 до 0,7, то связь умеренная (средняя);

- от 0,7 до 0,9, то связь сильная

- от 0,9 до 0,99, то связь тесная.

Эмпирическое корреляционное отношение рассчитывается как корень квадратный из коэффициента детерминации. Оно характеризует тесноту связи. Этот показатель позволяет оценит степень влияния факторного признака на результативный.

Если эмпирическое корреляционное отношение

- равно 0, то факторный признак не оказывает влияния на образование общей вариации, т. е. на результативный признак;

- равно 1, то факторный признак полностью обуславливает изменение результативного признака, т. е. между ними существует функциональная связь.