- •Средние величины и показатели вариации
- •Средние величины
- •Понятие средней величины и принципы ее применения
- •Виды и формы средних величин
- •Степенные средние
- •Средняя арифметическая
- •Средняя геометрическая
- •Средняя квадратическая и средняя кубическая
- •Структурные средние
- •Правило мажорантности средних
- •Расчет средних по результатам группировки
- •Графическое изображение вариационного ряда
- •2.3 Показатели центра распределения и структурные характеристики вариационного ряда
- •Показатели размера и интенсивности вариации
- •Оценка вариационного ряда на асимметрию и эксцесс
Показатели размера и интенсивности вариации
Для характеристики размера вариации в статистике применяются абсолютные показатели вариации: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение и дисперсия.
Размах вариации (размах колебаний) представляет собой разность между максимальным и минимальным значениями признака в совокупности:
Величина R показывает, в каких пределах колеблется размер признака, образующего ряд распределения. Показатель R выражается в тех же единицах измерения, что и варианты ряда. Но размах вариации как показатель колеблемости имеет существенный недостаток. Его величина определяется двумя крайними значениями признака, в то время как колеблемость последнего в целом складывается из суммы всех его значений. Поэтому размах вариации может в ряде случаев неправильно характеризовать колеблемость признака. Если, например, на большой посевной площади с равномерной в целом урожайностью встречаются отдельные небольшие участки с исключительно высокой и низкой урожайностью, то размах вариации будет иметь значительный размер, хотя колеблемость урожайности в целом незначительна. Следовательно, размах вариации не отражает варьирования признака основной массы единиц совокупности.
Пример. Вычислить размах вариации:
Группы
предприятий по объему товарооборота,
млн.руб.
|
Число
предприятий
|
90 — 100 |
28 |
100 — 110 |
48 |
110 — 120 |
20 |
120 — 130 |
4 |
ИТОГО |
100 |
Определяем показатель размаха вариации:
R = 130 - 90 = 40 млн. руб.
В связи с тем, что каждое индивидуальное значение признака отклоняется от средней на определенную величину, очевидно, что мерой вариации может служить средняя из отклонений каждой отдельной варианты от их средней. Такими показателями являются среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.
Среднее линейное
отклонение представляет собой среднюю
из абсолютных значений отклонений
отдельных вариант от их средней. Так
как алгебраическая сумма отклонений
индивидуальных значений признака от
средней равна нулю, т. е.
(второе свойство средней арифметической),
при исчислении среднего линейного
отклонения принимаются во внимание
только абсолютные значения отклонения
без учета знаков («+» или «-»). Среднее
линейное отклонение рассчитывается по
формуле средней арифметической простой:
,
или средней арифметической взвешенной:
.
Пример. Вычислить среднее линейное отклонение:
Табельный номер рабочего |
|
|
/ / |
1 |
2 |
- 8 |
8 |
2 |
3 |
- 7 |
7 |
3 |
12 |
2 |
2 |
4 |
15 |
5 |
5 |
5 |
18 |
8 |
8 |
Итого |
50 |
0 |
30 |
X=
=
Средним квадратическим отклонением случайной величины называется корень квадратный из ее дисперсии:
Среднее квадратическое отклонение, равно корню квадратному из дисперсии. Оно может быть простым или взвешенным.
(хi - х)
= ------------------
n
или
(хi - x) i
= -------------------- .
i
Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные варианты признака от среднего значения. Они выражаются в тех же единицах измерения, что и признак (в метрах, тоннах, рублях и т.д.).
Среднее квадратическое отклонение часто используется в качестве единицы измерения отклонений от средней арифметической. В зарубежной литературе этот показатель называется нормированным, или стандартизированным, отклонением.
По свойству мажорантности средних величин среднее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака близко к нормальному или симметричному распределению, то между и d существует взаимосвязь: d = 0,8 или = 1,25 d .
Среднее квадратическое отклонение играет важную роль в анализе вариационных рядов распределения. В условиях нормального распределения существует следующая взаимосвязь между величиной среднего квадратического отклонения и количеством наблюдений:
В пределах x + 1 располагается 0,683, или 68,3% количества наблюдений;
В пределах х + 2 - 0,954, или 95,4%;
В пределах х + 3 - 0,997, или 99,7% количества наблюдений.
В действительности на практике почти не встречаются отклонения, которые превышают +3. Отклонение 3 может считаться максимально возможным. Это положение называют правилом трех сигм.
Дисперсия – представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам простой дисперсии и взвешенной дисперсии.
Пример. Рассмотрим расчет дисперсии и среднего квадратического отклонения по данным нижеприведенной таблицы о выпуске промышленной продукции фирмами отрасли.
Вычисление и по несгруппированным данным
Номер фирмы |
Выпущено промышленной продукции за год, млн.руб. х |
xi - x |
хi - х) |
А |
1 |
2 |
3 |
1 2 3 4 5 6 |
60 52 40 60 50 38 |
+10 +2 -10 +10 0 -12 |
100 4 100 100 0 144 |
Итого |
300 |
__ |
448 |
Алгоритм расчета следующий:
Определим среднюю величину по исходным данным (графа 1) по формуле средней арифметической простой:
.
Найдем отклонения (xi - х) и запишем их в графе 2.
Пример. Вычислить дисперсию:
Произведено продукции одним рабочим, шт. ( варианта) |
Число рабочих,
|
|
|
|
|
8 |
7 |
56 |
-2 |
4 |
28 |
9 |
10 |
90 |
1 |
1 |
10 |
10 |
15 |
150 |
0 |
0 |
0 |
11 |
12 |
132 |
1 |
1 |
12 |
12 |
6 |
72 |
2 |
4 |
24 |
ИТОГО |
50 |
500 |
|
|
74 |
Исчислим среднюю арифметическую взвешенную:
шт.
Значения отклонений от средней и их квадратов представлены в таблице. Определим дисперсию:
=1,48
Среднее квадратическое отклонение будет равно:
шт.
Пример. Рассчитать дисперсию для интервального ряда по данным о распределении посевной площади по урожайности пшеницы:
Урожайность пшеницы, ц/га |
Посевная площадь, га |
|
|
|
|
|
14 - 16 |
100 |
5 |
1500 |
-3,4 |
11,56 |
1156 |
16 - 18 |
300 |
17 |
5100 |
-1,4 |
1,96 |
588 |
18 - 20 |
400 |
19 |
7600 |
0,6 |
0,36 |
144 |
20 - 22 |
200 |
21 |
4200 |
2,6 |
6,76 |
1352 |
ИТОГО |
1000 |
|
18400 |
|
|
3240 |
Средняя арифметическая равна:
ц с 1га.
Исчислим дисперсию:
Важнейшие математические свойства дисперсии:
Если от всех вариант отнять какое-то постоянное число А, то дисперсия не изменится. Это значит, что дисперсию можно вычислить не по заданным вариантам, а по отклонениям их от какого-то постоянного числа.
Если все значения вариант разделить на какое-то постоянное число А, то дисперсия уменьшится в
раз, а среднее квадратическое отклонение
– в А раз. Значит, можно разделить все
варианты на какое-то постоянное число,
исчислить среднее квадратическое
отклонение, а затем умножить на это
постоянное число.Если исчислить дисперсию от любой величины А, отличающейся от средней арифметической, то она всегда будет больше дисперсии, исчисленной от средней арифметической, причем на величину квадрата разности между средней и величиной А. Это значит, что дисперсия от средней всегда меньше дисперсий, исчисленных от любых других величин, то есть она имеет свойство минимальности.
Дисперсия равна разности между средним квадратом значений и квадратом среднего значения признака. Этим способом расчета дисперсии широко пользуются на практике.
В статистическом исследовании очень часто бывает необходимо не только изучить вариации признака по всей совокупности, но и проследить количественные изменения признака по однородным группам совокупности, а также и между группами. Следовательно, помимо общей средней для всей совокупности необходимо просчитывать и частные средние величины по отдельным группам.
Различают четыре вида дисперсий:
- общая;
- межгрупповая;
- внутригрупповая (частная);
- дисперсия средняя из внутригрупповых.
Общая дисперсия
(
)
характеризует вариацию признака всей
совокупности под влиянием всех тех
факторов, которые обусловили данную
вариацию, а именно: влияние признака-фактора,
положенного в основание группировки и
влияние других незначительных факторов.
Эта величина определяется по формулам:
- простая.
– взвешенная
Межгрупповая дисперсия (дисперсия групповых средних) характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле:
Внутригрупповая (частная) дисперсия:
.
Дисперсия средняя из внутригрупповых определяет случайную вариацию результативного признака, обусловленную влиянием неучтенных факторов. Эта дисперсия рассчитывается по формуле:
Указанные дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме межгрупповой дисперсии и средней внутригрупповой дисперсии:
Это тождество отражает закон (правило) сложения дисперсии. Опираясь на это правило, можно определить, какая часть (доля) общей дисперсии складывается под влиянием признака-фактора, положенного в основу группировки.
Правило сложения дисперсий легло в основу расчета коэффициента детерминации и эмпирического корреляционного отношения, используемых при изучении связей между явлениями.
Коэффициент детерминации рассчитывается как отношение межгрупповой дисперсии к общей дисперсии. Он показывает, какую долю общей вариации признака составляет вариация, обусловленная фактором, положенным в основание группировки.
Этот показатель характеризует тесноту связи.
Если коэффициент детерминации:
- равен нулю, то фактор-признак не оказывает влияния на результативный признак.
– равен единице, то изменение результативного признака полностью обусловлено изменением факторного признака.
- меньше 0,3, то связь невыражена;
- от 0,3 до 0,5, то связь слабая;
- от 0,5 до 0,7, то связь умеренная (средняя);
- от 0,7 до 0,9, то связь сильная
- от 0,9 до 0,99, то связь тесная.
Эмпирическое корреляционное отношение рассчитывается как корень квадратный из коэффициента детерминации. Оно характеризует тесноту связи. Этот показатель позволяет оценит степень влияния факторного признака на результативный.
Если эмпирическое корреляционное отношение
- равно 0, то факторный признак не оказывает влияния на образование общей вариации, т. е. на результативный признак;
- равно 1, то факторный признак полностью обуславливает изменение результативного признака, т. е. между ними существует функциональная связь.
