- •Тема 4. Вариационный анализ
- •1. Вариация признака и показатели ее оценки.
- •2. Дисперсия, ее свойства и методы расчета.
- •3. Виды дисперсии. Правило сложения дисперсий.
- •1. Вариация признака и показатели ее оценки
- •2. Дисперсия, ее свойства и методы расчета
- •3. Виды дисперсии. Правило сложения дисперсий
2. Дисперсия, ее свойства и методы расчета
Дисперсия – средний квадрат отклонений индивидуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам:
Для альтернативных
признаков:
-
доля единиц совокупности, обладающих
данным признаком;
-
доля единиц, не обладающих данным
признаком. Дисперсия альтернативного
признака:
.
Для количественных признаков:
- простая дисперсия
- взвешенная дисперсия
Дисперсия обладает рядом свойств:
1. Если из всех значений вариант отнять какое-то постоянное число А, то дисперсия от этого не изменится:
.
Если все значения вариант разделить на какое-то по постоянное число А, то дисперсия уменьшится от этого в А2 раз, а среднее квадратическое отклонение - в А раз:
.
Если исчислить дисперсию от любой величины А, которая отличается от средней арифметической
, то эта дисперсия всегда будет больше
дисперсии, исчисленной от средней
арифметической
. При этом больше на вполне определенную
величину - квадрат разности между
средней и условно взятой величиной А,
т.е. на
:
.
Исходя из этих свойств, дисперсия для интервального вариационного ряда с равными интервалами определяется способом моментов по формуле:
,
где i - величина интервала;
m12 - момент первого порядка в квадрате;
m2- момент второго порядка.
Для интервального вариационного ряда распределения среднее квадратическое отклонение способом моментов определяется по формуле:
,
где i – величина интервала;
m1
- момент
первого порядка
;
m2
- момент второго порядка
.
3. Виды дисперсии. Правило сложения дисперсий
Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку.
Тогда наряду с изучением вариации признака по всей совокупности в целом, становиться возможным изучать вариацию для каждой из составляющих ее групп, а также между этими группами.
В простейшем случае, когда совокупность расчленена на группы по однородному фактору, изучение вариации достигается посредством расчета и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.
Общая дисперсия
(
)
измеряет вариацию признака во всей
совокупности под влиянием всех факторов,
обусловивших эту вариацию.
Межгрупповая
дисперсия (
)
характеризует систематическую вариацию,
т.е. различия в величине изучаемого
признака, возникающие под действием
признака-фактора, положенного в основу
группировки.
;
где
- число групп;
- число единиц в j-й
совокупности;
- частная средняя по j-й
группе;
- общая средняя по совокупности единиц.
Внутригрупповая
дисперсия (
)
отражает случайную вариацию, т.е. часть
вариации, происходящей под влиянием
неучтенных факторов и не зависящую от
признака-фактора.
.
По совокупности
в целом вариация значений признака под
влиянием прочих факторов характеризуется
средней из
внутригрупповых дисперсий
(
):
.
Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:
.
Эмпирический коэффициент детерминации – доля межгрупповой дисперсии в общей дисперсии.
.
Эмпирическое
корреляционное отношение
– корень квадратный из эмпирического
коэффициента детерминации (если
,
то группировочный признак не оказывает
влияния на результативный; если же
,
то результативный признак изменяется
только в зависимости от признака,
положенного в основу группировки, а
влияние прочих факторных признаков
равно нулю):
.
Для проверки
существенности связи
между группировочным признаком и
вариацией исследуемого признака часто
используется дисперсионное отношение
(критерий
Фишера).
,
где
,
- число степеней свободы для сравниваемых
дисперсий,
при этом
;
- число групп;
- число
наблюдений.
Расчетное значение
критерия Фишера (
)
сравнивается в критическим (
),
которое определяется по таблице; если
,
наличие связи доказано.
Эмпирическое корреляционное отношение может принимать значение от 0 до ±1.
Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации.
Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.
Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимость между признаками.
Для качественной оценки степени тесноты связи на основе показателей тесноты связи можно воспользоваться шкалой Чэддока.
Таблица 4.2
Шкала Чэддока
Показатель тесноты связи |
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,999 |
Качественная характеристика силы связи |
слабая |
умеренная |
заметная |
тесная |
весьма тесная |
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Что такое вариация? Какие различают виды вариации?
2. Расскажите о показателях вариации и способах их расчета.
3. Что такое дисперсия? Каковы свойства дисперсии?
4. Как оценить дисперсию количественного признака?
5. Как оценить дисперсию альтернативного признака?
6. Что характеризуют показатели формы распределения?
7. Что характеризуют показатели дифференциации?
8. Как определить показатели концентрации?
9. В чем заключаются особенности построения кривой Лоренца?
10. Какие существуют виды дисперсии? Что такое закон сложения дисперсий?
11. Что такое коэффициент детерминации? Какой смысл имеет эмпирическое корреляционное отношение?
