- •Тема №6 Изучение вариации статистических данных
- •1 Понятие вариации и ее значение
- •2 Статистические показатели вариации
- •3 Дисперсия, ее виды и свойства
- •1 Понятие вариации и ее значение
- •2 Статистические показатели вариации
- •3 Дисперсия, ее виды и свойства
- •4 Характеристика закономерности рядов распределения
3 Дисперсия, ее виды и свойства
Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а так же между группами. Различают следующие виды дисперсии:
1) Общая дисперсия изучает вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:
.
2) Межгрупповая дисперсия характеризует колеблемость групповых средних около общей средней и отражает различия в величине изучаемого признака, возникающие под влиянием неучтенных факторов и независящую от признака – фактора, положенного в основание группировки:
,
где - средняя по i-ой группе,
- численность i-ой группы.
3) Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и независящую от признака – фактора, положенного в основание группировки:
.
Средняя из внутригрупповых дисперсий .
Существует закон сложения дисперсий: .
В статистическом анализе широко используется эмпирический коэффициент детерминации:
.
Эмпирическое корреляционное отношение характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака:
,
Эмпирическое корреляционное отношение находится в пределах . Если , то группировочный признак не оказывает влияние на результативный. Если , то результативный признак зависит от группировочного признака.
Свойства дисперсии:
1) Дисперсия постоянной величины равна нулю.
2) Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии:
.
3) Уменьшение всех значений признака в А раз уменьшает дисперсию в А2 раз:
.
4) Если исчислить средний квадрат отклонений от любой величины А, которая в той или иной степени отличается от средней арифметической , то он всегда будет > среднего квадрата отклонений, исчисленного от средней арифметической:
.
4 Характеристика закономерности рядов распределения
Одной из важных задач в статистике является выявление закономерности распределения и определение ее характера. В вариационных рядах существует определенная связь в изменении частот и значений признака: с увеличением значений признака частоты вначале возрастают до определенной величины, а затем убывают. Такие изменения частот в вариационных рядах называются закономерностями распределения.
Для получения представления о форме распределения строятся графики кривых распределения (полигоны, гистограммы).
Кривая распределения – это графическое изображение в виде непрерывной линии изменений частот в вариационном ряду, отражающая как общие, так и случайные условия, определяющие распределение.
В статистической практике встречаются различные виды распределений. Наиболее общим является распределение, называемое нормальным.
Нормальное распределение предполагает, что:
- отклонения от среднего значения являются результатом большого количества мелких отклонений;
- позитивные и негативные отклонения равновероятны;
- наиболее вероятным значением всех, в равной мере надежных измерений, является их средняя арифметическая.
Нормальное распределение описывается уравнением:
,
где - ордината кривой нормального распределения;
- нормированное отклонение;
и математические постоянные;
- варианты вариационного ряда;
- средняя величина;
- среднее квадратическое отклонение.
Согласно нормальному закону распределения колеблемость индивидуальных значений признака находится в пределах :
- 68,3%
- 95,4%
- 99,7%.
Нормальному распределению соответствует симметричное распределение, но чаще всего встречается асимметричное распределение. В нем вершина кривой сдвинута либо вправо, либо влево.
Если вершина сдвинута влево, то правая часть длиннее левой и асимметрия является правосторонней
Если вершина сдвинута вправо, то левая часть длиннее правой и асимметрия является левосторонней
Асимметрия измеряется с помощью следующих показателей:
.
Если As>0, то асимметрия правосторонняя, если As<0, то асимметрия левосторонняя.
Показатель, основанный на моменте третьего порядка:
,
где - центральный момент третьего порядка. Если , то асимметрия считается значительной, в противном случае незначительной.
Оценка существенности этого показателя дается с помощью среднеквадратической ошибки: , где n – это число наблюдений. Если , то асимметрия не существенна и обусловлена влиянием случайных факторов, в противном случае распределение признака в совокупности не является асимметричным.
Для симметричных распределений рассчитывается эксцесс.
Эксцесс – это высоковершинность (островершинность) или низковершинность (плосковершинность) фактической кривой распределения по сравнению с нормальным распределением.
Высоковершинность (островершинность) означает положительный эксцесс и характеризует скопление частот в середине ряда.
Низковершинность (плосковершинность) означает отрицательный эксцесс и характеризует большую разбросанность членов ряда.
Эксцесс определяется по формуле с использованием центрального момента четвертого порядка:
.
где - центральный момент четвертого порядка.
Оценка степени существенности показателя дается с помощью среднеквадратической ошибки эксцесса . Если , то это свидетельствует о незначительном эксцессе.
Для проверки соответствия фактического распределения нормальному производится сравнение частот фактического распределения с теоретическими частотами, которые характерны для нормального распределения. На основе этого строится теоретическая кривая.
Процесс нахождения функции кривой распределения принято называть аппроксимацией или выравниванием. Он заключается в следующем:
- подборе и теоретическом обосновании предельной теоретической кривой плотности распределения достаточно точно выражающей свойственную явлению закономерность;
- определение параметров фактической кривой распределения;
- оценка близости эмпирического и теоретического распределения при помощи математических критериев.
Рассмотрим аппроксимацию на основе функции нормального распределения выполнения норм выработки рабочими цеха:
№ цеха |
Группы рабочих по выполнению норм выработки, % |
Число рабочих |
Центры интервалов |
|
Значение плотности вероятности |
Теоретические частоты |
1 |
До 100 |
2 |
95 |
-2,03 |
0,0508 |
4 |
2 |
100 - 110 |
15 |
105 |
-1,30 |
0,1714 |
12 |
3 |
110 - 120 |
26 |
115 |
-0,58 |
0,3372 |
25 |
4 |
120 - 130 |
32 |
125 |
0,14 |
0,3951 |
29 |
5 |
130 - 140 |
12 |
135 |
0,87 |
0,2732 |
20 |
6 |
140 - 150 |
9 |
145 |
1,59 |
0,1127 |
8 |
7 |
150 - 160 |
4 |
155 |
2,32 |
0,0270 |
2 |
|
Итого |
100 |
|
|
|
100 |
Значение плотности вероятности для нормального закона распределения определяется по таблице “плотность нормального закона распределения” (Шмойлова, приложение 8).
Определение теоретических частот производится на основе следующего уравнения: ,
Где - теоретические частоты;
- величина интервала;
- сумма частот (объем совокупности);
.
Для того, чтобы установить верно ли предположение о том, что эмпирическое распределение подчинено закону нормального распределения, необходимо сравнить его с теоретическим распределением. Чем ближе значение к нулю, тем ближе фактическое распределение к теоретическому.
Для оценки степени близости эмпирического распределения к теоретическому, используются критерии согласия.
Критерий согласия Пирсона (хи - квадрат):
где - частоты эмпирического распределения;
- частоты теоретического распределения.
Если , то это означает, что эмпирическое распределение соответствует нормальному. определяется по специальным таблицам в зависимости от принятой вероятности P и числа степеней свободы …