- •Тема 2. Сводка и группировка данных
- •Тема 4. Статистические показатели
- •2. Относительная величина выполнения плана (нормы или договорных обязательств)
- •Тема 5. Анализ рядов распределения. СтаТиСтическая проверка гипотез
- •Тема 6. Выборочное наблюдение
- •Тема 7. Анализ интенсивности динамики
- •Формулы показателей анализа ряда динамики
- •Тема 8. Анализ тенденций развития
- •Тема 9. Индексы
- •Агрегатные индексы.
Тема 5. Анализ рядов распределения. СтаТиСтическая проверка гипотез
К
ним от-носятся медиана (
),мода
(
),
квартили (
),
децили (
)
и пер-центили (
)
распределения.
в ранжированном ряду с нечетным числом уровней медиана соответствует признаку с порядковым номером:
,
где n
- объем совокупности.
в ранжированном ряду с четным числом значений варьирующего признака (
;
)
за медиану условно принимают значение:
в дискретном ряду распределения медиана соответствует варианте, для которой первая накопленная частота больше половины общего числа наблюдений;
в интервальном ряду распределения медианным интервалом будет интервал, для которого первая накопленная частота больше половины объема совокупности, а сама медиана определяется по формуле:
,
где
-
нижняя граница медианного интервала;
-
величина медианного интервала;
-
частота медианного интервала;
-
накопленная частота до медианного
интервала.
Мода
в дискретном ряду – по максимальной частоте;
в интервальном ряду модальный интервал определяется по максимальной частоте, а сама мода - по формуле:
,
где
-
нижняя граница модального интервала;
-
величина модального интервала;
-
частота модального интервала;
-
час-тота интервала, предшествующего
модальному;
-
частота интервала, следующего за
модальным.
Значения
признака, делящие совокупность на
четыре равные части, называются
квартелями Q,
Q2
=
= М
е.
(Q1)
(Q3)
квартили определяются по следующим
формулам:
;
,
где
хQ1,хQ3-
нижняя граница, соответственно, первого
и третьего квартильных интервалов;
hQ1,
hQ3-
величина соответствующего первого и
третьего квартильных интервалов;
fQ1,
fQ3
-
частота соотвествующих квартильных
интервалов;
-
накопленная частота до первого
квартильного интервала;
-
накопленная частота до третьего
квартильного интервала.
Децили
– варианты, делящие ряд распределения
на десять равных частей.
;
и т.д
коэффициент
децильной дифференциации:
,
где d9 – девятая дециль, или девятый дециль; d1 – первая дециль, или первый дециль.
Он показывает, во сколько раз наименьший уровень признака из 10% признаков, имеющих наибольший уровень, больше наибольшего уровня признака из 10% единиц совокупности, имеющих наименьший уровень признака.
Более
точной мерой степени дифференциации
(или концентрации) является коэффициент
Джини
(
):
.
где
fотн
- доля частот
i-той
группы;
-
доля признака i-той
груп-пы;
-
кумулятивная доля признака.
Показатели меры вариации.
Абсолютные показатели вариации:
1.
Размах вариации:
,
где
,
- соответственно, наибольшее и наименьшее
значение варьирующего признака.
2. Среднее линейное отклонение:
-
простое;
- взвешенное.
3. Дисперсия:
-
простая;
- взвешенная.
4. Среднее квадратическое отклонение:
-
простое;
- взвешенное.
Среднее квадратическое отклонение и среднее линейное отклонение – это обобщающие характеристики размеров вариации признака в совокупности, они выражаются в тех же единицах измерения, что и сам признак.
При
сравнительно простых значениях признака
используется упрощенный способ расчета
дисперсии и среднего квадратического
отклонения – метод разности средних:
;
.
по несгруппированным данным:
;
,
по сгруппированным данным:
Относительные показатели вариации:
Относительный размах вариации или коэффициент осцилляции (КR):
;Относительное линейное отклонение или линейный коэффициент вариации (К
):
;Коэффициент вариации (V):
.
Виды дисперсий и их взаимосвязь. При проведении группировки изучаемой совокупности по факторному признаку (х) вариацию результативного признака ( у) можно оценить с помощью 3-х видов дисперсии:
общей дисперсии (
);межгрупповой дисперсии (
);средней из внутригрупповых дисперсий (
).
Общая
дисперсия
характеризует вариацию результативного
признака под влиянием всех факторов,
вызывающих эту вариацию и вычисляется
по формуле:
или
,
где
-
средняя по всей совокупности;
-
частоты, если по у
построен вариационный ряд.
Межгрупповая
дисперсия
отражает вариацию результативного
признака под воздействием фактора,
положенного в основу группировки:
,
где
-
средняя результативного признака по
каждой i-ой
группе;
-
частота появления признака в i-ой
группе;
;
k -число
групп.
Средняя
из внутригрупповых дисперсий
показывает вариацию результативного
признака под воздействием всех факторов,
кроме группировочного:
;
,
где
-
внутригрупповая дисперсия или дисперсия
i-ой
группе;
.
Между видами дисперсий существует взаимосвязь, называемая правилом сложения дисперсий: = + .
Это правило используется в статистике для определения степени тесноты связи между изучаемыми признаками.
Для количественной оценки тесноты связи между явлениями на основе рассмотренных дисперсий вычисляют ряд показателей, которые будут рассмотрены далее в теме: “Статистические приемы выявления взаимосвязи между социально-экономическими явлениями”.
Показатели формы распределения.
Для сравнительного анализа степени асимметрии нескольких распределений рассчитывается показатель асимметрии (АS):
или
Если
> 0,то это указывает на наличие
правосторонней асимметрии, а при
,
- левосторонней.
Оценка
существенности AS
проводится на основе средней
квад-ратической ошибки коэффициента
(
):
.
Если
,
асимметрия распределения существенна
и распределение признака в генеральной
совокупности несимметрично. В противном
случае асимметрия несущественна, и ее
наличие может быть вызвано случайными
факторами.
Для
симметричных распределений рассчитывается
показатель эксцесса (островершинности):
,
где
m4
– центральный момент четвертого
порядка; m4
=
.
Эксцесс у высоковершинных распределений положительный, а у низковершинных – отрицательный. Появление значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности.
Для
оценки существенности коэффициента
эксцесса используется его средняя
квадратическая ошибка
(
):
.
Если
,
то значение коэффициента эксцесса
существенно или статистически значимо.
