
- •1. Возникновение и развитие статистики
- •2.Предмет и задачи статистики
- •3.Метод статистического исследования
- •4.Система статистических показателей
- •5.Статистическая совокупность
- •6.Статистическое наблюдение и его основные организационные формы
- •7.Основные формы и виды статистического наблюдения
- •9. Ошибки при статистическом наблюдении и их достоверность
- •10.Статистическая сводка и группировка
- •11.Группировка и ее виды
- •12.Ряды распределения и их значение в экономическом анализе
- •13.Статистические таблицы и порядок их построения
- •14.Абсолютные величины в статистике
- •15.Относительные величины в статистикеъ
- •16.Суть и порядок исчисления средних величин
- •17.Мода и медиана в статистике
- •18.Вариация и ее показатели
- •19.Ряды динамики
- •20.Основные показатели рядов динамики и порядок их исчисления
- •21.Средний арифметический и гармонический индексы
- •22.Суть и основные элементы графиков
- •23.Основные виды графиков и порядок их построения
- •24.Суть и методика исчисления индивидуальных индексов
- •25.Суть и методика исчисления агрегатных общих индексов.
- •26.Ошибки репрезентативности и порядок их вычисления
17.Мода и медиана в статистике
Структурное среднее характеризует состав статистической совокупности по одному из варьирующих признаков. К этим средним относятся мода и медиана.
Мода - такое значение варьирующего признака, которое в данном ряду распределения имеет наибольшую частоту.
В дискретных рядах распределений мода определяется визуально. Сначала определяется наибольшая частота, а по ней модальное значение признака. В интервальных рядах для вычисления моды используется следующая формула:
Xmo - нижняя граница модальности (интервал ряда с наибольшей частотой)
Mo - величина интервала
fMo - частота модального интервала
fMo-1 - частота интервала предшествующего модальному
fMo+1 - частота интервала следующего за модальным
Медианой называется такое значение варьирующего признака, которое делит ряд распределения на две равные части по объему частот. Медиана рассчитывается по разному в дискретных и интервальных рядах.
1. Если ряд распределения дискретный и состоит из четного числа членов, то медиана определяется как средняя величина из двух серединных значений рангированного ряда признаков.
2. Если в дискретном ряду распределения нечетное число уровней, то медианой будет серединное значение рангированного ряда признаков.
В интервальных рядах медиана определяется по формуле:
- нижняя граница медианного интервала (интервала для которого накопленная частота впервые превысит полусумму частот)
Me - величина интервала
- сумма частот ряда
- сумма накопленных частот предшествующих медианному интервалу
- частота медианного интервала
18.Вариация и ее показатели
Вариация — это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д. Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна. Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может бьпъ одинакрвои, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом — эти отличия велики, т.е. в одном случае вариация признака мала, а в другом - велика, это имеет весьма важное значение для характеристики надежности средней величины. К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации. Самым элементарным показателем вариации признака является размах вариации R, представляющий собой разность между максимальным и минимальным значениями признака: R=Xmax-Xmin
Среднее линейное отклонение d‾ представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта: (х - x‾).
Среднее линейное отклонение: для несгруппированных данных d =∑ | x-x‾| / n
где п — число членов ряда; для сгруппированных данных d‾=∑ | x-x‾| f / ∑ f
где ∑f - сумма частот вариационного ряда.
Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий ( в зависимости от исходных данных):1) простая дисперсия для несгруппированных данных σ2=∑(X-X‾)2 / n 2)взвешенная дисперсия для вариационного ряда σ2=∑(X-X‾)2 f / ∑f Cвойства дисперсии: 1)если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится; 2)если все значения признака уменьшить или увеличить в одно и то же число раз (i раз), то дисперсия соответственно уменьшится или увеличится в i2 раз. Используя второе свойство дисперсии, разделив все варианты на величину интервала, получим следующую формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов:
где а — дисперсия, исчисленная по способу моментов; i— величина интервала; x1=x-A/ i новые (преобразованные) значения вариантов
(А — условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой);
— момент второго порядка;
— квадрат момента первого порядка
Среднее квадратическое отклонение σ равно корню квад-| ратному из дисперсии:
для несгруппированных данных
для вариационного ряда
Среднее квадратическое отклонение — это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, на сколько в среднем отклоняются конкретные ва- рианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.
Обозначим: 1 — наличие интересующего нас признака; 0 — его отсутствие; р — доля единиц, обладающих данным признаком; q — доля единиц, не обладающих данным признаком; р + q =1. Исчислим среднее значение альтернативного признака и его дисперсию. Среднее значение альтернативного признака так как p + q = l.,то
Дисперсия альтернативного признака
Подст-в в формулу дисперсии q = 1 - р, получим
Среднее квад-ое отклонение альтерн-ого признака
Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:: V= σ / X‾ *100
Общая дисперсия σ2 измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей средней х и может быть вычислена как простая дисперсия
Межгрупповая дисперсия δ 2 характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних X‾i от общей средней X‾ :
Внутригрупповая (частная) дисперсия σ2 i отражает случайную вариацию, т.е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы х) (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно:
На
основании внутригрупповой дисперсии
по каждой группе, т.е. на основании
σ2
i
можно
определить общую среднюю
извнутригрупповых дисперсий :
Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:
Внутригрупповые дисперсии показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.) , кроме различий в квалификационном разряд . Средняя из внутригрупповых дисперсий отражает вариацию выработки, обусловленную всеми факторами, кроме квалификации рабочих, но в среднем по всей совокупности. Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп рабочих по квалификационному разряду. Общая дисперсия отражает суммарное влияние всех возможных факторов на общую вариацию среднечасовой выработки изделий всеми рабочими цеха.
Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации ( ή 2 ) — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:
ή 2=δ2 / σ2 Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэф равен 0, а при функциональной связи – единице. Эмпирическое корреляционное отношение — это корень квадратный из эмпирического коэффициента детерминации: v
ή=√ δ2 / σ2 оно показывает тесноту связи между группировочным и результативным признаками.
Эмпирическое корреляционное отношение ή , как и ή 2, может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии , т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.
Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.