Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика-для воскресного образов..docx
Скачиваний:
4
Добавлен:
24.08.2019
Размер:
339.7 Кб
Скачать

Структурные средние

Помимо степенных средних в статистической практике используются структурные средние, в качестве которых рассматриваются мода и медиана. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака.

Мода ( )– значение случайной величины, встречающееся с наибольшей вероятностью в дискретном вариационном ряду – вариант, имеющий наибольшую частоту.

Широко используется при изучении покупательского спроса, регистрации цен и т.п.

Формула для вычисления:

,

где – нижняя граница модального интервала;

– частоты в модальном, предыдущем и следующем за модальным интервалом (соответственно).

Модальный интервал определяется по наибольшей частоте.

Пример: По таблице 1 рассчитаем моду. Наибольшая частота 16 в интервале [499 – 622), следовательно это и есть модальный интервал.

руб.

Итак, чаще всего встречаются АО с размером дивидендов 552 рубля.

Медиана – варианта, которая находится в середине вариационного ряда.

Делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значением признака больше медианы.

Номер медианы для нечетного числа членов ряда вычисляется по формуле:

где – число членов ряда.

В случае четного объема ряда медиана равна средней из двух вариантов, находящихся в середине ряда.

Вычисляется медиана по формуле:

где – нижняя граница медианного интервала;

– медианный интервал;

– половина от общего числа наблюдений;

– сумма наблюдений, накопленная до начала медианного интервала;

– число наблюдений в медианном интервале.

Пример 3: По таблице 1 найдем медиану (медианный интервал [499 – 622), так как половина накопленных частот принадлежит этому интервалу):

руб.

Следовательно, половина АО имеет дивиденды больше 537 руб., а половина меньше этого значения.

Соотношения между средней арифметической, медианой и модой в статистических распределениях. Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда. Поэтому соотношение моды, медианы и средней арифметической позволяет оценить асимметрию ряда распределения.

Мода и медиана, как правило, являются дополнительными к средней характеристиками совокупности и используются в математической статистике для анализа формы рядов распределения.

Аналогично медиане вычисляются значения признака, делящие совокупность на четыре равные (по числу единиц) части – квартили, на пять – квинтили, на десять – децили, на сто – перцентили.

Тема 2.Статистическое изучение вариации

Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Вариация в переводе с латинского означает «колеблемость», «изменчивость», «непостоянство». Предполагая, что большинство социально-экономических явлений и процессов варьируют в некотором масштабе, статистика разработала методологию расчета показателей вариации, которые, в свою очередь, могут быть абсолютными, относительными и средними.

Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.

1) Размах вариации – разность между максимальным и минимальным значением признака:

.

Он характеризует пределы изменения признака.

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Простейший показатель такого типа среднее линейное отклонение.

2) Среднее линейное отклонение – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).

– среднее линейное отклонение для несгруппированных данных: ,

где – число членов ряда.

То есть среднее линейное отклонение равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.

–для сгруппированных данных: ,

где – сумма частот вариационного ряда.

В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.

Поэтому среднее линейное отклонение применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли и др.

3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).

В общем виде взвешенная дисперсия исчисляется по формуле:

или простая дисперсия:

.

4) Среднее квадратическое отклонение ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:

– для несгруппированных данных;

– для сгруппированных данных (для вариационного ряда).

Коэффициент вариации. В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.

Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации.

Коэффициент вариации – представляет собой выраженное в процентах отношение СКО к средней арифметической.

,

это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.

Рассмотрим расчет показателей вариации.

Пример. По исходным данным (таблица 1) определить: размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Решение:

1)  руб.

Таблица

АО с размером дивидендов, руб.

Число АО ( )

Середина интервала ( )

7 – 130

130 – 253

253 – 376

376 – 499

499 – 622

622 – 745

745 – 868

868 – 991

13

12

7

13

16

12

13

14

68,5

191,5

314,5

437,5

560,5

683,5

806,5

929,5

890,5

2298

2201,5

5687,5

8968

8202

10484,5

13013

-448,95

-325,95

-202,95

-79,95

43,05

166,05

289,05

412,05

201556,1

106243,4

41188,7

6392,003

1853,303

27572,6

83549,9

169785,2

2620229,33

1274920,83

288320,92

83096,03

29652,84

330871,23

1086148,73

2376992,84

ИТОГО

100

51745

8090232,75

– среднее значение находили в примере 1, оно равно 517,45 руб.

2) дисперсия: .

3) среднее квадратическое отклонение: руб.

4) коэффициент вариации: .

Анализ полученных данных говорит о том, что размер дивидендов АО отличается от среднего размера ( =517,45) в среднем на 284 рубля, или на 55 %. Значение коэффициента вариации превышает 33 %, следовательно, вариация размера дивиденда велика, найденный средний размер дивиденда плохо представляет всю совокупность АО, не является ее типичной, надежной характеристикой, а саму совокупность нет оснований считать однородной по размеру дивидендов.

Виды дисперсии.

Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.

Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:

  • Общая дисперсия

– Средняя из внутригрупповых дисперсий

  • Межгрупповая дисперсия

Общая - измеряет вариацию во всей совокупности

– внутригрупповая - измеряет вариацию признака внутри группы, - групповая средняя.

Средняя из внутригрупповых дисперсий исчисляется ,

где – частота появления внутригрупповой дисперсии одной величины (одного размера).

Межгрупповая дисперсия – измеряет колеблемость групповых средних вокруг общей средней :

Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.

Правило сложения дисперсий.

Общий закон (правило) сложения дисперсий ‑ Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.

Показывает значение фактора, положенного в основу группировки (из всей совокупности факторов).

Коэффициент детерминации – есть квадрат эмпирического корреляционного отношения.

Эмпирическое корреляционное отношение – есть корень квадратный из отношения межгрупповой дисперсии к общей:

– характеризует влияние группировочного признака на результативный признак (оба показателя (числитель и знаменатель) не превышают по своей величине единицы: чем больше показатели в этих пределах, тем теснее взаимосвязь между изучаемыми признаками).

; – влияние других факторов равно 0.

– влияние признака равно 0.