Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
0491807_F3EAE_lekcii_po_statistike / 007_вариация.doc
Скачиваний:
90
Добавлен:
16.04.2015
Размер:
318.46 Кб
Скачать

Тема 7. Изучение вариации Показатели анализа вариационного ряда распределения

  • среднее значение;

  • мода;

  • медиана;

  • квантили;

  • размах вариации;

  • среднее линейное отклонение;

  • среднее квадратическое отклонение;

  • дисперсия;

  • коэффициент осцилляции;

  • линейный коэффициент вариации;

  • коэффициент вариации;

  • асимметрия;

  • эксцесс распределения.

Структурные характеристики

Структурные средние

Квантили

  • Мода

  • Квартили

  • Квинтили

  • Медиана

  • Сикстили

  • Децили

  • Перцентили

Мода -- наиболее часто встречающееся значение признака, т.е. тот вариант, который имеет наибольшую частоту.

  • для дискретного: не требуется применения никакой формулы, модой будет максимально часто встречающееся значение признака

  • для интервального (непрерывный, равноинтервальный вариационный ряд) по формуле:

где домодальный интервал, послемодальный интервал,

- мода, -начальное значение модального интервала,

h – ширина, m – частота

Например: чаще всего за футбольный матч было забито 2 мяча - 71 раз (см.табл.). Модой является число 2.

Распределение футбольных матчей по числу забитых за матч обеими командами мячей

Число забитых мячей, х

0

1

2

3

4

5

6

7

8

9

Итого

Число матчей, fi

30

56

71

59

49

24

12

3

0

2

306

Медиана -- значение признака, приходящееся на середину ранжированной совокупности. Средняя величина, центральный член ранжированного ряда. Медиана не зависит от значений признака на краях ранжированного ряда. Она может быть рассчитана и в дискретных, и в непрерывных вариационных рядах

• для дискретного:

• для интервального:

Например, в таблице, отражающей урожайность, медианным является среднее из 143 значений, т.е. 72-е от начала ряда значение урожайности. Как видно из ряда накопленных частот, оно находится в четвертом интервале.

Группы хозяйств по урожайности, ц/га хj

Число хозяйств

fj

Середина интервала,

ц/га хj'

xj

Накопленная частота fj

10- 15

6

12,5

75,0

б

15-20

9

17,5

157,5

15

20-25

20

22,5

450,0

35

25 -30

41

27,5

1127,5

76

30-35

26

32,5

845,0

102

35-40

21

37,5

787,5

123

40-45

14

42,5

595,0

137

45 - 50

5

47,5

23-7,5

142

50-55

1

52,5

52,5

143

Итого

143

4327,5

Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.

Если < < , то имеет место левосторонняя асимметрия ряда.

Если <<, то имеет место правосторонняя асимметрия ряда.

Если = = , то распределение нормальное.

Для выражения особенностей формы распределения рассчитываются ранговые характеристики и кривые распределения. Ранговые характеристики носят общее название квантили.

Квантили – значения признака, которые делят ряд распределения на равные части

Позволяют детально изучить вариационные ряды. Они подразделяются на «семейства»

  1. Квартили

  2. Квинтили

  3. Сикстили

  1. Децили

  2. Перцентили

Квартили - Аналогично медиане вычисляются значения признака, делящие ранжированную совокупность делят на четыре равные части. Ясно, что Q2 совпадает с Me

Первый (нижний) квартиль отсекает от совокупности ¼ часть единиц с минимальными значениями, а третий (верхний) отсекает ¼ часть единиц с максимальными значениями. С помощью квартилей мы определяем границы, где находятся 50% единиц, наиболее характерные для этой совокупности. При этом вторая квартиль является медианой.

Квинтили- ранжированную совокупность делят на пять равных частей

Квартили

Квинтили

Первая квартиль

Первый квинтиль

Третья квартиль

Четвертый квинтиль

Сикстили - ранжированную совокупность делят на шесть равных частей.

Децили - ранжированную совокупность делят на десять равных частей

Пример - децильный коэффициент дифференциации населения. Население делится на 10 частей по уровню дохода. Берут первые 10% и последние 10%. Считают, что средний доход последней группы не должен быть больше, чем в 10 раз среднего дохода первой группы. В России официально это превышение составляет 14-16 раз, неофициально – 20 и более раз

Перцентили (процентили) - ранжированную совокупность делят на сто равных частей

Сикстили

Децили

Перцентили

Показатели вариации. С разной степенью точности дают оценку силе вариации

Признак

Количественный

Альтернативный

Абсолютные показатели

Относительные показатели

Среднее квадратическое отклонение альтернативного признака

Размах вариации

Коэффициент осцилляции

Среднее линейное отклонение

Линейный коэффициент вариации

Среднее квадратическое отклонение;

Коэффициент вариации по среднему квадратическому отклонению

Дисперсия

Размах вариации - представляет разность между наибольшим и наименьшим значением варьирующего признака. Размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности, поэтому показателем силы вариации выступает среднее линейное отклонение.

Среднее линейное отклонение - представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариант от их средней арифметической величины (причем берется модуль отклонений)

Простая

Взвешенная

С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования.

Среднее квадратическое отклонение показывает насколько в среднем отклоняются варианты признака от его среднего значения

Простая

Взвешенная

Дисперсия- средний квадрат отклонений значений признака от их средней величины

(Среднее квадратическое отклонение в квадрате)

Простая

Взвешенная

Упрощенный способ расчета

Простая

Взвешенная

Относительные показатели вариации

Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации.

Коэффициент осцилляции:

Линейный коэффициент вариации:

Коэффициент вариации:

Если коэффициент вариации больше 33%, то можно сделать вывод, что вариация сильная, а совокупность неоднородная; меньше 33% - вариация небольшая, совокупность однородная

Дисперсия альтернативного признака, имеющего два взаимно исключающих значения:

Наибольшая вариация совокупности достигается в случаях, когда часть совокупности, составляющая 50% от всего объема совокупности, обладает признаком, а другая часть совокупности, также равная 50%, не обладает данным признаком, при этом дисперсия достигнет максимального значения при 0,25, т.е.

P = 0,5 G = 1- P = 1-0,5 = 0,5

Если статистическая совокупность разбита на группы, то возможно вычисление групповых дисперсий, средней из групповых дисперсий, межгрупповой дисперсии и общей дисперсии. Между ними существует связь, называемая правилом сложения дисперсии:

Виды дисперсий

В совокупности разделенной на части выделяют:

  • общую дисперсию

  • межгрупповую дисперсию

  • среднюю из внутригрупповых дисперсий

  • Правило сложения дисперсий:

Центральные моменты распределения

Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели получили название центральных моментов распределения порядка, соответствующего степени, в которую возводятся отклонения, или просто моментов.

Показатели формы распределения

  • Асимметрия – Коэффициент асимметрии характеризует асимметричность («скошенность») распределения признака в совокупности

  • Эксцесс – Показатель эксцесса представляет собой отклонение вершины эмпирического распределения вверх или вниз («крутость») от вершины кривой нормального распределения

Асимметрия распределения

  • При =0 распределение считается нормальным.

  • При > 0 правосторонняя асимметрия.

  • При <0 левосторонняя асимметрия.

  • Если асимметрия более 0,5, то независимо от знака она считается значительной

  • Если асимметрия меньше 0,25, то она считается незначительной

Асимметрия распределения рассчитанная по формулам К.Пирсона:

является приблизительной

Расчет асимметрии распределения при помощи нормированного момента третьего порядка дает наиболее точный результат

т.е.

- нормированный момент третьего порядка

Показатель Пирсона зависит от степени асимметричности в средней части ряда распределения, а показатель асимметрии, основанный на моменте третьего порядка, - от крайних значений признака.