Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция.docx
Скачиваний:
11
Добавлен:
17.08.2019
Размер:
190.78 Кб
Скачать

§ 2. Показатели вариаций.

Если средние дают обобщённую характеристику совокупности, то показатели вариаций характеризуют различия между единицами рассматриваемой совокупности.

  1. По индивидуальным значениям признака x1,…,xn:

, где n – число единиц в рассматриваемой совокупности.

Легко увидеть, что σ представляет собой среднее отклонение от средней. Чем сильнее отдельные единицы в совокупности отличаются от их среднего значения, тем сильнее вариация единиц в изучаемой совокупности и тем больше они отличаются друг от друга.

  1. Для дискретного ряда расчёт проводится по формуле:

, где xi – варианты вариационного ряда,

fi - их частоты,

n – число вариантов в частотном ряду.

  1. Расчёт σ для интервального вариационного ряда определяется точно так же, с той лишь разницей, что вместо значений вариантов xi берётся значение середины интервала (соответствующего интервала) - xi’:

К вадрат среднего квадратичного отклонения (σ2) носит название дисперсии. Для сравнения вариаций различных совокупностей используют показатель, называемый коэффициентом вариации:

Необходимость использования коэффициента вариации в экономическом анализе определяется следующими причинами:

  1. σ является именованной величиной (т.е. измеряется в кг, м, рублях и т.д.), поэтому сравнивать между собой значения σ для признаков, имеющих разные единицы измерения, нельзя.

  2. Величина σ при прочих равных условиях тем больше, чем больше величина средней (отклонения от которой измеряются при делении на среднюю зависимость) от её величины устраняется.

Тема 5. Статистическое изучение связей.

§ 1. Жёстко детерминированные и стохастические (вероятностные) связи.

Взаимосвязи между явлениями можно разделить на жёстко детерминированные и стохастические. При наличии жёстко детерминированной связи, зная, чему равны значения независимых переменных, можно точно сказать, чему будет равна величина зависимой переменной (например: а = 2 => а2 = 4; жёсткая детерминированная связь).

При наличии стохастической связи, даже зная значение независимой переменной, мы не сможем точно сказать, чему будет равно значение зависимой переменной. Например, между среднедушевым ВВП страны и средней продолжительностью жизни существует вполне определённая зависимость. Однако, зная величину ВВП на одного человека, мы не можем определить среднюю продолжительность жизни.

При стохастической связи одному значению независимой переменной соответствует некоторое распределение возможных значений зависимых переменных, т.е. последняя может с определёнными вероятностями принимать те или иные значения.

Пример: распределение работников бригады по стажу работы по специальности и заработной плате.

Стаж

Заработная плата (руб.)

Итого

До 5000

5000+

До 3 лет

9

2

11

3+ лет

1

8

9

Итого

10

10

20

§ 2. Аналитическая группировка, коэффициент детерминации и эмпирическое корреляционное отношение.

Простейшим методом анализа стохастических связей является аналитическая группировка.

Среднедушевой

доход семьи (тыс. р.), x

Число семей

(с данным уровнем дохода), ni

Доля расходов на питание

в общей сумме доходов семьи (%), yi

< 1

100

80

1 – 2

200

70

2 – 4

400

60

4 – 6

200

50

6 +

100

30

Итого:

1000

58

Как видно из таблицы, связь между среднедушевым доходом и долей расходов на питание является обратной (влияние x на y и z1, z2 и z5 на y).

Для количественной характеристики того, насколько тесно связаны между собой рассматриваемые переменные, рассчитывается коэффициент корреляции и эмпирическое корреляционное отношение. С помощью этих показателей выясняют, какая часть вариаций результативного признака y обусловлена вариацией факторного признака x, а какая – всеми остальными факторами.

Расчёт этих показателей основывается на правиле разложения дисперсии: σ2 = σ2вн + σ2меж, где σ2 – общая дисперсия, σ2вн - внутригрупповая дисперсия и σ2меж – межгрупповая дисперсия.

Рассмотрим понятие σ2вн. Семьи со среднедушевым доходом меньше 1000 р. Различаются между собой по доле расходов на питание в семейном бюджете (например, в одной группе он может составлять 85%, в другой – 82%, 88% и т.д.). Т.о. можно подсчитать дисперсию доли расходов на питание в группе семей со среднедушевым доходом меньше 1000 р. Аналогично можно подсчитать дисперсию доли расходов на питание и в любой другой группе с другим уровнем среднедушевого дохода.

. , где yij – значение признака yi для j-й единицы совокупности из i-й группы (в нашем случае – доля расходов на питание в семье j из группы i),

yi – среднее значение признака y в группе i (в нашем случае – доля расходов на питание в группе i),

ni – число единиц (в нашем случае – семей) в группе i.

Средняя из дисперсий σ2вн носит название внутригрупповой дисперсии:

, где k – число групп в аналитической группировке.

Средние доли расходов на питание в каждой из i групп также различны. Следовательно, можно подсчитать их дисперсии. Такая дисперсия носит название межгрупповой и определяется по формуле:

Межгрупповая дисперсия составляет:

= [ ]/1000 = 146,1

Вариации средних долей расходов на питание в различных группах связано, прежде всего, с влиянием дохода. Поэтому межгрупповая дисперсия отражает влияние рассмотренного фактического признака (в нашем случае – уровня доходов) на результативный признак (в нашем случае – доля расходов на питание).

Внутригрупповая дисперсия характеризует вклад прочих факторов, межгрупповая – вклад факторов, положенных в основание группировки (в нашем случае – доходы), а общая дисперсия – вклад всех факторов (как прочих, так и положенных в основание группировки. Ввиду этого коэффициент детерминации:

η2 = σ2меж2 характеризует долю результативного признака, обусловленного вариацией фактического признака, положенного в основании группировки (в нашем случае – дохода).

Пусть общая дисперсия равна 180, тогда η2 = 146,1/180 = 0,81. Это значит, что вариация расходов на питание на 81% обусловлена влиянием дохода, и только на 19% - влиянием остальных факторов.

Квадратный корень из коэффициента детерминации носит название эмпирического корреляционного отношения (в н. сл. – 0,9).

Как η2, так и могут находиться в интервале (0;1). При этом чем ближе к 1 значение рассматриваемых показателей, тем более тесная связь наблюдается между факторами и результативной переменной.

Иными словами, чем ближе к 1 значение рассматриваемых показателей, тем в большей степени вариация результативного признака объясняется вариацией фактического признака.