Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ruhmanova_2012

.pdf
Скачиваний:
117
Добавлен:
08.04.2015
Размер:
1.26 Mб
Скачать

Линейный коэффициент корреляции принимает значения от –1 до +1. При r < 0 связь является обратной, при r > 0 — прямой. Если r = 0, то линейная связь отсутствует. Чем ближе значение коэффициента к единице, тем связь теснее.

Квадрат линейного коэффициента корреляции (r2) называ-

ется линейным коэффициентом детерминации и принимает зна-

чения от 0 до 1.

Совпадение значений теоретического корреляционного отношения и линейного коэффициента корреляции свидетельствует о наличии линейной связи между признаками (в этом случае η2 – r2 0,1). Если их значения не совпадают, то связь является криволинейной.

Если показатели тесноты связи были рассчитаны по данным небольших статистических совокупностей, то их значения могут искажаться влиянием случайных причин. Следовательно, прежде чем распространять выводы по результатам выборки на генеральную совокупность, необходимо проверить существенность (значимость) показателей корреляции.

Так, для оценки значимости линейного коэффициента корреляции рассчитывают t-критерий Стьюдента:

tрасч. = r

 

n − 2

.

 

1 − r 2

 

 

Рассчитанное значение t-критерия сравнивают с табличным (α = 0,05; v = n – 2 ). Если выполняется условие: tрасч. > tтабл., то вероятность того, что найденное значение коэффициента корреляции обусловлено только случайными факторами, ничтожно мала.

После проверки адекватности и надежности построенной регрессионной модели ее необходимо подвергнуть качественному анализу. В первую очередь необходимо проверить, соответствуют ли знаки параметров теоретическим представлениям о направлении влияния факторного признака на результативный.

Кроме того, для удобства интерпретации параметра а1 (при однофакторной связи) вычисляют коэффициент эластичности, который показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1 %:

101

Э = а1 x . y

Экономический смысл имеет расчет остатков (ε), т. е. отклонений фактических значений от расчетных ( у уˆ ). Важное значение имеют как положительные, так и отрицательные остатки (отклонения от ожидаемого уровня). Например, при изучении зависимости производительности труда от стажа рабочие (единицы совокупности), имеющие наибольшие отрицательные отклонения, являются в данном случае отстающими, требующими особого внимания. Рабочие с наибольшими положительными остатками являются передовиками и обеспечивают наибольшее повышение средней выработки.

7.3. Измерение связей неколичественных переменных. Непараметрические показатели связи

Условием использования корреляционно-регрессионного анализа является количественная измеримость признаков (факторных и результативных). Вместе с тем в статистике широко изучаются связи и между качественными (атрибутивными) признаками, имеющими смысловое выражение. В отличие от исследования количественных признаков, связи между качественными признаками не нужно описывать с помощью каких-либо аналитических моделей (уравнений). В данном случае устанавливают факт наличия связи и измеряют ее тесноту. Наиболее часто такая потребность возникает при исследованиях связей социальных явлений.

При проведении статистических исследований часто приходится анализировать связи между альтернативными призна- ками, т. е. признаками, имеющими противоположные (или взаимоисключающие) характеристики. Теснота связи в этом случае оценивается с помощью коэффициентов ассоциации и контин-

генции. Для их расчета строится специальная корреляционная таблица (таблица сопряженности), в которой отражается связь между двумя качественными признаками (явлениями). Каждый из них является альтернативным, т. е. характеризуется двумя противоположными значениями (например, высокий, низкий).

102

Таблица 15

Значения двух альтернативных признаков

a

b

a + b

c

d

c + d

a + c

b + d

a + b + c + d

Коэффициенты определяют по следующим формулам. Коэффициент ассоциации (Ка):

Ка

=

ad bc

.

 

 

 

ad + bc

Коэффициент контингенции (Кк):

Кк =

 

ad bc

 

.

 

 

 

(a + b)(b + d )(a + c)(c + d )

 

 

 

 

Значение коэффициента контингенции будет всегда меньше значения коэффициента ассоциации. Связь считается подтвержденной, если Ка ³ 0,5, а Kк ³ 0,3.

Если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи используют коэффициенты взаимной сопряженности К. Пирсона и А. А. Чупрова.

Коэффициент К. Пирсона вычисляется по формуле

 

=

 

 

ϕ 2

 

K П

 

 

 

,

 

 

 

1

+ ϕ 2

где j2 — показатель взаимной сопряженности.

Показатель взаимной сопряженности (j2) определяется на основе специальной вспомогательной таблицы значений качественных признаков.

Таблица 16

Вспомогательная таблица для расчета коэффициента взаимной сопряженности

Значение

 

Значение признака В

 

Итого

признака A

B1

 

B2

 

B3

 

 

 

A1

nA1B1

 

nA1B2

 

nA1B3

nA1

A2

 

 

nA2

A3

 

 

nA3

Итого

nB1

 

nB2

 

nB3

n

 

 

103

 

 

 

Показатель ϕ2 рассчитывается как

ϕ 2 =

nAB2

− 1.

 

 

 

nA nB

 

 

 

 

 

 

 

 

 

 

 

 

 

Или

 

 

 

 

 

 

 

 

 

 

 

 

 

n AB2

 

 

 

n AB2

 

 

1 + ϕ 2 =

 

na

=

 

.

 

 

 

 

nB

n

 

n

 

 

B

 

A

 

 

 

 

 

 

Коэффициент А. А. Чупрова определяется как

КЧ

=

 

 

 

ϕ 2

 

 

 

,

 

 

 

 

 

 

(k1

− 1)(k 2

 

 

 

 

 

− 1)

где k1 и k2 — число возможных значений соответственно первого и второго изучаемых качественных признаков.

Абсолютные значения рассмотренных показателей могут изменяться в пределах от 0 до 1. Чем ближе значения коэффициентов взаимной сопряженности к единице, тем теснее связь между исследуемыми признаками. При использовании коэффициента А. А. Чупрова уже при значении 0,3 можно говорить о тесной связи между вариацией исследуемых признаков.

При исследованиях социально-экономических явлений часто используют различные условные оценки (ранги), а взаимосвязи между отдельными признаками измеряют с помощью непара-

метрических коэффициентов.

В таких случаях проводится ранжирование, т. е. упорядочение объектов изучения в порядке возрастания или убывания их величин. Порядковые номера упорядоченных объектов называются рангами. Если отдельные значения признака имеют одинаковые порядковые номера, то ранги этих значений принимают равными средней арифметической от соответствующих номеров мест. Такие ранги называют связными.

Наибольшее значение среди ранговых коэффициентов име-

ет, в частности, коэффициент корреляции рангов (коэффициент Спирмена, ρ).

104

Ранговый коэффициент Спирмена рассчитывается не по значениям двух взаимосвязанных признаков, а по их рангам как

ρ x / y

= 1 −

6di2

 

 

,

n(n 2

1)

 

 

 

где di2 — квадрат разности рангов; n

 

число наблюдений (пар

рангов).

 

 

 

 

Коэффициент Спирмена принимает значения в интервале от –1 до +1. Связь между признаками считается значимой, если значение коэффициента больше 0,5.

Значимость коэффициента Спирмена проверяется с помощью t-критерия Стьюдента. Расчетное значение критерия определяется следующим образом:

t р

= ρ x / y

 

n − 2

 

.

1

− ρ x2

/ y

 

 

 

 

Значение рангового коэффициента Спирмена считается существенным, если расчетное значение t-критерия превышает табличное (tр > tкр.; α = 0,05; k = n – 2).

Этот коэффициент может быть использован для определения тесноты связи как между количественными, так и между качественными признаками (рейтинги, уровни образования, квалификации и т. п.), которые поддаются ранжированию.

Контрольные вопросы

1.В чем состоит значение статистического изучения зависимостей между социально-экономическими явлениями?

2.Какие виды связей выделяют?

3.Охарактеризуйте статистические методы изучения связей.

4.В чем состоит сущность корреляционного и регрессионного методов анализа связи?

5.Каким образом можно оценить надежность выбранной модели регрессии?

6.Как осуществляется экономическая интерпретация полученных результатов?

7.Раскройте содержание непараметрических методов измерения связи.

105

Тесты

1. Связь между двумя признаками считается подтвержденной, если значение коэффициента ассоциации больше:

a)0,5; б) 0; в) 0,2; г) 0,3.

2.Если уравнение регрессии между себестоимостью единицы продукции

(Y) и производительностью труда одного рабочего (X) выглядит следующим образом: Y = 320 – 0,2*X, то при увеличении факторного признака результативный:

a)уменьшается;

б) увеличивается; в) изменяется произвольно; г) не изменяется.

3. Связь является функциональной, если определенному значению факторного признака соответствует:

a) одно значение результативного признака; б) 0 значений результативного признака; в) 2 значения результативного признака;

г) несколько значений результативного признака.

4. Если уравнение регрессии между себестоимостью единицы продукции и накладными расходами выглядит следующим образом: Y = 10 + 0,05 * x, то по мере роста накладных расходов на 1 рубль себестоимость единицы продукции повышается:

a)на 5 копеек; б) 10,05 рублей; в) 5 рублей;

г) 10,05 %.

5.Связь между признаками является функциональной, если значение линейного коэффициента корреляции равно:

a)1;

б) 0; в) 0,5; г) 0,3.

6. Если значение линейного коэффициента корреляции составляет

_________, то связь между У и Х можно признать тесной: a) 0,75;

б) 0,6; в) 0,5; г) 0,3.

106

7. По направлению связи в статистике классифицируются: a) на прямые и обратные;

б) линейные и криволинейные; в) сильные и слабые; г) закономерные и произвольные.

8. Если значение коэффициента корреляции составляет __________ , то связь между явлениями характеризуется как обратная и тесная:

a) – 0,8; б) 0,8; в) 0,25; г) – 0,25.

9. По аналитическому выражению различаются связи: а) обратные; б) тесные;

в) криволинейные.

10.Функциональной является связь: а) между двумя признаками;

б) при которой определенному значению факторного признака соответствует несколько значений результативного признака; в) при которой определенному значению факторного признака соответствует одно значение результативного признака.

11.Аналитическое выражение связи определяется с помощью метода анализа:

а) корреляционного; б) регрессионного; в) группировок.

12.Коэффициент корреляции рангов Спирмена можно применять для оценки тесноты связи между:

а) количественными признаками; б) качественными признаками, значения которых могут быть упорядочены;

в) любыми качественными признаками.

13.По какому коэффициенту можно определить в среднем процент изменения результативного признака при изменении факторного признака на 1 %:

а) бетта-коэффициенту; б) коэффициенту эластичности;

в) коэффициенту детерминации; г) коэффициенту регрессии.

107

Глава 8

СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ДИНАМИКИ

8.1.Понятие, назначение и виды динамических рядов

Вусловиях социально-экономической нестабильности все большую актуальность приобретает задача всестороннего изучения особенностей и тенденций изменения экономических, социальных, финансовых индикаторов развития экономики во време- ни. С этой целью проводятся построение и анализ динамических рядов (рядов динамики).

Динамический ряд — это ряд расположенных во времени (в хронологической последовательности) значений статистического показателя. Любой ряд динамики состоит из двух элементов:

у уровень динамического ряда — значение показателя на конкретную дату или за определенный период времени;

t временной параметр (дата, период), к которому относится то или иное значение уровня ряда динамики.

Ряды динамики можно классифицировать по различным основаниям:

— по времени, отраженному в рядах динамики;

— по расстоянию между уровнями динамического ряда;

— в зависимости от способа выражения уровней (вида статистических показателей) динамического ряда;

— по числу показателей.

1. По времени, отраженному в рядах динамики, различают моментные и интервальные динамические ряды.

Моментные динамические ряды включают показатели,

которые характеризуют значение показателя по состоянию на

определенный момент времени (конкретную дату) Например,

численность населения на начало года; остатки вкладов населения на начало месяца и т. д. Главной особенностью моментных динамических рядов является то, что их уровни нельзя суммировать, т. к. в каждом последующем уровне ряда динамики полно-

108

стью или частично содержится значение предыдущего уровня. Поэтому суммирование уровней моментного ряда динамики приводит к повторному счету одних и тех же значений. Пример моментного ряда динамического ряда представлен в табл. 17.

Таблица 17

Площадь жилищ, приходящаяся в среднем на одного жителя Ивановской области, в 2005—2010 гг. (на конец года)

 

2005

2006

2007

2008

2009

2010

 

 

 

 

 

 

 

В среднем на одного

22,4

22,7

23,0

23,3

23,6

23,9

жителя, кв. м

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервальные динамические ряды характеризуют изме-

нение явления в динамике за определенный период времени (месяц, квартал, год). Соответственно, уровни интервальных рядов характеризуют величину показателя за конкретные периоды. Примерами такого ряда могут служить статистические данные о годовых объемах ВВП, численности родившихся по месяцам года, величине прибыли за конкретные кварталы и т. д. Эта инфор-

мация представляет собой результат накапливаемых наблюде-

ний. Поэтому уровни интервального динамического ряда можно суммировать, что позволяет получать ряды динамики более ук- рупненных периодов и облегчает выявление основных тенденций развития изучаемого явления. Например, динамический ряд, в котором содержатся показатели за 50 лет, целесообразно путем суммирования годовых данных преобразовать в ряд динамики с пятилетними интервалами, что позволит уменьшить число уровней с 50 до 10, т. е. в 5 раз. Пример интервального динамического ряда представлен в табл.18.

Таблица 18

Выбросы загрязняющих атмосферу веществ, исходящих из стационарных источников в Ивановской области,

в 2004—2010 гг.

 

2005

 

2006

2007

2008

2009

2010

 

 

 

 

 

 

 

 

Выброшено в атмосферу

40,0

 

43,8

43,7

40,7

38,8

36,7

загрязняющих веществ, тыс. т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

109

 

 

 

 

 

Интервальные динамические ряды можно представить также как ряды с нарастающими итогами путем последовательного суммирования смежных уровней. Это позволяет проследить формирование обобщенного результата развития явления с начала изучаемого периода. Но при анализе динамических рядов с нарастающими итогами следует помнить о несопоставимости уровней таких рядов.

2. По расстоянию между уровнями динамические ряды делятся на ряды с равностоящими и неравностоящими уровнями во времени. К первому типу динамических рядов (с равностоящими уровнями) относятся моментные ряды показателей на равноуда- ленные моменты времени (табл. 17) и интервальные ряды, в которых представлены показатели через равные, следующие друг за другом периоды времени (табл. 18).

Если ряд динамики содержит прерывающиеся или неравные периоды времени, то его называют динамическим рядом с неравностоящими уровнями (табл. 19).

Таблица 19

Численность населения Ивановской области, тыс. чел.

Год

1970

1979

1989

2002

2010

2011

 

 

 

 

 

 

 

Все население

1319,7

1302,6

1293,8

1148,3

1069,0

1061,1

3. В зависимости от способа выражения уровней различают ряды динамики, содержащие:

абсолютные величины (табл. 18 и 19);

средние величины (табл. 17);

относительные величины (табл. 20).

Таблица 20

Структура населения Ивановской области, %

Год

1970

1979

 

1989

2002

2010

2011

 

 

 

 

 

 

 

 

 

 

Доля городско-

 

 

 

 

 

 

 

го населения

76,4

80,4

 

82,1

82,7

80,9

81,0

Доля сельского

 

 

 

 

 

 

 

населения

23.6

19,6

 

17,9

17.3

19,1

19,0

 

 

 

110

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]