Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика / методические указания к практическим занятия по статистике 2014.doc
Скачиваний:
238
Добавлен:
13.03.2016
Размер:
2.8 Mб
Скачать

Тема 10 . Статистическое изучение связи

Между общественными явлениями существует два типа связи: функциональная и корреляционная.

При функциональной связи изменение независимых переменных приводит к получению точно определенных значений зависимой переменной.

Корреляционной связью называется важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой переменной. В статистике принято различать следующие варианты зависимостей:

1. парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными)

2. частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3. множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование

По направлению различают прямую связь, при которой с увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) значений результативного, и обратную связь, при которой значения факторного признака изменяются под воздействием факторного в противоположном направлении.

Статистические изучения связи.

По степени тесноты связи различают количественные критерии оценки тесноты связи (для критериев Пирсона, Спирмена):

Величина коэффициента корреляции

Характер связи

Практически отсутствует

-

Слабая

-

Умеренная

Сильная

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции Пирсона:

или

Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале [-1;1]. Отрицательные значения указывают на обратную связь, положительные – прямую. При линейная связь отсутствует. Чем ближепо абсолютной величине к 1, тем теснее связь между признаками. Присвязь функциональная.

Квадрат коэффициента корреляции r2 представляет собой коэффициент детерминации, который показывает долю вариации результативного признака, объясненную влиянием вариации факторного признака.

Для оценки существенности (значимости) линейного коэффициента корреляции используется тот факт, что величина ,при условии отсутствия связи в генеральной совокупности распределена по закону Стьюдента с степенями свободы (где n – объем выборки). Полученную tрасч сравнивают табличным значением. Коэффициент корреляции признается значимым при уровне значимости , еслиtрасч>tтабл. В этом случае практически невероятно, что найденное значение коэффициента корреляции обусловлено только случайными совпадениями. Уровень значимости показывает вероятность принятия ошибочного решения, например, при=0,05 в среднем в пяти случаях из ста есть риск сделать ошибочное заключение о значимости коэффициента корреляции (в социально-экономических исследованиях обычно=0,1,=0,05 или=0,01).

Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т. е. состоящим из двух качественно отличных друг от друга значений признака (например, хороший, плохой).

Коэффициенты вычисляются по формулам:

a

b

a+b

c

d

c+d

a+c

b+d

a+b+c+d

ассоциация;

контингенция.

Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если ≥ 0,5, или ≥ 0,3.

Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается не по значениям двух взаимосвязанных признаков, а по их рангам следующим образом:

где di2— квадраты разности рангов; n — число наблюдений (число пар рангов).

Если совокупность значений по исследуемому признаку содержит связные ранги, то коэффициент корреляции Спирмена вычисляется по формуле:

, где , где -число одинаковых рангов вj-м ряду.

Коэффициент Спирмена принимает любые значения в интервале [-1;1]. Значимость коэффициента корреляции Спирмена можно проверить на основе t – критерия Стьюдента по формуле:

Значение коэффициента корреляции считается статистически существенным, если при заданном уровне значимости и степени свободы .

Коэффициент корреляции Пирсона подтверждает или опровергает наличие линейной зависимости. Коэффициент рангов Спирмена подтверждает присутствие монотонно-возрастающей или убывающей зависимости (не обязательно линейной).

Для определения тесноты связи между тремя и более признаками применяется ранговый коэффициент согласия — коэффициент конкордации, который вычисляется по формуле:

, где ;m — количество факторов; n — число наблюдений.

Значимость критерия конкордации проверяется на основе -критерия Пирсона:

Расчетное значение сравнивается с при заданном уровне значимости и степени свободы .

В случае наличия связных рангов коэффициент конкордации определяется по формуле

, где , где -количество связных рангов по отдельным показателям.

Значимость критерия конкордации со связными рангами проверяется на основе -критерия Пирсона:

Расчетное значение сравнивается с при заданном уровне значимости и степени свободы .

Для определения тесноты линейной связи между тремя и более признаками применяется множественный коэффициент корреляции, который вычисляется по формуле: где - определитель корелляционной матрицы,- алгебраическое дополнение элементакорелляционной матрицы.

- корелляционная матрица, состоящая из линейных парных коэффициентов корреляции.

Значимость линейного коэффициента множественной корреляции можно проверить на основе F – критерия Фишера по формуле: , где - число наблюдений,- число переменных.Расчетное значение сравнивается с при заданном уровне значимости и степенями свободы и .

Для трех переменных частные коэффициенты корреляции рассчитываются следующим образом:

и

Вычисление параметров уравнения регрессии.

Важнейшим этапом построения регрессионной модели является установление математической функции, которая лучше других выражает реальные связи между анализируемыми признаками. Выбор типа функции может опираться на теоретические знания об изучаемом явлении, опыт предыдущих аналогичных исследований, или осуществляться эмпирически – перебором и оценкой функций разных типов и т.п.

Модель линейной множественной регрессии имеет вид:

,

где , ,…, параметры, подлежащие определению методом наименьших квадратов (МНК).

Уравнение однофакторной парной линейной корреляционной связи имеет вид:

, где – теоретические значения результативного признака, полученные по уравнению регрессии;a0, a1 – параметры уравнения регрессии

Параметры уравнения a0 и a1 получают, решая систему уравнений: .

Параметр a1 называется коэффициентом регрессии. Его можно найти также по формуле: , где идисперсии по совокупностям,- коэффициент линейной парной корреляции.

Коэффициент регрессии показывает, насколько в среднем изменяется величина результативного признака (в его единицах измерения) при изменении факторного признака на единицу.

Параметр показывает усредненное влияние прочих факторов на результативный признак. Параметр a0 связан с коэффициентом регрессии соотношением: .

Коэффициент регрессии a1 применяется также для расчета коэффициента эластичности, который показывает, на сколько процентов изменится величина результативного признака при изменении факторного признака на 1%: .

Для двухфакторной линейной корреляционной связи уравнение имеет вид: .

Параметры уравнения a0, a1, a2 получают, решая систему уравнений:

Для нахождения параметров k-факторной линейной модели, решается система из k+1 уравнений, что эквивалентно следующему:

,

где ,,,