Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
vse_voprosy-Ekzamen!!!.doc
Скачиваний:
56
Добавлен:
20.09.2019
Размер:
3.37 Mб
Скачать

16. Частный коэффициент корреляции. Его свойства, процедура вычисления.

Корреляция - степень, с которой какая-либо одна характеристика воздействует на другую, причем эти характеристики являются взаимосвязанными и образуют пару. Такие парные характеристики могут быть представлены на графике в виде ряда точек. Если все точки на полученной рассеянной диаграмме укладываются на прямую линию (не являющуюся ни горизонтальной, ни вертикальной), то коэффициент корреляции может меняться от +1 (если увеличение одной переменной сопровождается соответствующим увеличением другой) до -1 (если увеличение одной переменной сопровождается постоянным уменьшением другой); коэффициент корреляции, равный 0, свидетельствует о том, что между рассматриваемыми двумя характеристиками не существует никакой зависимости и они укладываются на одной прямой линии.

Коэффициентом корреляции отражает степень линейной связи между X и Y

Коэффициентом корреляции двух случайных величин называется отношение их ковариации к произведению средних квадратичных отклонений этих величин:

, сигма

Частная корреляция. Высокая корреляция между двумя показателями может объясняться не их непосредственной связью, а тем, что есть некоторый другой показатель, сильно связанный с каждым из первых двух.

Задача- найти чистую корреляцию между двумя переменными, исключив (линейное) влияние других факторов.(например есть три показателя доход населения, численность и время. Доход растут и население тоже, значит между ними есть высокая положительная корреляция. Но есть ли на самом деле между ними связь? Ведь каждый зависит от времени. Какова будет связь между доходом и населением если исключить время? Мерой такой чистой корреляции между двумя переменными и служит коэффициент частной корреляции.

Расчет частного коэффициент корреляции

Для того чтобы найти частную корреляцию между Y и X при исключении влияния T, нужно

  1. Провести регрессию Y от T и получить остатки (e1,e2,…eN)

  2. провести регрессию X от T и получить остатки (d1,d2,…dN)

  3. Вычислить выборочный коэффициент корреляции между остатками этих двух регрессий

r(Y,X/T)=r(e,d)

Существует тесная связь между коэффициентом корреляции, частной корреляции и детерминации.

R-квадрат - это . Коэффициент является одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии (или, как говорят, мерой качества подгонки регрессионной модели к наблюденным значениям )

Коэффициент детерминации. Величина показывает, какая часть (доля) вариации объясняемой переменной обусловлена вариацией объясняющей переменной ( )

Пусть R^2-коэффициент детерминации, полученный при регрессии Y от X и T , r(Y,T)-коэффициент корреляции Y и T. Тогда

Частная корреляция в многомерном случае

Пусть нужно определить коэффициент частной корреляции между Y и одним из факторов при исключении влияния всех остальных факторов.

R^2(X)-коэффициент детерминации, полученный при регрессии Y от всех факторов X (в том числе и от ), а R^2(X\ )-коэффициент детерминации, полученный при регрессии Y от всех факторов Х, кроме (т.е. от Х\ ). Тогда

Свойства частного коэффициент корреляции

Частный коэффициент корреляции между Y и X, как и парный коэффициент корреляции между Y и X, может принимать значения от –1 до +1.

-1<r(Y,X/Xj)<+1

Частный коэффициент корреляции между Xi и Xj при фиксированных значениях остальных k-1 переменных имеет такое же t-распределение, как и парный коэффициент корреляции между Xi и Xj, вычисленный по n’=n-k+2 наблюдениям.

Поэтому значимость частного коэффициент корреляции оценивают так же, как и обычного коэффициент корреляции по критерию Стьюдента при n’=n-k+2 степенях свободы (число степеней свободы - характеристика суммы квадратов (отклонений), показывает, сколько отклонений в сумме квадратов может изменяться "свободно".)

Значимость частного коэффициент корреляции

1 вариант. Для вычисленного значения частного коэффициент корреляции определяют наблюдаемое значение t-статистики (t-статистика - Функция, имеющая t-распределение (t-распределение Распределение Стьюдента - Распределение вероятностей, часто используемое при проверке гипотез в малых выборках, в которых производится оценка дисперсии рассматриваемой переменной.)

и сравнивают его с критическим при n’=n-k+2 степенях свободы. Если , то коэффициент значим.

2 вариант. По критическому значению t-статистики при n’=n-k+2 степенях свободы вычисляют критическое значение коэффициент корреляции

и сравнивают выборочное значение частного коэффициента корреляции с критическим. Если , то коэффициент значим.