Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекция-Корреляция-

.docx
Скачиваний:
12
Добавлен:
05.03.2021
Размер:
282.3 Кб
Скачать

ЛЕКЦИЯ КОРРЕЛЯЦИЯ

Понятия корреляции и регрессии впервые появились в работах К. Пирсона и Ф. Гальтона. Последний, исследуя зависимость между ростом родителей и их детей, выявил «регрессию к среднему» − рост у детей, чьи родители высокого роста, имел тенденцию

«возвращаться» к средней величине.

Определение. Если изменение одной величины влечет за собой изменение распределения другой величины, то такая их зависимость называется статистической.

Определение. Если статистическая зависимость такова, что изменение одной величины влечет за собой изменение среднего значения (т.е. условного математического ожидания) другой величины, то она называется корреляционной зависимостью.

Определение. Условным

средним yx называют среднее арифметическое наблюдавшихся значений Y, соответствующих X x .

Определение. Условным средним

xy называют среднее

арифметическое наблюдавшихся значений X , соответствующих Y y .

Определение. Уравнение yx y yx x x 

называется выборочным уравнением регрессии

*

Y на X , где yx rB  xy*  xxy x y2 x −

выборочный коэффициент регрессии, а его график − выборочной линией регрессии Y на X .

Определение. Уравнение xy x xy y y  называется выборочным уравнением регрессии

X на Y , где xy rB *xy* yxy x y2 y −

выборочный коэффициент регрессии, а его график − выборочной линией регрессии X на Y .

Замечание. Выборочный коэффициент корреляции rB − это оценка степени тесноты линейной связи величин X и Y , а также величины x* и *y − выборочные средние квадратические отклонения вычисляются по

2 2

формулам: x* x2 x , *y y2 y ,

xy x y  rB * * .

 x y

Свойства выборочного коэффициента корреляции:

  1. Коэффициент корреляции принимает значения на отрезке 1;1, чем ближе rB к единице, тем теснее связь.

  2. Если все значения переменных увеличить или уменьшить на одно и то же число или в одно и то же число раз, то величина выборочного коэффициента корреляции не изменится.

  3. При значениях rB 1 корреляционная связь представляет собой линейную функциональную зависимость. При этом выборочные линии регрессии Y на X и X на Y совпадают, и все наблюденные значения располагаются на одной общей прямой.

  4. При значении rB 0 линейная корреляционная связь

отсутствует. При этом yx xy , а линии выборочной регрессии параллельны осям координат.

После нахождения выборочных уравнений линий регрессии следует проверить нулевую гипотезу об отсутствии линейной корреляционной связи между переменными. Для этого выполняют следующие шаги:

  1. Вычисляют наблюдаемое значение критерия

tнабл rB n 2 , который имеет распределение 1 rB2

Стьюдента с k n 2 степенями свободы.

  1. Вычисляют по таблице (приложение 4) критическое значение критерия tкрит  t1 ;k, где  − уровень значимости.

  2. Решение принимают после сравнения найденных значений. Если tнабл tкрит, то нулевая гипотеза отвергается, а это значит, что выборочный коэффициент корреляции значимо отличается от нуля и выявленная линейная корреляционная зависимость не является следствием случайного отбора переменных в выборку.

Пример. Дана корреляционная таблица. Найти выборочный коэффициент корреляции, выборочные уравнения регрессии 𝑋 на 𝑌 и 𝑌 на 𝑋. Проверить гипотезу об отсутствии линейной корреляционной связи между переменными.

Решение. Сначала вычислим компоненты выборочных

k

x ni i

коэффициентов

регрессии, а именно: x i1 , n

l

y nj j

y j1 ,

n

l

y n2

k l k

x y ni j ij x ni2  i

xy i 1 j 1 , x2  i1 , n n

j j

y2 j1 , rB xy x y2  2 . Для этого n x2 x  y2 y

расширим исходную таблицу следующим образом:

Откуда получаем следующие значения: x   64,89,

 25,68, 76

xy 1713,87,

x2 472 16572 22672 10772 18872 10 4396,37,

76

2 202 13232 19262 19 292 13322 12 675,21, y  

76

x*  4396,3764,892 13,626 и

*y  675,2125,682  3,968, rB 1713,87 64,89 25, 68 0,8784,

13,626 3,968

xy  0,8784  3,02 и

yx  0,8784  0,26.

Следовательно:

  1. xy 64,89  3,02y 25,68 − уравнение выборочной регрессии X на Y ;

  1. yx 25,68 0,26x64,89 − уравнение выборочной регрессии Y на X .

Выборочный коэффициент корреляции получился близким к единице, проверим, случайно это или нет.

Наблюдаемое значение критерия tнабл  0,8784762 15,81.

2

10,8784

Критическое значение tкрит  t1 0,05;741,99. Так как

15,81 1,99, то гипотезу о случайности линейной корреляционной связи между переменными следует отбросить, т.е. коэффициент корреляции значимо отличается от нуля.

САМОСТОЯТЕЛЬНО. По корреляционной таблице, приведенной ниже, найти выборочный коэффициент корреляции.

RB  0,85

КОНЕЦ ЛЕКЦИИ

Соседние файлы в предмете Высшая математика