Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Економетрия) парн.рег.мет..doc
Скачиваний:
5
Добавлен:
10.11.2018
Размер:
636.42 Кб
Скачать

2.2. Коефіцієнт кореляції

Для визначення лише зв’язку між величинами вводяться коефіцієнт кореляції.

(2.9)

Оцінкою коефіцієнта кореляції є вибірковий коефіцієнт кореляції

(2.10)

Коефіцієнт кореляції характеризує степінь щільності лінійної залежності між випадковими величинами X,Y і змінюється в межах від –1 до 1, причому: якщо r>0, то між випадковими величинами X і Y існує пряма залежність.

Доведемо, що коефіцієнт кореляції може мати значення в межах –1r1. Для цього розглянемо невід’ємний вираз:

(2.11)

Після піднесення до квадрата виразу у квадратних дужках отримаємо:

(2.12)

Обчислюючи,

,

перепишемо нерівність у такому вигляді: 12r, звідки , що й потрібно було довести.

Доведемо, що від знака коефіцієнта кореляції залежить напрям зв’язку чинника і показника. Оцінку параметра а парної лінійної регресії можна знайти за формулою:

. (2.13)

Оскільки , то параметр а має такий самий знак, що й коефіцієнт кореляції. З математики відомо, якщо а > 0, то між величинами X та Y існує прямий зв’язок, тобто якщо зростає (спадає) чинник X, то відповідно зростає (спадає) показник Y. Якщо а < 0 , то між величинами X та Y існує зворотній зв’язок , тобто якщо зростає (спадає) чинник X, то спадає (зростає) показник Y, що й потрібно було довести.

2.3 Стандартизоване рівняння регресії.

Уведемо замість нормальної форми для змінних X і Y їх стандартизовану форму заміною

(2.14)

Тоді з рівняння (2.7), враховуючи (2.10), можна одержати

(2.15)

(2.16)

(2.17)

(2.17) – рівняння регресії в стандартизованій формі. З (2.16) випливає, що коефіцієнт кореляції показує, на скільки одиниць Sу змінюється Y з зміною Х на одиницю Sх.

2.4 Перевірка гіпотези про значущість відмінності від нуля коефіцієнта кореляції

Оскільки Y – випадкова величина, то з (2.9) випливає, що і випадкова величина. Тоді й статистика

(2.18)

теж є випадковою величиною, що має розподіл Стьюдента з k=n-2 ступенями вільності.

Для перевірки значущості відмінності від нуля :

1) обчислюється розрахункове значення tр за (2.17);

2) для рівня значущості і числа степенів вільності або k=n-2 знаходять за таблицею розподілу Стьюдента або за допомогою майстер-функції в EXCELЕ СТЬЮДРАСПОБР табличне значення tтабл. = t(; n-2);

3) а) якщо tptтабл., то значно відрізняється від нуля з достовірністю Р=1 - і між у і х існує тісний кореляційний зв'язок;

б) якщо tp<tтабл., то =0 і між у і х немає залежності.

2.5 Коефіцієнт детермінації, індекс кореляції

Для аналізу якості опису існуючої залежності між двома явищами за допомогою регресії часто використовують індекс кореляції. Щоб з’ясувати зміст індексу кореляції, застосовують рівняння лінії регресії. Для цього запишемо співвідношення між x1 та y1 у такій формі:

(2.19)

Піднесемо обидві частини до квадрата й додамо:

(2.20)

Оскільки , то другий додаток дорівнює нулю:

(2.21)

Позначивши , перепишемо формулу (2.20) у такому вигляді:

(2.22)

Сума квадратів відхилень від середнього значення зображується у вигляді двох доданків: суми квадратів відхилень теоретичних значень від середнього значення і суми квадратів відхилень y1 від лінії регресії. Перший доданок є систематичною, а другий – випадковою варіацією.

Знайдемо відношення суми квадратів теоретичних відхилень від середнього значення до суми квадратів відхилень спостережуваних значень yi від середнього значення . Воно називається вибірковим коефіцієнтом детермінації D. Для парної лінійної регресії D дорівнює квадрату коефіцієнта кореляції . Дійсно вираховуючи (2.13),

= (2.23)

Можна показати, що

(2.24)

Величина D показує частину дисперсії показника у, що пояснюється рівнянням регресії.

Для визначення рівня кореляції між спостережуваними yi і розрахунковими значеннями використовується індекс кореляції.

== (2.25)

Очевидно, індекс кореляції змінюється в межах від 0 до 1. Якщо всі значення li дорівнюють нулю, то теоретичні і спостережувані значення yi збігаються й індекс кореляції R=1. Чим більше спостережу вальні значення наближаються до лінії регресії, тим ближче значення R до одиниці. Якщо всі , то зміни Y не пов’язані зі змінами X і R=0.

Для перевірки значущості відмінності від нуля коефіцієнта детерміації D застосовується статистика Фішера

(2.26)

Перевірка значущості відмінності від нуля D проводиться за алгоритмом:

1) обчислюється розрахункове значення Fp за формулі (2.26);

2) за таблицею розподілу Фішера або за допомогою майстер-функції FPACПОБР в EXCELЕ для рівня значущості і числа степенів вільності k1=1; k2=n-2 знаходиться Fтабл.=F(2; k1; k2);

3) а) якщо Fр<Fтабл., то D=0 і одержана залежність не адекватна істинній залежності Y від X;

б) якщо Fр ≥ Fтабл., то D значимо відрізняється від нуля і одержана регресійна залежність адекватно відображає залежність Y від X з достовірністю Р = 1 - .