
- •Дисперсійний аналіз
- •13.1. Основні поняття та задачі
- •13.2. Алгоритм дисперсійного аналізу
- •14. Кореляційно-регресійний метод аналізу
- •Загальні поняття та означення
- •Дві основні задачі кореляційно-регресійного аналізу
- •Парна лінійна регресія
- •Оцінка параметрів парної лінійної регресії
- •Коефіцієнт кореляції
- •Класифікація кореляційного зв’язку
- •Властивості коефіцієнта кореляції
- •Перевірка значущості коефіцієнта кореляції
- •Перевірка адекватності парної лінійної регресії
Дві основні задачі кореляційно-регресійного аналізу
1. Основна задача регресійного аналізу – встановлення форми зв’язку та вивчення залежності між змінними.
Основна задача кореляційного аналізу – виявлення зв’язку між випадковими змінними та оцінка його тісноти.
Парна лінійна регресія
У випадку парної лінійної форми зв’язку рівняння регресії матиме вигляд:
,
або
,
де
– теоретичне (розрахункове) значення результативної ознаки;
– значення факторної ознаки;
умовний
початок відліку, має тільки теоретичне
значення;
коефіцієнт
регресії
по
.
Коефіцієнт
регресії
дає економічну інтерпретацію рівняння
парної лінійної регресії, показуючи
середню
зміну результативної ознаки
при зміні факторної ознаки
на одну одиницю.
Якщо
,
то зв’язок прямий, якщо
,
то зв’язок обернений, якщо
,
то зв’язок відсутній.
Оцінка параметрів парної лінійної регресії
Розглянемо
модель парної лінійної регресії.
Припустимо, що маємо результати
пар
незалежних спостережень, що задані у
вигляді сукупності точок
у прямокутній системі координат.
Розглянемо гіпотезу, що між показником і фактором існує стохастична залежність.
Мета задачі: знайти зглажувальну лінію (лінію регресії), яка найкращим чином проходить через задану сукупність точок.
Методом розв’язання даної задачі є метод найменших квадратів (МНК), основоположником якого є Гаусс і Лаплас. Розглянемо суть методу.
Нехай рівняння регресії має вид
,
де
невідомі
параметри регресії,
випадкова
змінна, що має нормальний закон розподілу
з числовими характеристиками
,
яка характеризує відхилення заданих
точок
від теоретичної лінії регресії
.
Дійсні
значення параметрів
обчислити неможливо, оскільки маємо
обмежене число спостереженню. Тому
можливо знайти лише їх статистичні
оцінки
.
Тоді рівняння парної лінійної регресії
буде оцінкою моделі
.
Розглянемо їх різницю:
де
фактичні
(спостережувані) значення показника;
теоретичні
(розрахункові) значення показника;
відхилення
точних значень від наближених значень.
Метод
найменших квадратів (1 МНК)
полягає в підборі таких оцінок параметрів
регресії
для яких сума квадратів відхилень
спостережуваних фактичних значень
показника
від теоретичних регресійних
буде мінімальною, тобто щоб теоретична
лінія регресії проходила б максимально
близько до фактичних даних
Необхідною
умовою існування екстремуму функції
двох змінних
є рівність нулю її частинних необхідних.
Отже, маємо
–система
нормальних рівнянь
Ми одержали систему лінійних рівнянь відносно невідомих параметрів , розв’язавши яку, наприклад, за формулами Крамера, можна знайти їх значення.
Таким чином, для рівняння маємо оцінки :
Виконавши нескладні перетворення одержимо інші формули для визначення параметрів
де
;
;
;
,
Кореляційний
момент (коваріація)
це
статистична характеристика системи
випадкових величин, що описує не лише
зв’язок між ними, а й їх розсіювання.
Лінія
регресії обов’язково проходить через
точку середніх значень