- •Тема №1. Поняття моделі. Розвиток економетрії як науки
- •Тема №2. Поняття економіко-математичної моделі. Класифікація моделей.
- •Лекція №3. Тема: Етапи проведення економетричного аналізу .
- •Лекція №4. Тема: Етапи моделювання.
- •Лекція №5. Тема: Однофакторний кореляційний аналіз .
- •Лекція №6. Тема: Проста вибіркова лінійна регресія.
- •6.2 Оцінка параметрів лінійної регресії за методом
- •6.4 Поняття про ступені вільності
- •6.5 Простий anova-аналіз у лінійній регресії
- •6.6 Перевірка простої регресивної моделі на адекватність.
- •6.7 Проблеми, що виникають при кореляційному аналізі:
- •6.8 Алгоритм розв'язку задачі однофакторного кореляційного аналізу:
- •Тема №7. Класична лінійна багатофакторна модель.
- •Тема №8. Лінійне програмування. Дослідження операцій.
- •8.1 Лінійне програмування
- •8.2 Загальна постановка транспортної задачі (т-задача, тз)
- •Тема №9 Дослідження операцій. Прийняття рішення.
- •Тема №11. Експертні системи
- •Тема №12. Методи прогнозування ринкової кон'юнктури.
6.2 Оцінка параметрів лінійної регресії за методом
найменших квадратів
Для того, щоб визначити залежність між y таxпотрібно знайти невідомі параметриb0 таb1. Це можливо, якщо мати певний критерій. Розглянемо приклад.
yi
-
Табл.6.1
Nyi
40, 10
xi1
25
Рис.6.1
52
20
6
3
35
9
4
45
xi
125
65
18
Взагалі існує безліч прямих, які можна провести через множину спостережуваних точок. Для цього треба скористатися критерієм, який дасть змогу обрати “найкращу” з них за цим критерієм. Найпоширенішим є критерій мінімізації суми квадратів відхилень, тобто метод найменших квадратів (МНК).
На рисунку будь-яка з прямих, яку можна провести через дані точки, має точки, які знаходяться над прямою і під нею. На основі цього можна встановлювати відхилення від безпомилкової прямої, зображені на рис 6.2.
еi = yі -= yі - b0 - b1xі , (6.2)
де -i-та точка на прямій, яка відповідає значенню xі .
yі =b0 + b1x
Рис. 6.2 – Відхилення оцінених значень від емпіричних
Відхилення (помилки) називають ще залишками. Зрозуміло, що логічно обирати таку пряму, щоб сума квадратів помилок була мінімальною.
В цьому й полягає критерій найменших квадратів: невідомі параметри b0 та b1 визначаються таким чином, щоб мінімізувати суму квадратів помилок:
e2i =(yі - b0 - b1xi)2 =f (b0, b1) ® min (6.3)
(6.4)
(6.5)
звідки отримаємо систему лінійних рівнянь (розкриємо дужки):
(6.6)
Виразимо b0 з першого рівняння і підставимо у друге, отримаємо b1:
(6.7)
З метою спрощення помножимо числівник та знаменник на 1/n:
(6.8)
Вираз (6.8) можна записати ще таким чином:
(6.9)
Доведемо це:
(6.10)
(6.11)
Чисельник (6.9) є коефіцієнтом коваріації між xтаy. За визначенням,коефіцієнт коваріації (співзмінення цих величин) визначається за формулою:
(6.12)
Коваріація (cov) - це абсолютна міра зв’язку між двома величинами.
Знаменник (6.9) є дисперсією величини x, тобто:
(6.13)
Отже, кут нахилу прямої регресії можна встановити за формулами (6.7), (6.8), (6.9).
Для визначення параметру bо повернемося до формули (6.5):
(6.14)
Вираз (6.14) дає підтвердження про те, що сума помилок дорівнює нулеві. Дійсно:
(6.15)
Розкриємо дужки у виразі 6.14 та поділимо його на n, отже, b0 визначається:
(6.16)
Таким чином, ми знайшли формули для визначення невідомих параметрів b0 та b1 і можемо записати у явному вигляді регресію у від x, в якій параметри обчислені за МНК:
(6.17)
виходячи з рис.6.2, отримаємо:
(6.18)
Коефіцієнти кореляції та детермінації
Найпростішим критерієм, який дає кількісну оцінку зв'язку між двома показниками є коефіцієнт кореляції. Він розраховується за допомогою такої формули:
(6.19)
Коефіцієнт кореляції, на відміну від коефіцієнта коваріації, є не абсолютною, а відносною мірою зв'язку між двома факторами, тому значення коефіцієнта кореляції (corr) змінюються у межах: -1 до + l, тобто -1 £ corr £ +1
Позитивне значення коефіцієнта кореляції свідчить про прямий зв'язок між показниками, а негативне –про зворотний зв'язок. Коли коефіцієнт кореляції прямує доrxy ®±1, це свідчить про наявність щільного зв'язку між двома факторами. У протилежному випадку – коефіцієнт кореляції прямує до нуля (rxy ®0), тобто зв’язку між змінними немає.
Коефіцієнт кореляції є безрозмірною величиною, яка у даному вигляді характеризує ступінь залежності цих величин, котра виявляється в тім, що при зростанні однієї випадкової величини друга також виявляє тенденцію до зростання (чи убування). У першому випадку говорять, що випадкові величини пов'язані позитивною кореляцією, а в другому – кореляція негативна.
Перевірка адекватності побудованої регресійної моделі реальному економічному явищу (об’єктові), тобто оцінка правильності вибору форми зв’язку між двома змінними здійснюється за допомогою коефіцієнта детермінації. Наприклад, якщо перевіряється адекватність оціненої лінійної моделі, то коефіцієнт детермінації визначає, чи справді змінна у лінійно залежить від змінної х. Таким критерієм є :
(6.20)
де – це дисперсія, що пояснює регресію;
– це загальна дисперсія ;
SST – загальна сума квадратів;
SSR – сума квадратів, що пояснює регресію.
(6.21) (6.22)
Перепишемо (6.21), враховуючи (6.17), так:
(6.23)
Внесемо зміни до (6.20), враховуючи (6.21) – (6.23), помножуючи на 1/n. Отримаємо:
(6.24)
Відомо, що коефіцієнт кореляції:
(6.25)
(6.26)
Якщо значення коефіцієнта детермінації у межах [0.55 – 1], тобто близьке до одиниці, то модель є адекватною. Якщо ж значення коефіцієнта детермінації знаходиться у межах (0 – 0,44), то модель є неадекватною. У випадку, коли D[0,45–0,54], для перевірки правильності припущення про форму зв’язку між ознаками (адекватності моделі) застосовують F-критерій (критерій Фішера).
Крім коефіцієнта детермінації придатність лінії регресії можна перевірити, визначивши стандартну помилку оцінювання:
(6.27)
(6.28)
k - кількість оцінюваних параметрів у регресійній моделі. У разі простої лінійної регресії k = 2.