
- •7 Регресійний аналіз
- •7.1 Попередній аналіз даних
- •7.2 Припущення, які використовує регресійний аналіз
- •7.3 Вибір вигляду функції для монотонних процесів
- •7.4 Метод найменших квадратів для оцінки параметрів функції регресії
- •Властивості регресії
- •7.5 Оцінка якості моделі
- •7.6 Критерій Фішера для оцінки адекватності моделі
- •7.7 Перевірка значущості коефіцієнтів регресії
- •7.8 Функції Excel для побудови регресійних залежностей
- •Розв’язання
- •7.9 Парна регресія в матричній формі
- •7.10 Метод найменших квадратів при оцінюванні параметрів поліномів
- •Розв’язання
- •7.11 Множинний регресійний аналіз
- •7.11.1 Матричний спосіб оцінки параметрів множинної регресії
- •7.11.2 Перевірка значущості коефіцієнтів регресії
- •7.11.3 Перевірка якості моделі. Скоригований коефіцієнт детермінації
- •7.11.4 Парна й часткова кореляції
- •Розв’язання.
- •7.12 Методи побудови багатофакторної регресійної моделі
- •7.12.1 Вибір "найкращого" рівняння регресії
- •7.12.2 Метод усіх можливих регресій
- •7.12.3 Метод виключень
- •7.12.4 Кроковий регресійний метод
- •Питання і завдання до розділу 7
- •Лабораторна робота Тема. Парний регресійний аналіз
- •Лабораторна робота Тема. Множинний регресійний аналіз
- •8 Дисперсійний аналіз
- •8.1 Однофакторний дисперсійний аналіз
- •Розв’язання.
- •Питання і завдання до розділу 8
- •Лабораторна робота Тема. Однофакторний дисперсійний аналіз
- •9 Ранговий аналіз
- •9.1 Коефіцієнт рангової кореляції Кенделла (Кендалла)
- •9.2 Коефіцієнт рангової кореляції Спірмена
- •Розв’язок.
- •9.3 Коефіцієнт конкордації
- •Питання і завдання до розділу 9
7.5 Оцінка якості моделі
Для оцінки якості моделі вводиться коефіцієнт детермінації, що показує, яка частина варіації пояснюється за допомогою регресійної залежності
,
або
.
Оскільки
,
тобто
,
то, остаточно,
.
Коефіцієнт детермінації показує, яка частина варіації результативної ознаки Y враховується в моделі й обумовлена впливом на неї незалежних факторів, врахованих у моделі. Можливі значення коефіцієнта детермінації належать відрізку [0;1]. Чим ближче R2 до 1, тим краща якість моделі. Якість моделі вважається прийнятною, якщо коефіцієнт детермінації не нижче 0,96.
– індекс
кореляції. Він, як і
R2,
відображає точність
моделі й може використовуватися при
будь-якій формі
зв'язку. При прямолінійному
зв'язку індекс кореляції дорівнює
коефіцієнту кореляції.
,
.
Чим ближче до 1, тим краще регресійна залежність описує експериментальні дані.
7.6 Критерій Фішера для оцінки адекватності моделі
Побудуємо випадкову величину
,
де
,
k –
кількість параметрів моделі. Для парної
лінійної регресії k=2, (
k-1)=1;
,
n
–кількість спостережень.
Обчислюємо F кр, для заданого рівня значущості α, використовуючи функцію FРАСПОБР пакету Excel:
F кр = FРАСПОБР(; k-1; n-k).
Якщо,
то модель адекватна.
7.7 Перевірка значущості коефіцієнтів регресії
Для перевірки значущості коефіцієнтів регресії застосовуємо t – критерій Стьюдента, за допомогою якого перевіряють, чи значуще ai відрізняється від нуля. Висуваємо гіпотези:
Н0:
; Н1:
;
Обчислюємо
критеріальне значення
,
яке має розподіл Стьюдента з n-k
ступенями вільності,
де;
;
;
n – кількість спостережень; k – кількість параметрів регресії.
Обчислюємо
для заданого рівня значущості α критичне
значення
.
Якщо
,
ai
– статистично незначуще,
а якщо
,
ai
- статистично значуще.
Якщо виникає ситуація, що ai статистично незначуще відрізняється від нуля, то це означає, що вплив i-го фактору на досліджувану змінну нестабільний.
7.8 Функції Excel для побудови регресійних залежностей
В Excel для знаходження кращої залежності необхідно побудувати лінію тренда.
-
Будується графік.
-
На графіку виводимо контекстне меню – Додати лінію тренда.
-
Обираємо тип лінії тренда (лінійна, логарифмічна, експонентна, степенева).
-
У закладці Параметры обираємо:
-
показывать уравнение на диаграмме;
-
поместить на диаграмму величину достоверности аппроксимации (R^2).
В
Excel
для побудови лінійної регресії
використовується функція линейн,
що дає рівняння
лінійної регресії (=a1х+a0)
і статистику. Цю функцію можна також
використовувати для множинної регресії
=
amхm+…+
a2х2+
a1х+a0
(m змінних
впливають на досліджуваний фактор).
-
необхідно виділити 5 рядків і k стовпців, де k - кількість параметрів моделі;
-
вибрати функцію Линейн;
-
зазначити параметри: діапазон значень Y; діапазон значень X;
-
зазначити вигляд регресії:
=
amхm+…+
a2х2+
a1х+a0
в графі Конст
ставимо 1 (истина),
якщо
=
amхm+…+
a2х2+
a1х
в графі Конст
ставимо 0 (ложь).
-
Статистика — логічне значення, що вказує, чи потрібно повернути додаткову статистику для регресії. Якщо аргумент статистика має значення ИСТИНА, то функція ЛИНЕЙН повертає додаткову регресійну статистику.
Натиснути CTRL+Shift+Enter для введення значень масиву.
Отримаємо таблицю результатів:
am |
….... |
a1 |
a0 |
an |
|
a1 |
a0 |
R2 |
y |
|
|
F |
df |
|
|
SSreg |
SSзал |
|
|
am ,…, a1, a0 – коефіцієнти рівняння регресії;
ai – похибки обчислення для коефіцієнтів;
R2 – коефіцієнт детермінації й у - похибки обчислення для y;
F – статистика (F розраховане) і df - кількість ступенів вільності;
SSreg – регресійна сума квадратів; SSзал – залишкова сума квадратів.
Функція ТЕНДЕНЦИЯ повертає значення відповідно до лінійного тренда. Вона за методом найменших квадратів апроксимує прямою лінією масиви <відомі_значення_y> і <відомі_значення_x>. Повертає значення y відповідно до цієї прямої для даного заданого масиву <нові_значення_х>.
ТЕНДЕНЦИЯ (відомі_значення_у; відомі_значення_х; нові_значення_х; константа). Значення Константа обирається відповідно до вигляду функції регресії так само, як і для функції Линейн.
ЛГРФПРИБЛ(відомі_значення_у; відомі_значення_х;
нові_значення_х; конст; статистика).
ЛГРФПРИБЛ
– рівняння
кривої таке:
,
де залежне значення Y
є функцією незалежних значень х.
Значення a1
є підставою для піднесення до степеня
х,
а значення a0
постійне. Відмітимо, що y,
x і
a
можуть бути векторами. Функція ЛГРФПРИБЛ
повертає масив{an;
an-1;...;a1,
a0}.
Параметри та результати обчислень
функції ЛГРФПРИБЛ
за змістом співпадають з відповідними
даними функції Линейн.
Функція РОСТ повертає значення у для послідовності нових значень х, що задаються за допомогою існуючих х- і у-значень. Функція РОСТ може застосовуватися також для апроксимації існуючих х- і у-значень експонентною кривою.
Приклад. У таблиці 7.2 наведена динаміка зростання прибутку деякої фірми за останні n років у відсотках до базового року.
-
Побудувати діаграму. Оцінити за нею вигляд залежності.
-
Обчислити коефіцієнти коваріації й лінійної кореляції. Зробити висновки.
-
Розрахувати а0 і а1 для лінійної регресії
=a0+a1x, використовуючи коефіцієнт лінійної кореляції. Записати отримане рівняння.
-
Перевірити свої розрахунки, використовуючи функцію ЛИНЕЙН.
-
Знайти коефіцієнт детермінації.
-
Оцінити адекватність моделі за критерієм Фішера при рівні значущості α = 0,05.
-
Використовуючи функцію ТЕНДЕНЦИЯ, одержати прогноз величини прибутку на наступний рік. Побудувати графік.
-
Використовуючи функцію ЛГРФПРИБЛ, одержати рівняння кривої
.
-
Порівняти коефіцієнти детермінації для лінійної та експонентної залежностей.
-
Розрахувати прогнозоване експонентне зростання на підставі наявних даних.
Таблиця 7.2 – Динаміка зростання прибутку фірми за останні 10 років у відсотках до базового року
Рік |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Прибуток |
115.4 |
132.7 |
161.2 |
181.4 |
214.5 |
241.2 |
272.9 |
301.4 |
320.5 |
350.4 |