
- •IV. Статистичний аналіз в Excel
- •§ 4.1.Очищення інформації від засмічення
- •§ 4.2. Перевірка закону розподілу.
- •§ 4.3. Корреляційний аналіз
- •§4.4. Регресійний аналіз двовимірної моделі.
- •§4.5. Регресійний аналіз тривимірної моделі.
- •V. Математична модель і розв’язання задачі оптимального управління
- •VI. Зміст й обсяг контрольної роботи
- •VII. Література
- •Показники виробничо-господарської діяльності підприємств.
- •Статистичні дані.
- •Варианты заданий к работе «Математическое моделирование и решение задач оптимального управления»
§4.5. Регресійний аналіз тривимірної моделі.
Для дослідження статистичної залежності однієї результуючої ознаки від двох і більше факторних ознак в Excel є дві можливості : інструмент Регресія для випадку лінійної статистичної залежності й безпосереднє застосування методу найменших квадратів у випадку залежності будь-якого виду.
Регресійна статистика |
|
|
|
|
|
|
Множинний R |
0,762322 |
|
|
|
|
|
R-квадрат |
0,581135 |
|
|
|
|
|
Нормований R-квадрат |
0,563682 |
|
|
|
|
|
Стандартна похибка |
50,23613 |
|
|
|
|
|
Спостереження |
51 |
|
|
|
|
|
Дисперсійний аналіз |
|
|
|
|
||
|
df |
SS |
MS |
F |
Значимість F |
|
Регресія |
2 |
168064,8 |
84032,39 |
33,2977 |
8,51E-10 |
|
Залишок |
48 |
121136,1 |
2523,668 |
|
|
|
Разом |
50 |
289200,9 |
|
|
|
|
|
Коефіцієнти |
Стандартна помилка |
t-статистика |
P-Значення |
Нижні 95% |
Верхні 95% |
Y-перетинання |
225,7848 |
27,41026 |
8,237239 |
9,67E-11 |
170,6728 |
280,8968 |
X8 |
23,38168 |
10,96783 |
2,131842 |
0,038166 |
1,329382 |
45,43398 |
X4 |
-503,93 |
69,72031 |
-7,22788 |
3,29E-09 |
-644,112 |
-363,748 |
Рис.8. Регресія Y2 на X4,X8.
Алгоритм застосування інструмента Регресія відрізняється від описаного вище для випадку двовимірної моделі тільки кількістю вихідних даних , розташовуваних на робочому аркуші й, відповідно, діапазоном вхідних параметрів , що вводять у діалоговому вікні Регресія . Вихідні дані також відрізняються тільки кількістю інформації при збереженні їхнього змісту.
На рис. 8 наведені результати застосування інструмента Регресія до статистичних даних по ознаках X4–X8–Y2 .
Оцінка лінійної функції регресії y2 на x4,x8 має вигляд:
Значення F-критерію Fрасч =33,2977 , що значно більше Fкр = 3,18 Це означає, що оцінка досить добре погоджується з даними спостережень. Це підтверджується й досить високим значенням коефіцієнта детермінації R2 = 0,5811351 . Розрахункові значення t -статистики для вільного члена й коефіцієнта при x4 більше tкр = 2,009 , що підтверджує їхню значимість. Для коефіцієнта при x8 tрасч близько до критичного значення, що ставить під сумнів його значимість.
|
A |
B |
C |
D |
E |
F |
H |
I |
1 |
X4 |
X8 |
Y2 |
P(x) |
ε |
ε2 |
P2 (x) |
ε22 |
2 |
0,42 |
0,66 |
13,6 |
=A$56+B$56*A2+C$56* B2 |
=C2-D2 |
=E2^2 |
=A$59+B$59*A2+C$59*B2+D$59*A2^2+E$59*B2^2+F$59*A2*B2 |
=(C2-H2)^2 |
3 |
0,51 |
1,23 |
15 |
=A$56+B$56*A3+C$56* B3 |
=C3-D3 |
=E3^2 |
=A$59+B$59*A3+C$59*B3+D$59*A3^2+E$59*B3^2+F$59*A3*B3 |
=(C3-H3)^2 |
4 |
0,38 |
1,04 |
18,1 |
=A$56+B$56*A4+C$56* B4 |
=C4-D4 |
=E4^2 |
=A$59+B$59*A4+C$59*B4+D$59*A4^2+E$59*B4^2+F$59*A4*B4 |
=(C4-H4)^2 |
5 |
0,51 |
0,24 |
21,9 |
=A$56+B$56*A5+C$56* B5 |
=C5-D5 |
=E5^2 |
=A$59+B$59*A5+C$59*B5+D$59*A5^2+E$59*B5^2+F$59*A5*B5 |
=(C5-H5)^2 |
Рис.9. Розміщення інформації для МНК.
У випадку нелінійної регресії спеціального інструмента Excel не має, необхідно виконувати дії , передбачені методом найменших квадратів(МНК), використовуючи обчислювальні можливості Excel. Розташування вихідних даних і формул у таблиці Excel наведене на рис.9.
Всі формули вводяться тільки у верхній рядок, а потім копіюються по всьому стовпці. На рис. 9 наведені розрахунки пошуку оцінок лінійної P(x) і квадратичної P2 (x) функції регресії.
|
A |
B |
C |
D |
E |
F |
H |
I |
50 |
0,02 |
1,14 |
264,8 |
=A$56+ B$56*A50+ C$56*B50 |
=C50-D50 |
=E50^2 |
=A$59+B$59*A50+ C$59*B50+D$59*A50^2+E$59*B50^2+F$59*A50*B50 |
=(C50-H50)^2 |
51 |
0,16 |
4,44 |
267,3 |
=A$56+ B$56*A51+ C$56*B51 |
=C51-D51 |
=E51^2 |
=A$59+B$59*A51+ C$59*B51+D$59*A51^2+E$59*B51^2+F$59*A51*B51 |
=(C51-H51)^2 |
52 |
0,01 |
1,27 |
355,6 |
=A$56+ B$56*A52+ C$56*B52 |
=C52-D52 |
=E52^2 |
=A$59+B$59*A52+ C$59*B52+D$59*A52^2+E$59*B52^2+F$59*A52*B52 |
=(C52-H52)^2 |
53 |
|
|
|
|
Q = |
=СУМ(F2: F52) |
Q2 = |
=СУМ(I2: I52) |
54 |
|
|
|
|
σ = |
=КОРІНЬ(F53/51) |
σ2 = |
=КОРІНЬ(I53/51) |
55 |
β0 |
β1 |
β2 |
|
|
|
|
|
56 |
225,78481426 |
-503, 9302 |
23,381653963 |
|
|
|
|
|
57 |
|
|
|
|
|
|
|
|
58 |
β0 |
β1 |
β2 |
β3 |
β4 |
β5 |
|
|
59 |
247,96413983 |
-930, 357130 |
73,537978008 |
1009,39006400157 |
-4,446 88827 |
-140,188 41146628 |
|
|
Рис.10. Розміщення інформації для Пошуку розв’язку.
Параметри функції регресії βj розташовані в комірках A56 ÷ C56 для лінійної залежності та в комірках A59 ÷ F59 для квадратичної залежності (див.рис.10). Комірки F53 та I53 містять значення функцій Q - суми квадратів відхилень.
Значення βj відшукують за допомогою надбудови Excel Пошук розв’язку ( Поиск решения) за таким алгоритмом :
установити курсор на комірці, що містить значення функції Q ( Q2 ) ;
Сервіс - Пошук розв’язку ;
у діалоговому вікні Пошук розв’язку, що з'явилося (рис.11), перевірити, чи стоїть в полі Встановити цільову комірку (Установить целевую ячейку) адреса функції Q (Q2), і якщо ні, те ввести її;
в поле Рівної клацнути пункт мінімальному значенню ;
у поле Змінюючи комірки ввести діапазон комірок, які відведені для значень шуканих параметрів ;
клацнути по кнопці Виконати;
Рис.11. Уведення інформації для Пошуку розв’язку.
якщо розв’язок знайдено, повідомлення про це з'явиться в діалоговому вікні, де потрібно клацнути по пункту Зберегти знайдений розв’язок. Значення знайдені й перебувають у відведених для них комірках (рис. 10) .
Значення суми квадратів відхилень знайденої оцінки функції регресії від спостережених значень результативної ознаки , тобто функції Q для лінійної регресії й функції Q2 для квадратичної регресії , перебувають в комірках F53 й I53, лінійна величина відхилень – в комірці F54 і в комірці I54.
Таким
чином, коефіцієнти лінійної функції
регресії P(x) треба зчитувати з комірок
A56,B56 і З56; коефіцієнти нелінійної функції
регресії P2(x)
– з комірок A59
F59. Для розглянутого приклада лінійна
функція регресії збігається з отриманої
за допомогою інструмента Регресія
, а квадратична
P2(x) = 247,9641 – 930,3571x4 + 73,538x8 + 1009,39x42 – 4,44689x82 – 140,1884x4x8
Перевірка значимості отриманої квадратичної оцінки рівняння регресії виконується так. Визначимо коефіцієнт корреляції значень емпіричної функції регресії і даних вибірки Ry2(x). Як видно з рис.13 , коефіцієнт корреляції досить великий (0,80921). Виконаємо ще одну перевірку значимості P2(x) за допомогою коефіцієнта детермінації , для чого необхідно обчислити значення Sост , Sфакт .
Розміщення потрібних формул наведене на рис.12, а проміжні результати й значення коефіцієнта детермінації нижче. Оскільки коефіцієнт детермінації для випадку квадратичної регресії значно перевершує коефіцієнт детермінації для випадку лінійної регресії й має досить велике значення (0,472867), робимо висновок, що квадратична регресія досить добре погоджується зі статистичними даними.
Виконаємо оцінку значимості отриманого наближення функції в цілому за допомогою критерію Фішера. Для цього знайдемо значення критерію Фішера по вибірці для розглянутих двох видів залежності (див. рис.12 і 13).
|
R |
S |
||
1 |
Ry(x) |
Ry2(x) |
||
2 |
=КОРРЕЛ(C2:C52;D2:D52) |
=КОРРЕЛ(C2:C52;H2:H52) |
||
3 |
|
|
||
4 |
|
|
||
5 |
=F53/48 |
=I53/45 |
||
6 7 |
|
|
||
8 |
|
|
||
9 |
=L53/48 |
=N53/45 |
||
10 |
R2 |
R22 |
||
11 |
=1-R5/ (R9 + R5) |
=1-S5/ (S9 + S5 ) |
||
12 |
Fрасч |
F2расч |
||
13 |
=R11*(51-2-1)/(1-R11)/2 |
=S11*(51-2-1)/(1-S11)/2 |
||
14 |
|
|
||
15 |
Fкрит = |
3,205 |
Рис.12.Розрахункові формули
Як видно, розрахункове значення F-критерію для квадратичної залежності значно перевершує значення Fкрит ,що підтверджує її значимість. Для лінійної залежності перевищення Fрасч не настільки велике, що робить таки кращою квадратичну оцінку регресії y2 на x4 й x8 .
Таким чином, вибіркове рівняння регресії має вигляд :
|
K |
L |
M |
N |
R |
S |
||
|
|
^2 |
|
^2 |
Ry1(x) |
Ry2(x) |
||
2 |
66,0145 |
4357,91 |
52,4372 |
2749,66 |
0,762322 |
0,80921 |
||
3 |
98,0407 |
9611,98 |
63,6085 |
4046,04 |
|
|
||
4 |
36,9723 |
1366,95 |
39,0068 |
1521,53 |
|
|
||
5 |
121,189 |
14686,7 |
59,1584 |
3499,72 |
2523,668 |
2218,362 |
||
6 |
36,6828 |
1345,63 |
52,8333 |
2791,36 |
|
|
||
7 |
66,8451 |
4468,27 |
52,8975 |
2798,14 |
|
|
||
8 |
25,2325 |
636,678 |
31,6051 |
998,881 |
|
|
||
9 |
-64,2814 |
4132,09 |
-63,8871 |
4081,57 |
3501,349 |
4208,353 |
||
10 |
3,56772 |
12,7286 |
14,147 |
200,138 |
R2 |
R22 |
||
11 |
43,0760 |
1855,54 |
43,5092 |
1893,05 |
0,581135 |
0,654822 |
||
12 |
-12,1715 |
148,144 |
4,46566 |
19,9421 |
Fрасч |
F2расч |
||
13 |
37,1816 |
1382,47 |
39,3711 |
1550,09 |
33,29771 |
45,5293 |
||
14 |
68,8203 |
4736,24 |
53,556 |
2868,24 |
|
|
||
15 |
37,88307 |
1435,127 |
39,90716 |
1592,582 |
Fкрит = |
3,205 |
Рис.13. Перевірка значимості.