Зміст
Вступ……………………………………………………………………………..2
Побудова множинної лінійної регресійної моделі залежності за допомогою оператору методу найменших квадратів……………………...3
Побудова множинної лінійної моделі в програмі MS Excel……………...14
Дослідження залишків побудованої моделі на наявність автокореляції…………………………………………………..………..……15
Висновок…………………………………………………………………..…......17
Вступ
Метою практики є закріплення отриманих теоретичних знань з статистики та набуття практичних навиків статистичного дослідження за допомогою комп’ютерних програм.
Основним завданням практики є проведення статистичного дослідження на тему «Кореляційний аналіз» за допомогою пакету програм «Аналіз даних» в системі MS Excel, де результативною ознакою є залежність роздрібного товарообігу (у), а факторними ознаками: кількість підприємств роздрібної торгівлі (х1), надані платні послуги (х2) та обсяг укладених угод на біржах (х3).
Проведення статистичного дослідження буде здійснюватись в такій послідовності:
Побудова множинної лінійної моделі залежності за допомогою оператора методу найменших квадратів. Обчислення коеф. кореляції і перевірка його на суттєвість за критерієм Стьюдента; обчислення коеф. детермінації і перевірка його на суттєвість за критерієм Фішера, перевірка знайдених параметрів на суттєвість за крит. Стьюдента і побудова інтервалів довіри; перевірка моделі на адекватність за критерієм Фішера та побудова точкового прогнозу.
Побудова множинної лінійної моделі з використанням пакету програм MS Excel;
Дослідження залишків побудованої моделі на наявність автокореляції;
Висновки за результатами статистичного дослідження.
.
Побудова множинної лінійної моделі залежності за допомогою оператора оцінювання методу найменших квадратів
Таблиця 1. Вихідні дані для побудови множинної лінійної моделі залежності між роздрібним товарообігом (У), кількістю підприємств роздрібної торгівлі (Х1), наданими платними послугами (Х2), та обсягом укладених угод на біржах (Х3).
№ |
Y |
X1 |
X2 |
X3 |
1 |
49,734 |
8,6 |
13,1 |
13,58 |
2 |
42,606 |
10,5 |
12,1 |
13,16 |
3 |
47,106 |
12,5 |
13,2 |
12,74 |
4 |
65,232 |
16,5 |
14,1 |
11,06 |
5 |
60,606 |
13,4 |
13,7 |
11,76 |
6 |
41,733 |
7,9 |
14,4 |
14,14 |
7 |
55,233 |
9 |
16,7 |
13,58 |
8 |
77,526 |
11,5 |
15,2 |
14,84 |
9 |
82,206 |
12,7 |
15,8 |
15,96 |
10 |
87,606 |
10,9 |
16 |
14,14 |
11 |
91,386 |
12,5 |
16,4 |
16,38 |
12 |
124,1 |
11,7 |
12,7 |
13,86 |
13 |
112,22 |
12,9 |
17,2 |
15,12 |
14 |
107,41 |
13,8 |
17,5 |
16,1 |
15 |
120,84 |
14,8 |
18,1 |
16,1 |
16 |
134,05 |
15,4 |
18,8 |
17,36 |
17 |
132,63 |
16 |
20,2 |
18,06 |
18 |
140,17 |
17,6 |
19,7 |
19,18 |
За допомогою оператора оцінювання методу найменших квадратів знайдемо невідомі параметри, для цього використаємо формулу:
Для знаходження матриці X'X використаємо загальну матрицю 4х4 наступного вигляду:
Таблиця 2. Вихідні та розрахункові дані для оцінювання параметрів моделі за оператором методу найменших квадратів№ |
Y |
X1 |
X2 |
X3 |
X12 |
X1*X2 |
X1*X3 |
X1*Y |
X22 |
X2*X3 |
X2*Y |
Y2 |
X32 |
X3*Y |
1 |
49,734 |
8,6 |
13,1 |
13,58 |
73,96 |
112,66 |
116,788 |
427,7124 |
171,61 |
177,898 |
651,5154 |
2473,471 |
184,4164 |
675,3877 |
2 |
42,606 |
10,5 |
12,1 |
13,16 |
110,25 |
127,05 |
138,18 |
447,363 |
146,41 |
159,236 |
515,5326 |
1815,271 |
173,1856 |
560,695 |
3 |
47,106 |
12,5 |
13,2 |
12,74 |
156,25 |
165 |
159,25 |
588,825 |
174,24 |
168,168 |
621,7992 |
2218,975 |
162,3076 |
600,1304 |
4 |
65,232 |
16,5 |
14,1 |
11,06 |
272,25 |
232,65 |
182,49 |
1076,328 |
198,81 |
155,946 |
919,7712 |
4255,214 |
122,3236 |
721,4659 |
5 |
60,606 |
13,4 |
13,7 |
11,76 |
179,56 |
183,58 |
157,584 |
812,1204 |
187,69 |
161,112 |
830,3022 |
3673,087 |
138,2976 |
712,7266 |
6 |
41,733 |
7,9 |
14,4 |
14,14 |
62,41 |
113,76 |
111,706 |
329,6907 |
207,36 |
203,616 |
600,9552 |
1741,643 |
199,9396 |
590,1046 |
7 |
55,233 |
9 |
16,7 |
13,58 |
81 |
150,3 |
122,22 |
497,097 |
278,89 |
226,786 |
922,3911 |
3050,684 |
184,4164 |
750,0641 |
8 |
77,526 |
11,5 |
15,2 |
14,84 |
132,25 |
174,8 |
170,66 |
891,549 |
231,04 |
225,568 |
1178,395 |
6010,281 |
220,2256 |
1150,486 |
9 |
82,206 |
12,7 |
15,8 |
15,96 |
161,29 |
200,66 |
202,692 |
1044,016 |
249,64 |
252,168 |
1298,855 |
6757,826 |
254,7216 |
1312,008 |
10 |
87,606 |
10,9 |
16 |
14,14 |
118,81 |
174,4 |
154,126 |
954,9054 |
256 |
226,24 |
1401,696 |
7674,811 |
199,9396 |
1238,749 |
11 |
91,386 |
12,5 |
16,4 |
16,38 |
156,25 |
205 |
204,75 |
1142,325 |
268,96 |
268,632 |
1498,73 |
8351,401 |
268,3044 |
1496,903 |
12 |
124,1 |
11,7 |
12,7 |
13,86 |
136,89 |
148,59 |
162,162 |
1451,982 |
161,29 |
176,022 |
1576,083 |
15401,06 |
192,0996 |
1720,04 |
13 |
112,22 |
12,9 |
17,2 |
15,12 |
166,41 |
221,88 |
195,048 |
1447,651 |
295,84 |
260,064 |
1930,201 |
12593,55 |
228,6144 |
1696,782 |
14 |
107,41 |
13,8 |
17,5 |
16,1 |
190,44 |
241,5 |
222,18 |
1482,203 |
306,25 |
281,75 |
1879,605 |
11536,05 |
259,21 |
1729,237 |
15 |
120,84 |
14,8 |
18,1 |
16,1 |
219,04 |
267,88 |
238,28 |
1788,476 |
327,61 |
291,41 |
2187,258 |
14603,03 |
259,21 |
1945,572 |
16 |
134,05 |
15,4 |
18,8 |
17,36 |
237,16 |
289,52 |
267,344 |
2064,308 |
353,44 |
326,368 |
2520,065 |
17968,33 |
301,3696 |
2327,039 |
17 |
132,63 |
16 |
20,2 |
18,06 |
256 |
323,2 |
288,96 |
2122,128 |
408,04 |
364,812 |
2679,187 |
17591,51 |
326,1636 |
2395,352 |
18 |
140,17 |
17,6 |
19,7 |
19,18 |
309,76 |
346,72 |
337,568 |
2466,922 |
388,09 |
377,846 |
2761,27 |
19646,51 |
367,8724 |
2688,384 |
Сума |
1572,39 |
228,2 |
284,9 |
267,12 |
3019,98 |
3679,15 |
3431,99 |
21035,6 |
4611,21 |
4303,64 |
25973,6 |
157363 |
4042,62 |
24311,1 |
Середні |
87,355 |
12,6778 |
15,8278 |
14,84 |
167,777 |
204,397 |
190,666 |
1168,64 |
256,178 |
239,091 |
1442,98 |
8742,37 |
224,59 |
1350,62 |
Знайдемо обернену матрицю до матриці Х'Х:
Маючи всі необхідні матриці для знаходження параметрів, відставимо їх в головну формулу:
Отже, наша лінійна модель регресії має вигляд:
=
= = 7,05
=
=
Перевіримо знайдені параметри на їх суттєвість за критерієм Стьюдента використовуючи формулу:
Таблиця 3. Вихідні та розрахункові дані для перевірки параметрів на суттєвість
№ |
Y |
Y2 |
U |
u2 | |
1 |
49,734 |
2473,471 |
53,22532 |
-3,49132 |
12,18932 |
2 |
42,606 |
1815,271 |
58,48224 |
-15,8762 |
252,055 |
3 |
47,106 |
2218,975 |
66,04096 |
-18,935 |
358,5327 |
4 |
65,232 |
4255,214 |
72,78984 |
-7,55784 |
57,12095 |
5 |
60,606 |
3673,087 |
62,60924 |
-2,00324 |
4,01297 |
6 |
41,733 |
1741,643 |
55,58536 |
-13,8524 |
191,8879 |
7 |
55,233 |
3050,684 |
58,34292 |
-3,10992 |
9,671602 |
8 |
77,526 |
6010,281 |
80,77136 |
-3,24536 |
10,53236 |
9 |
82,206 |
6757,826 |
97,11504 |
-14,909 |
222,2795 |
10 |
87,606 |
7674,811 |
72,32656 |
15,27944 |
233,4613 |
11 |
91,386 |
8351,401 |
100,2315 |
-8,84552 |
78,24322 |
12 |
124,1 |
15401,06 |
71,19544 |
52,90556 |
2798,998 |
13 |
112,22 |
12593,55 |
92,07208 |
20,14892 |
405,979 |
14 |
107,41 |
11536,05 |
105,4122 |
1,9938 |
3,975238 |
15 |
120,84 |
14603,03 |
111,0494 |
9,7936 |
95,9146 |
16 |
134,05 |
17968,33 |
125,6128 |
8,43316 |
71,11819 |
17 |
132,63 |
17591,51 |
135,932 |
-3,29904 |
10,88366 |
18 |
140,17 |
19646,51 |
153,3889 |
-13,2229 |
174,8456 |
Сума |
1572,39 |
157363 |
1572,183 |
0 |
4991,701 |
Середні |
87,355 |
8742,37 |
87,34352 |
0 |
277,3167 |
Виконаємо необхідні розрахунки:
За даними таблиці значень критерію Стьюдента для рівня довіри р = 0,95 та n-K = (18-4) = 14 маємо:
Знайдемо значення критерію для кожного з параметрів і порівняємо їх із табличним значенням:
Можна зробити наступні висновки: ,>,.Параметри а0 і а1 є значущими.
Для статистично значущих параметрів (в нашому випадку а1) побудуємо інтервали довіри за такою формулою:
Нехай β-інтервал довіри, t0,05=2,145, тоді:
-119,405-2,145*<β <-119,405+2,145*
-190,88< β < -47,92
Отже, таким чином з ймовірністю 95% параметр а1 знаходиться в інтервалі (-190,88; -47,92).
Нехай β-інтервал довіри, t0,05=2,145, тоді:
5,126-2,145*2,068< β <5,126+2,145*2,068
0,69< β < 9,561
Отже, таким чином з ймовірністю 95% параметр а1 знаходиться в інтервалі (0,69; 9,561).
Таблиця 4. Вихідні та розрахункові дані для знаходження коефіцієнтів кореляції, детермінації та перевірки моделі на адекватність.
№ |
Y |
X1 |
X2 |
X3 | ||||
1 |
49,734 |
8,6 |
13,1 |
13,58 |
53,225 |
12,189 |
1415,340 |
1164,835 |
2 |
42,606 |
10,5 |
12,1 |
13,16 |
58,482 |
252,055 |
2002,473 |
833,636 |
3 |
47,106 |
12,5 |
13,2 |
12,74 |
66,041 |
358,533 |
1619,982 |
454,288 |
4 |
65,232 |
16,5 |
14,1 |
11,06 |
72,790 |
57,121 |
489,427 |
212,144 |
5 |
60,606 |
13,4 |
13,7 |
11,76 |
62,609 |
4,013 |
715,509 |
612,353 |
6 |
41,733 |
7,9 |
14,4 |
14,14 |
55,585 |
191,888 |
2081,367 |
1009,310 |
7 |
55,233 |
9 |
16,7 |
13,58 |
58,343 |
9,672 |
1031,823 |
841,701 |
8 |
77,526 |
11,5 |
15,2 |
14,84 |
80,771 |
10,532 |
96,609 |
43,344 |
9 |
82,206 |
12,7 |
15,8 |
15,96 |
97,115 |
222,279 |
26,512 |
95,258 |
10 |
87,606 |
10,9 |
16 |
14,14 |
72,327 |
233,461 |
0,063 |
225,854 |
11 |
91,386 |
12,5 |
16,4 |
16,38 |
100,232 |
78,243 |
16,249 |
165,805 |
12 |
124,1 |
11,7 |
12,7 |
13,86 |
71,195 |
2798,998 |
1350,269 |
261,131 |
13 |
112,22 |
12,9 |
17,2 |
15,12 |
92,072 |
405,979 |
618,318 |
22,251 |
14 |
107,41 |
13,8 |
17,5 |
16,1 |
105,412 |
3,975 |
402,043 |
326,062 |
15 |
120,84 |
14,8 |
18,1 |
16,1 |
111,049 |
95,915 |
1121,446 |
561,425 |
16 |
134,05 |
15,4 |
18,8 |
17,36 |
125,613 |
71,118 |
2180,049 |
1463,662 |
17 |
132,63 |
16 |
20,2 |
18,06 |
135,932 |
10,884 |
2050,097 |
2359,729 |
18 |
140,17 |
17,6 |
19,7 |
19,18 |
153,389 |
174,846 |
2789,002 |
4360,479 |
Cума |
1572,39 |
228,2 |
284,9 |
267,12 |
1572,183 |
4991,701 |
20006,578 |
15013,267 |
Середні |
87,355 |
12,6778 |
15,8278 |
14,84 |
87,344 |
277,317 |
1111,477 |
834,070 |
Знайдемо множинний коефіцієнт кореляції.
R==
Оскільки R→1, то зв’язок між Y та факторами X1, Х2, Х3 тісний.
Перевіримо коефіцієнт кореляції на суттєвість за критерієм Стьюдента.
Використаємо t-критерій:
Знайдемо фактичне значення критерію Стьюдента:
5,75
Порівняємо фактичне значення t-критерію з табличним:
tфакт > tтабл 5,75 > 2,145.
Оскільки фактичне значення критерію більше за табличне, то коефіцієнт кореляції суттєвий.
Тепер знайдемо множинний коефіцієнт детермінації.
D = R2 = 0,8662 = 0,749
Перевіримо суттєвість множинного коефіцієнта детермінації. Для цього використаємо F-критерій Фішера.
Побудуємо F-критерій:
Знайдемо табличне значення F-критерію для рівня значущості α = 0,05 ( рівень ймовірності P=1-α=1-0,05= 0,95). Для α і кількості ступенів вільності k-1; n-k табличне значення буде таким:
14,647 > 3,34
Фактичне значення F-критерію більше за табличне, отже коефіцієнт детермінації суттєвий.
Перевіримо побудовану модель на адекватність за критерієм Фішера
Знайдемо фактичне значення критерію Фішера:
Порівняємо фактичне значення з табличним:
42,107 > 3,34
Оскільки фактичне значення F-критерію більше за табличне, то дана модель адекватна.
Будуємо точковий прогноз для :