- •5. Препроцесінг інформації
- •5.1. Ентропія і кількість інформації
- •5.2. Нормалізація і стандартизація вихідних значень
- •5.3. Аналітико-евристичні алгоритми визначення вагомих інформативних ознак
- •5.4. Алгоритм „вибілювання" входів
- •5.5. Нейромережне визначення вагомих факторів
- •5.6. Методика „Box-counting"
- •Практичні завдання
- •Контрольні питання і завдання для самоперевірки
- •Теми рефератів та розрахунково-графічних робіт
Практичні завдання
1. Інформативність факторів
Дані табл. 5.4 використовуються для ідентифікації залежності за припущення, щовона має лінійний характер. Окремо за методами Del, Add, комбінованими AddDel і DelAdd, ВПА, СТПО визначити інформативні фактори, провести порівняльний аналіз їх точності. Вилучивши неінформативні фактори за кожним із методів, виконати ідентифікацію вказаної залежності та оцінити її адекватність за критерієм мінімуму середньоквадратичної похибки. Порівняти результати.
Таблиця 5.4. Початкові дані
X1 |
X2 |
X3 |
X4 |
X5 |
Х6 |
X7 |
X8 |
X9 |
Х10 |
Y |
71,2 |
54,7 |
128 |
38995 |
10,43 |
412,8 |
3436 |
101,6 |
21,0 |
17,9 |
287 |
71,6 |
55,56 |
120,1 |
13636 |
14,920 |
452,7 |
3899 |
130,408 |
19,00 |
18,26 |
282,56 |
74,25 |
55,49 |
114,4 |
12905 |
12,11 |
410,2 |
4644 |
101,306 |
18,00 |
' 18,71 |
281,05 |
74,25 |
56,12 |
113,9 |
13271 |
18,67 |
458,6 |
2051 |
141,993 |
26,00 |
19,69 |
283,68 |
78,38 |
61,78 |
116,8 |
26785 |
56,83 |
518,6 |
2562 |
385,409 |
36,00 |
20,19 |
299,65 |
82,20 |
64,22 |
115,3 |
30437 |
80,62 |
555,9 |
2855 |
482,030 |
15,30 |
20,42 |
307,13 |
84,28 |
65,32 |
120,1 |
42156 |
18,65 |
458,6 |
2855 |
141,932 |
16,25 |
20,89 |
316,85 |
86,08 |
68,48 |
121,0 |
12936 |
34,30 |
483,1 |
2891 |
222,110 |
17,64 |
20,90 |
324,33 |
87,94 |
71,80 |
125,8 |
23894 |
41,60 |
494,6 |
3512 |
274,297 |
19,23 |
21,48 |
336,90 |
89,43 |
74,24 |
127,8 |
25355 |
34,31 |
483,2 |
1251 |
222,196 |
19,74 |
21,53 |
343,80 |
90,93 |
75,87 |
129,3 |
31929 |
8,994 |
443,4 |
3402 |
117,285 |
20,36 |
22,35 |
349,66 |
86,29 |
76,69 |
128,7 |
39058 |
71,66 |
541,9 |
3878 |
459,166 |
21,18 |
22,83 |
346,86 |
86,05 |
76,90 |
128,9 |
13332 |
34,20 |
483,0 |
4720 |
221,451 |
21,28 |
22,71 |
347,53 |
84,28 |
78,41 |
128,7 |
24289 |
23,87 |
466,8 |
1141 |
162,880 |
38,00 |
23,94 |
349,32 |
86,27 |
79,18 |
130,5 |
46600 |
78,43 |
552,5 |
1798 |
477,721 |
22,41 |
24,15 |
355,32 |
88,87 |
80,24 |
133,3 |
20302 |
37,43 |
488,1 |
2346 |
243,742 |
23,26 |
25,34 |
364,23 |
88,92 |
83,99 |
136,6 |
27973 |
64,67 |
530,9 |
2967 |
430,234 |
39,00 |
25,79 |
372,98 |
92,15 |
84,2 |
140,5 |
34547 |
54,29 |
514,6 |
3332 |
368,392 |
23,88 |
38,00 |
380,75 |
90,86 |
85,9 |
143,1 |
42979 |
60,34 |
524,1 |
3259 |
407,016 |
24,32 |
34,00 |
384,39 |
90,43 |
87,8 |
140,7 |
17411 |
90,85 |
572,0 |
3896 |
494,201 |
38,00 |
26,56 |
385,32 |
91,36 |
91,3 |
146,5 |
32021 |
17,01 |
456,0 |
1290 |
136,536 |
25,66 |
44,00 |
397,13 |
96,89 |
93,7 |
145,3 |
11963 |
22,91 |
465,2 |
4577 |
158,583 |
26,39 |
26,39 |
404,30 |
97,05 |
96,7 |
143,1 |
19633 |
40,07 |
492,2 |
2130 |
262,944 |
26,68 |
26,44 |
406,12 |
104,6 |
98,9 |
147,9 |
38759 |
28,25 |
473,6 |
3299 |
185,061 |
26,45 |
26,83 |
421,71 |
2. Статистична незалежність входів
До факторів, значення яких наведені в табл. 5.4, застосувати „вибілювання" входів (див. додаток Б). Перевірити точність процедури шляхом зворотного перетворення, а також некорельованість входів та рівність дисперсії одиниці. Використати нейромережні методи для ідентифікації шуканої залежності із вихідними даними табл. 5.4 та „вибіленими" входами.
3. Методика „box-counting"
Використовуючи методику „box-counting", за даними табл. 5.4 визначити найбільш інформативні фактори. Порівняти одержані результати із результатами методу головних компонент, методу „вибілювання" входів та результатами розв'язання задачі 5.1.