- •Обозначения
- •Классификация фактов (случаев)
- •Функции классификации
- •Расстояние Махалонобиса
- •Пошаговый дискриминантный анализ
- •Пошаговый анализ с включением
- •Пошаговый анализ с исключением
- •Разработка статистической модели данных
- •Напишем макрос, который заполнит таблицу с векторами
- •Подвергнем данные дискриминантному анализу
- •Теоретический расчет ошибок классификации для модели
Пошаговый дискриминантный анализ
Пошаговый анализ с включением. В пошаговом анализе дискриминантных функций модель дискриминации строится по шагам. Точнее, на каждом шаге просматриваются все переменные и находится та из них, которая вносит наибольший вклад в различие между совокупностями. Эта переменная должна быть включена в модель на данном шаге, и происходит переход к следующему шагу.
Пошаговый анализ с исключением. Можно также двигаться в обратном направлении, в этом случае все переменные будут сначала включены в модель, а затем на каждом шаге будут устраняться переменные, вносящие малый вклад в предсказания. Тогда в качестве результата успешного анализа можно сохранить только "важные" переменные в модели, то есть те переменные, чей вклад в дискриминацию больше остальных
Эта пошаговая процедура "руководствуется" соответствующим значением F для включения и соответствующим значением F для исключения. Значение F статистики для переменной указывает на ее статистическую значимость при дискриминации между совокупностями, то есть, она является мерой вклада переменной в предсказание членства в совокупности.
-
Выполним пошаговый анализ со включением и с исключением. Для этого включим дополнительную опцию Advansed Options(stepwise analysis) на панели Quick. После нажатия кнопки Ok на панели появятся две дополнительные закладки. В закладке Quick выбираем из списка пошаговый метод анализа (Forward Stepwise или Backward Stepwise). На закладке Advanced указываем значения F, необходимые для включения/исключения переменных. В данном случае для включения F выбираем 4.0, а для исключения 3.9
Пошаговый анализ с включением
Шаг 1 : Включенные переменные
|
|
Wilks' lambda |
Partial lambda |
F-remove |
p-level |
Tolerance. |
1-Tolerance. |
|
Длина лепестка |
1,000000 |
0,062248 |
1107,254 |
0,00 |
1,000000 |
0,00 |
Матрица классификации
|
|
Percent |
G_1:1 |
G_2:2 |
G_3:3 |
|
G_1:1 |
100,0000 |
50 |
0 |
0 |
|
G_2:2 |
96,0000 |
0 |
48 |
2 |
|
G_3:3 |
88,0000 |
0 |
6 |
44 |
|
Total |
94,6667 |
50 |
54 |
46 |
Функции классификации
|
|
G_1:1 |
G_2:2 |
G_3:3 |
|
Длина лепестка |
7,38978 |
21,6336 |
28,0630 |
|
Constant |
-6,50054 |
-47,3944 |
-79,0014 |
Шаг 2 : Включенные переменные
|
|
Wilks' lambda |
Partial lambda |
F-remove |
p-level |
Tolerance. |
1-Tolerance. |
|
Длина лепестка |
0,599217 |
0,066351 |
1027,217 |
0,000000 |
0,868608 |
0,131392 |
|
Ширина чашелистика |
0,062248 |
0,638706 |
41,294 |
0,000000 |
0,868608 |
0,131392 |
Матрица классификации
|
|
Percent |
G_1:1 |
G_2:2 |
G_3:3 |
|
G_1:1 |
100,0000 |
50 |
0 |
0 |
|
G_2:2 |
94,0000 |
0 |
47 |
3 |
|
G_3:3 |
90,0000 |
0 |
5 |
45 |
|
Total |
94,6667 |
50 |
52 |
48 |
Функции классификации
|
|
G_1:1 |
G_2:2 |
G_3:3 |
|
Длина лепестка |
-0,9605 |
17,2553 |
24,0938 |
|
Ширина чашелистика |
30,1644 |
15,8160 |
14,3381 |
|
Constant |
-52,0983 |
-59,9301 |
-89,3038 |
Шаг 3: Включенные переменные
|
|
Wilks' lambda |
Partial lambda |
F-remove |
p-level |
Tolerance. |
1-Tolerance. |
|
Длина лепестка |
0,038316 |
0,648576 |
39,28337 |
0,000000 |
0,782557 |
0,217443 |
|
Ширина чашелистика |
0,043814 |
0,567179 |
55,32550 |
0,000000 |
0,747040 |
0,252960 |
|
Ширина лепестка |
0,039758 |
0,625042 |
43,49220 |
0,000000 |
0,701463 |
0,298537 |
Матрица классификации
|
|
Percent |
G_1:1 |
G_2:2 |
G_3:3 |
|
G_1:1 |
100,0000 |
50 |
0 |
0 |
|
G_2:2 |
98,0000 |
0 |
49 |
1 |
|
G_3:3 |
96,0000 |
0 |
2 |
48 |
|
Total |
98,0000 |
50 |
51 |
49 |
Функции классификации
|
|
G_1:1 |
G_2:2 |
G_3:3 |
|
Длина лепестка |
2,3211 |
16,6290 |
21,2225 |
|
Ширина чашелистика |
35,3917 |
14,8184 |
9,7644 |
|
Ширина лепестка |
-23,9339 |
4,5679 |
20,9419 |
|
Constant |
-60,5128 |
-60,2366 |
-95,7460 |
Шаг 4 : Включенные переменные
|
|
Wilks' lambda |
Partial lambda |
F-remove |
p-level |
Tolerance. |
1-Tolerance. |
|
Длина лепестка |
0,038316 |
0,648576 |
39,28337 |
0,000000 |
0,782557 |
0,217443 |
|
Ширина чашелистника |
0,043814 |
0,567179 |
55,32550 |
0,000000 |
0,747040 |
0,252960 |
|
Ширина лепестка |
0,039758 |
0,625042 |
43,49220 |
0,000000 |
0,701463 |
0,298537 |
Переменная, не попавшая в конечную модель
|
|
Wilks' lambda |
Partial lambda |
F to remove |
p-level |
Tolerance |
1-Tolerance |
|
Длина чашелистика |
0,023819 |
0,958492 |
3,118037 |
0,047245 |
0,393583 |
0,606417 |
Матрица классификации
|
|
Percent |
G_1:1 |
G_2:2 |
G_3:3 |
|
G_1:1 |
100,0000 |
50 |
0 |
0 |
|
G_2:2 |
98,0000 |
0 |
49 |
1 |
|
G_3:3 |
96,0000 |
0 |
2 |
48 |
|
Total |
98,0000 |
50 |
51 |
49 |
Функции классификации
|
|
G_1:1 |
G_2:2 |
G_3:3 |
|
Длина лепестка |
2,3211 |
16,6290 |
21,2225 |
|
Ширина чашелистика |
35,3917 |
14,8184 |
9,7644 |
|
Ширина лепестка |
-23,9339 |
4,5679 |
20,9419 |
|
Constant |
-60,5128 |
-60,2366 |
-95,7460 |
Шаг 4 является последним.
