КОНСПЕКТ ЛЕКЦИЙ КОДЭИ
.pdfПроверка значимости дискриминации
Для проверки значимости дискриминации используется значение лямбды Уилкса (Wilks lambda)
или F-статистики.
Для рассматриваемого примера:
1)значение лямбды Уилкса 0.0234;
2)значение F-критерия = 199.1454. Расчетное значение статистики F-критерия
F(4,292) = 199.1454 больше табличного значения
F0.05(4, 300) = 2.25. Поэтому нулевая гипотеза о том, что наблюдения принадлежат к одному классу ,
отвергается.
Можно сделать вывод, что данная дискриминация значима.
12.03.13 Доцент С.Т. Касюк |
51 |
Шаг 4. Классификация новых случаев. Не закрывая диалога Результаты дискриминантного анализа, добавьте в таблицу исходных данных новое наблюдение.
Для того чтобы понять, к какому классу относится этот объект, нажмем кнопку Posterior probabilities (Апостериорные
вероятности), мы увидим ту же таблицу с постериорными вероятностями, к которой будет добавлена строка.
12.03.13 Доцент С.Т. Касюк |
52 |
Итак, новое наблюдение с вероятностью 0,999 можно отнести к типу SETOSA.
12.03.13 Доцент С.Т. Касюк |
53 |
Нажмем кнопку Squared Mahalanobis distance (Квадрат расстояния Махаланобиса), и увидим таблицу с квадратами расстояния Махаланобиса. В последней строке таблицы мы видим расстояния нового случая до групповых центров.
Расстояние от нового наблюдения до центра групп минимально для группы SETOSA. Следовательно, с высокой степенью вероятности новый цветок — это ирис типа SETOSA.
12.03.13 Доцент С.Т. Касюк |
54 |
Шаг 6. Построение классификационной функции другим методом.
Всегда имеет смысл попробовать различные способы построения классификационной функции. Закроем диалоговое окно
Результаты дискриминантного анализа. Вернемся в окно
Определение модели. В строке
Method (Метод) выберите стандартный метод и нажмите кнопку ОК.
12.03.13 Доцент С.Т. Касюк |
55 |
В окне результатов с помощью кнопки Classification functions (Функции классификации) просмотрим классифицирующие функции.
Видно, что функции классификации, построенные двумя методами, совпадают.
12.03.13 Доцент С.Т. Касюк |
56 |
Пример 2. Исходными показателями для дискриминантного анализа послужили следующие показатели стран:
•X1 – количество человек, приходящихся на одного врача;
•X2 - смертность на 1000 человек;
•X3 – ВВП, рассчитанный по паритету покупательной способности на душу населения, млн. $;
•X4 - расходы на здравоохранение на душу населения, $.
12.03.13 Доцент С.Т. Касюк |
57 |
Имеется таблица с данными по 10 странам, которые были выбраны и отнесены к соответствующим группам по уровню медицинского обслуживания:
1)страны с высокими уровнем медицинского обслуживания;
2)страны со средним (удовлетворительным) уровнем медицинского обслуживания;
3)страны с низким уровнем медицинского обслуживания.
Задача состоит в том, чтобы на основе аналогичных показателей классифицировать страны: Молдавия, Украина.
12.03.13 Доцент С.Т. Касюк |
59 |
Запускаем модуль дискриминантного анализа.
12.03.13 Доцент С.Т. Касюк |
60 |