- •Тема 1 - 4 spss: компьютерная обработка данных
- •Тема 1. Общий обзор spss
- •Тема 2. Создание и редактирование файлов данных
- •Тема 3. Управление данными
- •Тема 4. Диаграммы
- •Teмa 5. Частоты
- •Тема 6. Описательные статистики
- •Тема 7. Таблицы сопряженности и критерий хи-квадрат
- •Тема 8. Корреляции
- •Тема 9. Средние значения
- •Тема 10. Сравнение двух средних: t-критерий
- •Тема 11. Непараметрические критерии
- •Тема 12. Однофакторный дисперсионный анализ
- •Тема 13. Многофакторный дисперсионный анализ
- •Тема 14. Многомерный дисперсионный анализ
- •Тема 15. Дисперсионный анализ с повторными измерениями
- •Тема 16. Линейная регрессия
- •Тема 17. Анализ надежности
- •Тема 18. Факторный анализ
- •Тема 19. Кластерный анализ
- •Тема 20. Дискриминантный анализ
- •Тема 21. Многомерное шкалирование
Тема 20. Дискриминантный анализ
Для демонстрации дискриминантного анализа мы рассмотрим пример прогнозирования успешности обучения на основе предварительного тестирования. Файл class.sav содержит данные о 46 учащихся (объекты с 1 по 46), закончивших курс обучения, в отношении которых известны оценки успешности обучения - для этого используется переменная оценка (1 — низкая, 2— высокая). Кроме того, в файл включены данные предварительного тестирования этих учащихся до начала обучения (13 переменных):
и1, ..., и11 — 11 показателей теста интеллекта;
э_и — показатель экстраверсии по тесту Г. Айзенка (H.Eysenck);
н — показатель нейротизма по тесту Г. Айзенка.
Еще для 10 претендентов на курс обучения (объекты с 47 по 56) известны лишь результаты их предварительного тестирования (13 перечисленных переменных).
ШАГ 1
Откройте файл данных, с которым вы намерены работать (в нашем случае - это файл class.sav). Если он расположен в текущей папке, то выполните следующие действия.
Выберите в меню File (Файл) команду Open ► Data (Открытие ► Данные) или щелкните на кнопке Open File (Открытие файла) панели инструментов.
В открывшемся диалоговом окне дважды щелкните на имени class.sav или введите его с клавиатуры и щелкните на кнопке ОК.
ШАГ 2
В меню Analyze (Анализ) выберите команду Classify ► Discriminant (Классификация ► Дискриминантный анализ). На экране появится диалоговое окно Discriminant Analysis (Дискриминантный анализ).
В следующем примере проводится дискриминантный анализ для зависимой переменной оценка, имеющей два уровня, и 13-ти предикторов. Предикторы добавляются в дискриминантное уравнение пошаговым методом (Уилкса) с установками, отличающимися от предлагаемых по умолчанию: для включения предикторов в уравнение служит значение F=1,25, а для исключения предикторов — значение F=1,00. Для анализа зависимости между предикторами выводятся все описательные статистики. Кроме того, мы включаем в вывод нестандартные коэффициенты дискриминантного уравнения, результаты для каждого объекта и итоговую таблицу.
ШАГ 5
После выполнения предыдущего шага у вас должно быть открыто диалоговое окно Discriminant Analysis (Дискриминантный анализ), показанное на рис. 23.1. Если вы уже успели поработать с этим окном, щелкните на кнопке Reset (Сброс).
Щелкните сначала на переменной оценка, чтобы выделить ее, а затем — на верхней кнопке со стрелкой, чтобы переместить переменную в поле Grouping Variable (Группирующая переменная).
Щелкните на кнопке Define Range (Задать диапазон), чтобы открыть диалоговое окно Discriminant Analysis: Define Range (Дискриминантный анализ: Задание диапазона).
В поле Minimum (Минимум) введите значение 1, нажмите клавишу Tab, чтобы переместить фокус ввода в поле Maximum (Максимум), введите значение 2 и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (Дискриминантный анализ).
Наведите указатель мыши на переменную и1, нажмите кнопку мыши и, не отпуская кнопки, перетащите указатель на последнюю переменную н, затем кнопку мыши отпустите. В результате окажутся выделенными все оставшиеся в списке переменные от и1 до н.
Щелкните на нижней кнопке со стрелкой, чтобы переместить выделенные переменные в список Independents (Независимые переменные), установите переключатель Use stepwise method (Использовать пошаговый метод) и щелкните на кнопке Statistics (Статистики), чтобы открыть диалоговое окно Discriminant Analysis: Statistics (Дискриминантный анализ: Статистики).
Установите флажки Means (Средние), Box's М (М Бокса), Univariate ANOVAs (Однофакторный дисперсионный анализ), Unstardardized (Нестандартизованные коэффициенты) и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (Дискриминантный анализ).
Щелкните на кнопке Method (Метод), чтобы открыть диалоговое окно Discriminant Analysis: Stepwise Method (Дискриминантный анализ: Пошаговый метод).
Дважды нажмите клавишу Tab, чтобы переместить фокус ввода в поле Entry (Ввод), введите значение 1,125, нажмите клавишу Tab, чтобы переместить фокус ввода в поле Removal (Вывод), введите значение 1 и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (Дискриминантный анализ).
Щелкните на кнопке Classify (Классификация), чтобы открыть диалоговое окно Discriminant Analysis: Classification (Дискриминантный анализ: Классификация).
Установите флажки Casewise results (Результаты для объектов), Summary table (Итоговая таблица) и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (Дискриминантный анализ).
Щелкните на кнопке ОК, чтобы открыть окно вывода.
Wilks' Lambda (Лябда Уилкса) — отношение внутригрупповой суммы квадратов к общей сумме квадратов (λ). Данный коэффициент характеризует долю дисперсии оценок дискриминантной функции, которая не обусловлена различиями между группами, принимает значение 1 в случае, если средние значения для всех групп оказываются равными, и уменьшается с ростом разностей средних значений. Уровни значимости характеризуют вероятность того, что различия между группами являются случайными.
Ungrouped (Несгруппированный объект) — объект, для которого заранее неизвестна принадлежность к группе.
Actual group (Фактическая группа) — группа, которой принадлежит данный объект.
Predicted Group (Прогнозируемая группа) — группа, вычисленная для объекта с помощью уравнения дискриминантной функции.
Р (D>d | G=g) — вероятность принадлежности объекта к группе (G) при данной величине дискриминантной функции (D).
Р (G=g | D=d) — вероятность наблюдаемого значения дискриминантной функции (D), если задана принадлежность объекта к группе (G).
Highest Group (Вероятная группа) — группа, имеющая наибольшую прогнозируемую вероятность включения данного объекта.
Second Highest Group (Вторая вероятная группа) — группа, имеющая вторую по величине вероятность (после прогнозируемой) включения данного объекта. Поскольку число групп в данном случае равно 2, то такая группа для каждого объекта определена «заранее».
Discriminant Scores (Значения дискриминантной функции) — величины, получаемые при подстановке значений переменных объекта в уравнение дискриминантной функции.
