Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
0492497_33ADE_metodicheskoe_posobie_spss_kompyu...doc
Скачиваний:
23
Добавлен:
01.03.2025
Размер:
1.36 Mб
Скачать

Тема 20. Дискриминантный анализ

Для демонстрации дискриминантного анализа мы рассмотрим пример прогнозирования успешности обучения на основе предварительного тестирования. Файл class.sav содержит данные о 46 учащихся (объекты с 1 по 46), закончивших курс обучения, в отношении которых известны оценки успешности обучения - для этого используется переменная оценка (1 — низкая, 2— высокая). Кроме того, в файл включены данные предварительного тестирования этих учащихся до начала обучения (13 переменных):

  • и1, ..., и11 — 11 показателей теста интеллекта;

  • э_и — показатель экстраверсии по тесту Г. Айзенка (H.Eysenck);

  • н — показатель нейротизма по тесту Г. Айзенка.

Еще для 10 претендентов на курс обучения (объекты с 47 по 56) известны лишь результаты их предварительного тестирования (13 перечисленных переменных).

ШАГ 1

Откройте файл данных, с которым вы намерены работать (в нашем случае - это файл class.sav). Если он расположен в текущей папке, то выполните следующие действия.

  1. Выберите в меню File (Файл) команду Open ► Data (Открытие ► Данные) или щелкните на кнопке Open File (Открытие файла) панели инструментов.

  2. В открывшемся диалоговом окне дважды щелкните на имени class.sav или введите его с клавиатуры и щелкните на кнопке ОК.

ШАГ 2

В меню Analyze (Анализ) выберите команду Classify ► Discriminant (Классификация ► Дискриминантный анализ). На экране появится диалоговое окно Discriminant Analysis (Дискриминантный анализ).

В следующем примере проводится дискриминантный анализ для зависимой переменной оценка, имеющей два уровня, и 13-ти предикторов. Предикторы добавляются в дискриминантное уравнение пошаговым методом (Уилкса) с установками, отличающимися от предлагаемых по умолчанию: для включения предикторов в уравнение служит значение F=1,25, а для исключения предикторов — значение F=1,00. Для анализа зависимости между предикторами выводятся все описательные статистики. Кроме того, мы включаем в вывод нестандартные коэффициенты дискриминантного уравнения, результаты для каждого объекта и итоговую таблицу.

ШАГ 5

После выполнения предыдущего шага у вас должно быть открыто диалоговое окно Discriminant Analysis (Дискриминантный анализ), показанное на рис. 23.1. Если вы уже успели поработать с этим окном, щелкните на кнопке Reset (Сброс).

  1. Щелкните сначала на переменной оценка, чтобы выделить ее, а затем — на верхней кнопке со стрелкой, чтобы переместить переменную в поле Grouping Variable (Группирующая переменная).

  2. Щелкните на кнопке Define Range (Задать диапазон), чтобы открыть диалоговое окно Discriminant Analysis: Define Range (Дискриминантный анализ: Задание диапазона).

  3. В поле Minimum (Минимум) введите значение 1, нажмите клавишу Tab, чтобы переместить фокус ввода в поле Maximum (Максимум), введите значение 2 и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (Дискриминантный анализ).

  1. Наведите указатель мыши на переменную и1, нажмите кнопку мыши и, не отпуская кнопки, перетащите указатель на последнюю переменную н, затем кнопку мыши отпустите. В результате окажутся выделенными все оставшиеся в списке переменные от и1 до н.

  2. Щелкните на нижней кнопке со стрелкой, чтобы переместить выделенные переменные в список Independents (Независимые переменные), установите переключатель Use stepwise method (Использовать пошаговый метод) и щелкните на кнопке Statistics (Статистики), чтобы открыть диалоговое окно Discriminant Analysis: Statistics (Дискриминантный анализ: Статистики).

  3. Установите флажки Means (Средние), Box's М (М Бокса), Univariate ANOVAs (Однофакторный дисперсионный анализ), Unstardardized (Нестандартизованные коэффициенты) и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (Дискриминантный анализ).

  4. Щелкните на кнопке Method (Метод), чтобы открыть диалоговое окно Discriminant Analysis: Stepwise Method (Дискриминантный анализ: Пошаговый метод).

  5. Дважды нажмите клавишу Tab, чтобы переместить фокус ввода в поле Entry (Ввод), введите значение 1,125, нажмите клавишу Tab, чтобы переместить фокус ввода в поле Removal (Вывод), введите значение 1 и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (Дискриминантный анализ).

  1. Щелкните на кнопке Classify (Классификация), чтобы открыть диалоговое окно Discriminant Analysis: Classification (Дискриминантный анализ: Классификация).

  2. Установите флажки Casewise results (Результаты для объектов), Summary table (Итоговая таблица) и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (Дискриминантный анализ).

  3. Щелкните на кнопке ОК, чтобы открыть окно вывода.

  • Wilks' Lambda (Лябда Уилкса) — отношение внутригрупповой суммы квадратов к общей сумме квадратов ). Данный коэффициент характеризует долю дисперсии оценок дискриминантной функции, которая не обусловлена различиями между группами, принимает значение 1 в случае, если средние значения для всех групп оказываются равными, и уменьшается с ростом разностей средних значений. Уровни значимости характеризуют вероятность того, что различия между группами являются случайными.

  • Ungrouped (Несгруппированный объект) — объект, для которого заранее неизвестна принадлежность к группе.

  • Actual group (Фактическая группа) — группа, которой принадлежит данный объект.

  • Predicted Group (Прогнозируемая группа) — группа, вычисленная для объекта с помощью уравнения дискриминантной функции.

  • Р (D>d | G=g) — вероятность принадлежности объекта к группе (G) при данной величине дискриминантной функции (D).

  • Р (G=g | D=d) — вероятность наблюдаемого значения дискриминантной функции (D), если задана принадлежность объекта к группе (G).

  • Highest Group (Вероятная группа) — группа, имеющая наибольшую прогнозируемую вероятность включения данного объекта.

  • Second Highest Group (Вторая вероятная группа) — группа, имеющая вторую по величине вероятность (после прогнозируемой) включения данного объекта. Поскольку число групп в данном случае равно 2, то такая группа для каждого объекта определена «заранее».

  • Discriminant Scores (Значения дискриминантной функции) — величины, получаемые при подстановке значений переменных объекта в уравнение дискриминантной функции.