Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
168
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

167

Дискриминантный анализ

Внутригрупповая ковариация. Выводится объединенная внутригрупповая ковариационная матрица, которая может отличаться от общей ковариационной матрицы. Матрица вычисляется путем усреднения отдельных ковариационных матриц для всех групп.

Групповые ковариации. Для каждой группы выводится отдельная ковариационная матрица.

Общая ковариация. Выводится ковариационная матрица для всех наблюдений, как если бы они были из одной выборки.

Метод пошагового отбора процедуры Дискриминантный анализ

Рисунок 21-5

Диалоговое окно Дискриминантный анализ: Шаговый отбор

Метод. Выберите статистику, которая будет использоваться для введения или удаления новых переменных. Возможными альтернативами являются лямбда Уилкса, необъясненная дисперсия, расстояние Махаланобиса, наименьшее F отношение и V Рао. Выбрав V Рао, можно задать минимальное приращение V, необходимое для включения переменной.

Лямбда Уилкса. Метод отбора переменных в шаговом дискриминантном анализе, отбирающий переменные для ввода в уравнение на основании того, насколько они уменьшают значение "лямбда" Уилкса. На каждом шаге вводится переменная, минимизирующая это значение.

Необъясненная дисперсия. На каждом шаге вводится переменная, минимизирующая сумму необъясненной изменчивости между группами.

расстояние Махаланобиса. Мера того, насколько значения наблюдений для независимых переменных отклоняются от среднего по всем наблюдениям. Большое расстояние Махаланобиса означает, что наблюдение содержит экстремальные значения в одной или более независимых переменных.

168

Глава 21

Наименьшее F отношение. Метод отбора переменных в шаговом анализе, основанный на максимизации F-отношения, вычисленного по расстоянию Махаланобиса между группами.

V Рао. Мера различий между групповыми средними. Также называется следом Лоули-Хотеллинга. На каждом шаге вводится та переменная, которая максимизирует прирост индекса V Рао. Выбрав этот параметр, введите минимальное значение, которое должна иметь переменная, чтобы быть включенной в анализ.

Критерии. Возможными альтернативами являются Использовать F значение и Использовать вероятность F. Введите значения для включения и удаления переменных.

Использовать F-значение. Переменная вводится в модель, если ее F-значение превышает заданное значение включения, и исключается, если ее F-значение меньше значения исключения. Значение включения должно превосходить значение исключения, оба должны быть положительными. Если необходимо ввести в модель больше переменных, снизьте порог включения. Чтобы исключить из модели большее число переменных, увеличьте порог исключения.

Использовать вероятность F. Переменная вводится в модель, если наблюдаемый уровень значимости ее F-значения меньше заданного порога включения, и исключается, если этот уровень значимости больше порога исключения. Порог включения должен быть меньше порога исключения, они оба должны быть положительными. Если необходимо включить в модель больше переменных, увеличьте порог включения. Чтобы исключить из модели большее число переменных, снизьте порог исключения.

Вывести. Отчет о шагах выводит статистики для всех переменных после каждого шага; F для попарных расстояний выводит матрицу попарных F отношений для каждой пары групп.

Дискриминантный анализ: Классификация

Рисунок 21-6

Диалоговое окно Классификация дискриминантного анализа

Априорные вероятности. Эта функция определяет настройку классификационных коэффициентов в соответствии с априорным знанием принадлежности к группе.

169

Дискриминантный анализ

Все группы равны. Предполагаются равные вероятности для всех групп, что не оказывает влияния на коэффициенты.

Вычислить по размерам групп. Априорные вероятности принадлежности к группе зависят от размера наблюдаемой группы в выборке. Например, если 50% наблюдений из области анализа попадает в первую группу, 25% во вторую и 25% в третью, классификационные коэффициенты настраиваются для увеличения правдоподобия принадлежности к первой группе по отношению ко второй и третьей.

Вывести. Доступные параметры: результаты по наблюдениям (Поточечные результаты), итоговая таблица, классификация методом скользящего контроля.

Поточечные результаты. Коды для фактической группы, предсказанной группы, апостериорные вероятности и значения дискриминантной функции выводятся для каждого наблюдения.

Итоговая таблица. Числа наблюдений, правильно и неправильно отнесенных к каждой из групп в дискриминантном анализе. Это иногда называют матрицей перекрестной классификации.

Скользящий контроль. Каждое наблюдение при анализе классифицируется с помощью функции, полученной по всем остальным наблюдениям, кроме данного. Этот метод также известен как "U-метод".

Заменить пропущенные значения средним. Выберите этот пункт, чтобы заменить средним независимой переменной пропущенные значения только на этапе классификации.

Ковариационная матрица. Вы можете выбрать один из двух способов классификации наблюдений — либо по внутригрупповой ковариационной матрице, либо по ковариационным матрицам для отдельных групп.

Внутригрупповая. Для классификации наблюдений используется объединенная внутригрупповая ковариационная матрица.

Для отдельных групп. Для классификации используются ковариационные матрицы для отдельных групп. Так как классификация производится на основе дискриминантных функций, а не на основе исходных переменных, выбор этого параметра не всегда равноценен квадратичной дискриминации.

Графики. Графические возможности: график для объединенных групп, графики для отдельных групп и территориальная карта.

Объединенные группы. Строится диаграмма рассеяния значений первых двух дискриминантных функций для наблюдений из всех групп. Если есть только одна дискриминантная функция, вместо диаграммы рассеяния выводится гистограмма.

Для отдельных групп. Диаграмма рассеяния значений первых двух дискриминантных функций строится для каждой группы в отдельности. Если есть только одна дискриминантная функция, вместо диаграммы рассеяния выводится гистограмма.

Территориальная карта. График, на который нанесены границы, позволяющие отнести наблюдение к группе на основании значений функции. Числа соответствуют группам, по которым распределяют наблюдения. Среднее каждой группы обозначено звездочкой внутри границ этой группы. Если есть только одна дискриминантная функция, диаграмма не выводится.

170

Глава 21

Дискриминантный анализ: Сохранить

Рисунок 21-7

Диалоговое окно Дискриминантный анализ: Сохранить

Вы можете добавить к активному файлу данных новые переменные. Можно сохранить: предсказанную принадлежность к группе (единственная переменная), дискриминантные баллы (одна переменная для каждой дискриминантной функции в решении), вероятности принадлежности к группе при данных дискриминантных баллах (одна переменная на каждую группу).

Также Вы можете экспортировать информацию о модели в заданный файл в формате XML (PMML). Этот файл модели можно использовать для применения информации о модели к другим файлам данных с целью скоринга.

Команда DISCRIMINANT: дополнительные возможности

Язык синтаксиса команд также позволяет:

Выполнить дискриминантный анализ несколько раз (с помощью одной команды), а также управлять порядком, в котором добавляются переменные (с помощью подкоманды ANALYSIS).

Задать априорные вероятности для классификации (с помощью подкоманды PRIORS).

Вывести повернутые матрицу коэффициентов дискриминантных функций и структурную матрицу (с помощью подкоманды ROTATE).

Ограничить число формируемых дискриминантных функций (с помощью подкоманды

FUNCTIONS).

Ограничить классификацию наблюдениями, которые отобраны (не отобраны) для анализа (с помощью подкоманды SELECT).

Считать и анализировать корреляционную матрицу (с помощью подкоманды MATRIX).

Сохранить корреляционную матрицу для дальнейшего анализа (с помощью подкоманды

MATRIX).

Обратитесь к Command Syntax Reference за полной информацией о синтаксисе языка команд.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]