Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
088111_MI_Kornienko_(k_razmescheniyu).doc
Скачиваний:
6
Добавлен:
01.05.2025
Размер:
991.74 Кб
Скачать

Тема 18 Дискриминантный анализ

После изучения материала этой темы вы должны уметь...

1. Излагать концепцию дискриминантного анализа, его цели и применение в маркетинговых исследованиях.

2. Обрисовывать процедуру выполнения дискриминантного анализа, включая формулирование проблемы, определение коэффициентов дискриминантной функции и значимости, интерпретацию и проверку достоверности.

3. Обсуждать множественный дискриминантный анализ и различие между дискриминантным анализом для двух групп и множественным дискриминантным анализом.

4. Объяснять пошаговый дискриминантный анализ и описывать метод Махаланобиса.

Краткий обзор

Эта Тема посвящена дискриминантному анализу. В начале темы мы установим его связь с регрессионным (Тема 17) и дисперсионным (Тема 18) анализом. Опишем модель и общую процедуру выполнения дискриминантного анализа, отметив такие стадии: формулировка проблемы, вычисление коэффициентов дискриминантной функции, определение значимости, интерпретация и проверка результатов. Данная процедура проиллюстрирована на примере дискриминантного анализа для двух групп. Рассмотрен пример множественного дискриминантного анализа (для трех групп). Кроме того, мы изучим пошаговый дискриминантный анализ.

Начнем с примеров, иллюстрирующих применение дискриминантного анализа для двух групп и множественного дискриминантного анализа.

Резюме

Дискриминантный анализ целесообразно использовать, когда зависимая переменная явля­ется категориальной, а предикторы (независимые переменные) — интервальными. Если зави­симая переменная имеет две категории, то используемый метод известен как дискриминант­ный анализ для двух групп. Если анализируют три или больше групп, то метод называют мно­жественным дискриминантным анализом.

Процедура дискриминантного анализа состоит из пяти шагов. Первый шаг — формулирование проблемы, требует определения целей, зависимой и независимых переменных. Выборку делят на две части. Анализируемую выборку используют для вычисления дискриминантной функции; проверочную — для проверки достоверности модели. Второй шаг — определение функции, включает выведение такой линейной комбинации предикторов (дискриминантных функций), чтобы группы максимально возможно различались между собой значениями предикторов.

Определение статистической значимости представляет собой третий шаг. Она включает проверку нулевой гипотезы о том, что в совокупности средние всех дискриминантных функций во всех группах равны между собой. Если нулевую гипотезу отклоняют, то имеет смысл интерпретировать результаты.

Четвертый шаг — интерпретация дискриминантных весов или коэффициентов аналогична такой же стадии во множественном регрессионном анализе. При данной мультиколлинеарности в предсказанных переменных не существует однозначной меры относительной важности предикторов в дискриминации ими групп. Однако некоторое представление об относительной важности переменных можно получить, изучив абсолютные значения нормированных коэффициентов дискриминантной функции и структуру корреляций или дискриминантных нагрузок. Эти коэффициенты линейной корреляции между каждым предиктором и дискриминантной функцией представляют дисперсию, которую предиктор делит вместе с функцией. Другим средством интерпретации результатов дискриминантного анализа является разработка характеристической структуры для каждой группы, исходя из групповых средних для предикторов.

Пятый шаг — проверка достоверности. Она включает разработку классификационной матрицы. Дискриминантные веса, определенные с помощью анализируемой выборки, умножают на значения независимых переменных в проверочной выборке, чтобы получить дискриминантные показатели для случаев в этой выборке. Затем случаи распределяют по группам, исходя из дискриминантных показателей и соответствующего правила принятия решения. Определяют процент верно классифицированных случаев и сравнивают его с процентом случаев, которое можно ожидать на основе классификации методом случайного выбора.

Для оценки коэффициентов существует два известных подхода. Прямой метод включает оценку дискриминантной функции при одновременном введении всех предикторов. Альтернативный ему пошаговый метод включает последовательное введение предсказанных переменных, исходя из их способности дискриминировать группы.

Во множественном дискриминантном анализе, если имеется G групп и k предикторов можно оценить (G1) и меньше, чем (G1) или k дискриминантных функций. Первая функция имеет самое высокое значение отношения межгрупповой суммы квадратов к внутригруппововой сумме квадратов. Вторая функция, некоррелирующая с первой, имеет второе по величине собственное значение и т.д.