Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
маркетинг / МИ_Книга2006.doc
Скачиваний:
45
Добавлен:
23.05.2015
Размер:
4.47 Mб
Скачать

Классификация объектов с использованием дискриминантной функции

Теперь следует более подробно остановиться на предсказаниях значения зависимой переменной с использованием дискриминантной функции.

Пусть на основе средних значений переменных для групп рассчитаны средние значения дискриминантов для групп коммивояжеров, получивших и не получивших приз:

Здесь – средние значенияk-й независимой переменной среди получивших и не получивших приз соответственно.

Рассмотрим теперь некоторого индивида. Для него можно получить предсказание: если его результат, оцениваемый через Y, ближе к среднему для получивших приз, то он, скорее всего, его получит. «Полпути» между средними значениями обычно делают границей попадания в соответствующую область:

Можно также «взвесить» границу по количеству попавших в группы:

Хотя вероятность выполнения предсказания может быть не равна единице, но его точность должна повыситься по сравнению с чистой случайностью.

Чтобы оценить получаемую точность прогноза, его требуется сравнить с другими способами предсказания попадания в одну из двух групп.

1.Максимальный шанс. Пусть всего имеется100человек,20из них признаны отличными работниками, а80– нет. Следовательно, предсказание о том, что работник не получит отличной оценки, сбудется для отдельно взятого участника на80%. В маркетинговых исследованиях такой метод используется редко.

2.Пропорциональный шанс. Для того же примера определяется точность прогноза, если он делается случайно с вероятностями0,8(не получит отличной оценки) и0,2(получит).

C = 2+(1-)2,

где – пропорция лиц, принадлежащих к первой группе. Для примера=0,8иC=0,68.

При равенстве размеров групп оба метода дают одинаковый результат.

Для определения качества прогноза с помощью дискриминантной функции, его точность, вычисляемая как вероятность правильных прогнозов для всех рассматриваемых объектов, сравнивается с оценками точности максимального или пропорционального шансов.

Однако следует учитывать, что расчет точности прогноза по дискриминантной функции будет несколько завышен, так как одни и те же данные использовались и для определения дискриминанта и для его проверки183. Это явление иллюстрирует рис.Рис. 30. На нем эллипсами показаны две области, в которых могут находиться элементы типов А и В. Тонкая прямая линия – линия наилучшего разделения этих областей. Она может быть построена по очень большому количеству точек. Но реально разделительная линия строится по имеющимся точкам, которые показаны на рисунке. Это жирная линия. Видно, что она отлично разделяет имеющиеся точки, но будет давать довольно значительую ошибку при разделении новых точек.

Рис. 30. Неточное построение дискриминантной функции

Дискриминантный анализ для числа групп более двух

Если число групп больше двух, то есть учитываются получившие главный приз, поощрительный приз и не получившие приза, то анализ несколько усложняется. Классический подход заключается в построении дискриминантных функций, дающих максимальные различия между каждой парой групп. При каноническом подходе ищется наилучшее разделение объектов между всеми группами одновременно.

На рис.Рис. 31 эллипсами показаны области, в которых располагаются элементы исследования трех типов: A, BиС. Тонкие линии разделяют каждую пару типов элементов:АиВ,АиС,BиCсогласно классическому подходу. Каждая из этих линий основана на своем дискриминанте.

Жирные линии показывают разделение областей, основанное на общем дискриминанте (канонический подход). Разделительные линии всегда параллельны, так как описываются уравнениями

Y1=c1иY1=c2,

где Y1– единственная дискриминантная функция, служащая для разделения элементов на три группы;с1ис2– константы.

Рис. 31. Использование дискриминантных функций для разделения трех групп.

Для классификации объектов и предсказания попадания в одну из групп строятся средние значения дискриминанта для каждой группы. Это проекции центров областей на дискриминантные оси. Далее определяются границы между группами, аналогично случаю двух групп. Попадание элемента в границы для группы означает предсказание его принадлежности данной группе.

При каноническом подходе получаются несколько дискриминантов. Обычно среди них ищется дающий наименьшую вероятность ошибки классификации.