
- •Задачник
- •Тема 1: «Ранговые корреляции»
- •Преподавателю и студенту было предложено расположить 10 профессий в порядке их общественной значимости. Ответы перечислены ниже.
- •Тема 2: «Канонические корреляции»
- •Тема 3: «Кластерный анализ»
- •Тема 4: «Дискриминантный анализ»
- •Тема 5: «Факторный анализ».
- •По данным опроса практиков-экономистов построена матрица корреляционной зависимости характерных признаков: уровень оплаты труда, возраст, трудовой стаж:
- •Тема 6: «Модели бинарного выбора.
- •Тема 7: «Контроль качества»
- •Тема 8: «Сезонная декомпозиция»
- •Тема 9: «Критерий Дарбина-Уотсона»
- •Тема 10: «Частная и множественная корреляция»
- •Оглавление Тема 1. Ранговые корреляции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
- •Сборник задач по прикладной статистике Задачник
- •603950, Нижний Новгород, пр. Гагарина, 23.
- •603600, Г. Нижний Новгород, ул. Большая Покровская, 37
Тема 4: «Дискриминантный анализ»
Аудитория: 4.1. Домашнее задание: 4.2, 4.3.
4.1. По данным годовых отчетов деятельности акционерных обществ (АО) электротехнической промышленности оценивались по двум показателям: среднесписочная численность ППП – промышленно-производственного персонала (тыс.чел.) и балансовая прибыль (млн.руб.). Требуется решить, можно ли к группе преуспевающих отнести АО, имеющее следующие характеристики: численность ППП – 9,592 тыс.чел. и прибыль – 12, 840 млн.руб (использовать как линейный классификатор, так и расстояние Махалонобиса). Найти вероятности ошибок классификации.
Для
решения задачи взять две обучающие
выборки (таблица 4.1). Первая выборка (
) представляет группу преуспевающих
АО, а вторая (
) – остальные (считать, что
матрицы ковариаций для этих групп.
|
Группы АО |
Численность ППП ( |
Балансовая
прибыль ( |
1 2 3 4 |
Преуспевающие (Х) |
17.115 14.904 13.627 10.545 |
22.981 21.481 28.669 10.199 |
1 2 3 4 5 |
Остальные (Y) |
4.428 5.510 4.214 5.527 4.211 |
11.124 6.091 11.842 11.873 12.860 |
4.2.
Эффективность использования земельных
угодий двенадцатью сельскохозяйственными
районами области оценивалась по объемам
реализованной продукции растениеводства
(
тыс.руб..га) и животноводства(
тыс.руб./га). Значения показателей
приводятся в следующей таблице:
Таблица 4.2
Показатели эффективности использования земельных угодий
|
Группы предприятий |
Рентабельность ( ) |
Производительность труда ( ) |
1 2 3 4 |
Высокий уровень (Х1) |
23.4 19.1 17.5 17.2 |
9.1 6.6 5.2 10.0 |
1 2 3 4 5 |
Низкий уровень (X2) |
5.4 6.6 8.0 9.7 9.1 |
4.3 5.5 5.7 5.5 6.6 |
1 2 3 |
Подлежат классификации (Z) |
9.9 14.2 12.9 |
7.4 9.4 6.7 |
Предварительно известно, что в первых четырех районах земля используется неэффективно, а в следующих пяти районах – эффективно, причем случайный разброс показателей описывается внутри совокупности районов фиксированной эффективности двумерным нормальным законом с неизвестными средними и а) неизвестными, но равными матрицами ковариаций; б) неизвестными, но различными матрицами ковариаций. Провести классификацию трех последних предприятий.
4.3.
Используя специальный статистический
пакет «STATISTICA»,
выполните классификацию пяти промышленных
объектов, характеризующихся четырьмя
переменными:
производительность труда работающего,
млн.руб.,
доля рабочих в общей численности
работающих,
рентабельность продукции,%;
коэффициент использования сырья и
материалов. Исходные значения переменных
приведены в таблице 4.3.
Таблица 4.3
Показатели работы предприятий
Номер объекта |
|
|
|
|
1 2 3 4 5 |
8,4 9,1 5,5 4,3 9,7 |
0,62 0,78 0,73 0,65 0,70 |
7,5 10,0 6,1 6,0 11,0 |
81,5 94,0 74,0 70,8 92,5 |
Классификацию провести при помощи дискриминантного анализа, используя в качестве обучающих выборок следующие группы объектов:
1 группа
Номер Объекта |
|
|
|
|
1 2 3 4 5 |
4,0 4,9 6,1 5,3 5,8 |
0,63 0,60 0,61 0,62 0,60 |
6,0 6,3 7,0 7,1 6,8 |
80,0 78,6 75,9 74,0 81,5 |
2 группа
Номер Объекта |
|
|
|
|
1 2 3 4 |
8,7 10,3 11,6 10,8 |
0,70 0,78 0,75 0,77 |
9,0 10,5 10,9 11,0 |
81,5 94,0 74,0 70,8 |