
- •Загальні методичні рекомендації
- •Первинна обробка статистичних даних у модулі Basic Statistics/Tables – Основні статистики/таблиці
- •Перелік основних характеристик варіаційних рядів
- •Описові статистики ряду розподілу: стаж
- •Лінійна множинна регресія
- •Нелінійні моделі
- •Вихідні дані для побудови моделі
- •Процедури класифікації
- •Кластерні процедури класифікації
- •Класифікація на основі дискримінантної функції
- •Рекомендована література Основна література
- •Додаткова література
Класифікація на основі дискримінантної функції
Модуль Дискримінантний аналіз використовується у випадку, коли маємо групи об’єктів і перед нами стоїть завдання віднесення нового об’єкта до якоїсь групи та коли необхідно встановити правила віднесення об’єкта до певної групи. Розглянемо приклад.
Нехай, підприємства характеризуються наступними економічними показниками: х1 – продуктивність праці, х2 – питома вага робітників у складі промислово-виробничого персоналу, х3 – коефіцієнт змінності устаткування (змін), х4 – питома вага втрат від браку (%), х5 – фондовіддача активної частини основних виробничих фондів. Значення вказаних показників для 20 підприємств наведені у табл. 9. Зверніть увагу, що 17 підприємств уже розкласифіковані на дві групи, а три підприємства необхідно віднести до певної групи.
Таблиця 9
Вихідні дані для аналізу
№ п/п |
х1 |
х2 |
х3 |
х4 |
х5 |
група |
1 |
9,26 |
0,78 |
1,37 |
0,23 |
1,45 |
а |
2 |
9,38 |
0,75 |
1,49 |
0,39 |
1,3 |
а |
3 |
12,11 |
0,68 |
1,44 |
0,43 |
1,37 |
а |
4 |
10,81 |
0,7 |
1,42 |
0,18 |
1,65 |
а |
5 |
9,35 |
0,62 |
1,35 |
0,15 |
1,91 |
а |
6 |
9,87 |
0,76 |
1,39 |
0,34 |
1,68 |
а |
7 |
9,12 |
0,71 |
1,27 |
0,09 |
1,89 |
а |
8 |
5,49 |
0,74 |
1,1 |
0,05 |
1,02 |
b |
9 |
6,61 |
0,72 |
1,23 |
0,48 |
0,88 |
b |
10 |
4,32 |
0,68 |
1,39 |
0,41 |
0,62 |
b |
11 |
7,37 |
0,77 |
1,38 |
0,62 |
1,09 |
b |
12 |
6,64 |
0,77 |
1,35 |
0,5 |
1,32 |
b |
13 |
5,52 |
0,72 |
1,24 |
1,2 |
0,68 |
b |
14 |
9,37 |
0,79 |
1,4 |
0,21 |
2,3 |
а |
15 |
5,68 |
0,71 |
1,28 |
0,66 |
1,43 |
b |
16 |
5,22 |
0,79 |
1,33 |
0,74 |
1,82 |
b |
17 |
10,02 |
0,76 |
1,22 |
0,32 |
2,62 |
а |
|
|
|
|
|
|
|
18 |
8,17 |
0,73 |
1,16 |
0,38 |
1,94 |
? |
19 |
6,3 |
0,73 |
1,25 |
0,21 |
2,06 |
? |
20 |
8,72 |
0,79 |
1,41 |
0,45 |
2,22 |
? |
Запустити програму Statistica. Сформувати таблицю вихідних даних. Зауважимо, що в таблицю вихідних даних необхідно додати кілька рядків без даних (вони призначені для об’єктів, які потрібно віднести до певного класу). На панелі інструментів Statistics або в меню Statistics вибрати функцію Discriminant Analysis – Дискримінантний аналіз. У стартовому вікні Дискримінантного аналізу потрібно обрати групувальний показник – Grouping (у нашому випадку – „група”) і незалежні змінні – Independent (рис. 29). У цьому ж вікні можна зробити додаткові установки.
Рис. 29. Стартове вікно Дискримінантного аналізу
Натиснувши кнопку ОК, одержимо вікно результатів (рис. 30).
Рис. 30. Вікно результатів дискримінантного аналізу
В інформаційній частині вікна міститься наступна інформація: кількість змінних у моделі, значення лямбди Уілкса, значення критерію Фішера для апроксимації. У функціональній частині вікна є ряд кнопок для всебічного перегляду результатів.
Натиснувши кнопку Classification functions – Класифікаційні функції, одержимо коефіцієнти дискримінантних функцій для двох груп (рис. 31). Угорі в таблиці вказана ймовірність віднесення підприємства до тієї чи іншої групи.
Рис. 31. Коефіцієнти дискримінантних функцій
Ініціювавши кнопку Classification matrix, одержимо матрицю класифікацій, у якій зазначено кількість спостережень у кожній групі й імовірність попадання спостережень у групи (рис. 32). Зверніть увагу на цю матрицю. У стовпці Percent Correct указаний процент правильної класифікації об’єктів. У рядках матриці вказана спостережувана класифікація підприємств, а у стовпцях – отримана за побудованими дискримінантними функціями. З матриці видно, що у цьому прикладі не спостерігається випадків неправильної класифікації.
Рис. 32. Матриця класифікацій
Класифікацію елементів можна одержати, натиснувши на кнопку Classification of cases. Якщо у стовпці Cases не виявиться елементів, позначених „зірочкою”, то це свідчить про коректну класифікацію і гарну апроксимацію дискримінантних функцій.
Для того, щоб класифікувати нові об’єкти (підприємства), НЕ ЗАКРИВАЮЧИ АНАЛІЗ, вводимо у вихідну таблицю значення тих об’єктів, які потрібно віднести до певної групи. Потім у вікні аналізу результатів ініціюємо кнопку Posterior Probabilities – Апостеріорні ймовірності. В результаті одержимо таблицю класифікацій, за якою визначаємо, у який клас увійшли нові об’єкти (рис. 33). Так підприємства 18 і 20 увійшли в групу а, а підприємство 19 – у групу b. (Дивіться значення ймовірності попадання об'єкта в ту або іншу групу. Для якої групи ймовірність вища, до тієї групи і відноситься об'єкт).
Рис. 33. Апостеріорні ймовірності
Завдання. Самостійно ознайомтеся з іншими можливостями модуля Дискримінантного аналізу. Проведіть покроковий дискримінантний аналіз, змінюючи початкові установки. Порівняйте результати, отримані різними методами.