Виконання:
Запуск системи STATISTICA
Вихідні дані:
Стандартизація даних – приведення змінних до одного безрозмірного вигляду. Така процедура виражається формулою:
Cluster Analysis: Виділяємо масив вихідних даних, клацаємо правою кнопкою миші. Вибираємо Fill(Standardize Block →Standardize Columns);
Матриця коефіцієнтів парної кореляції:
.
Multiple Regression: Analysis Startup Panel→ вказуємо одну залежну зміну, а решта незалежних →Input File(Rave Date-OK)→ Multiple Regression Results(Correlation desc. stats)→Review Descriptive Statistics(Correlations)→матриця r
Матриці відстаней між об’єктами приватизації на основі метрик. Матриці схожості між об’єктами приватизації за побудованими матрицями відстаней:
Cluster Analysis: Analysis→Startup Panel→Clustering Method(Jaining(tree clustering) )→ Jaining (вказуємо метрику відстані)→ Jaining Results (Distance matrix).
А) Евклідова
відстань –
і відповідна метрика схожості;
Б) Квадрат евклідової
норми –
;
і відповідна метрика схожості
В) Лінійна відстань
–
;
і відповідна метрика схожості
Г) Степенева відстань і відповідна метрика схожості;
Д) Супремум – норма
(Метрика Чебишова) –
і
відповідна метрика схожості;
Висновок:
На основі даних обчислень, можна визначити близькість (віддаленість) між об’єктами, встановити однорідність(неоднорідність) досліджуваної сукупності.
За допомогою матриць схожостей, можна сказати, що чим більше віддаленні об’єкти в багатовимірному просторі ознак, тим менше вони є схожими і навпаки.
Завдання 2
Здійснити оцінку латентного показника «Інвестиційна привабливість» об’єктів приватизації на базі метрик відстані та схожості, використовуючи ;
А) класичний алгоритм;
Б) модифікований алгоритм;
Здійснити ранжування об’єктів приватизації у відповідності зі знайденими оцінками за кожним методом, здійснити їх порівняльний аналіз. Виділити серед об’єктів досліджуваної сукупності групи лідерів, посередніх об’єктів, аутсайдерів і зробити короткі статистичні висновки.
Виконання:
1. Класичний алгоритм
1) Утворення матриці вихідних даних
Розділення ознак на:
x1, x2, x7 – стимулятори;
x3, x4, x5, x6 – де стимулятори;
Зважування ознак-симптомів не проводиться.
Перехід до матриці стандартизованих ознак Z. Задання еталону( точка додається до матриці в якості 16 об’єкта (рядок 16)).
Серед x1, x2, x7 визначається максимальне значення ознак, а серед x3, x4, x5, x6 - мінімальне.
z٭(1,872; 2,364; -1,160; -1,632; -1,047; -1,792; 2,280) – точка еталону.
Вибір метрики відстані – Евклідова метрика.
Розрахунок міри схожості (в Excel) за формулою:
Результати
m – оцінки латентного показника;
Лідери (4, 14 підприємства) мають найближчу відстань до еталону.
Аутсайдери (8, 13 підприємства) мають мінімальну схожість з еталоном.
Середняки – підприємства, які займають проміжне значення.
Результати оцінки «Інвестиційна привабливість» об’єктів приватизації за класичним алгоритмом:
