Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
проект диплома готовій.docx
Скачиваний:
73
Добавлен:
11.02.2015
Размер:
4.27 Mб
Скачать

2.2. Групування підприємств торгівельної галузі з використанням методу кластеризації

Кластерний аналіз - це сукупність методів, що дозволяють класифікувати, багатомірні спостереження, кожне з яких описується набором вихідних змінних. Метою кластерного аналізу є утворення груп схожих між собою об'єктів, які прийнято називати кластерами. Слово «кластер» англійського походження, перекладається як «згусток, пучок, група». Родинні поняття, використовувані в літературі - клас, таксон.

На відміну від комбінаційних угруповань кластерний аналіз приводить до розбивки на групи з урахуванням усіх групувальних ознак одночасно.

Методи кластерного аналізу дозволяють:

провести класифікацію об'єктів з урахуванням ознак, що відбивають сутність, природу об'єктів. Розв'язання такої задачі, як правило, призводить до поглиблення знань про сукупності класифікованих об'єктів;

перевірити існуючу структуру в досліджуваній сукупності об'єктів;

побудувати нові класифікації для неформалізованих явищ, коли необхідно встановити наявність зв'язків усередині сукупності й спробувати привнести в неї структуру.

Методи кластерного аналізу можна розділити на дві великі групи: алгомеративні (об'єднуючі) і дивізимні (поділяючі). Алгомеративні методи послідовно поєднують окремі об'єкти в групи (кластери), а дивізимні методи розчленовують групи на окремі об'єкти. У свою чергу кожен метод як об'єднуючого, так і поділяючого типу може бути реалізований за допомогою різних алгоритмів. Слід зазначити, що як алгомеративні, так і дивізимні алгоритми трудомісткі і їх складно використовувати для великих сукупностей. Крім того, результати роботи таких алгоритмів важко піддаються візуальному методу.

У кластерному аналізі існують також методи, які важко віднести до першої або другої групи. Наприклад, ітеративні методи, зокрема, метод - середніх і метод пошуку згущень. їх характерна особливість полягає в тому, що кластери формуються виходячи з заданих умов розбивки (параметрів), які в процесі роботи алгоритму можуть бути змінені користувачем для досягнення бажаної якості розбивки.

Для того, щоб визначити які підприємства будуть використовуватися для подальших розрахунків, необхідно виконати упорядкування їх у таблицю.

Таблиця 2.7

Перелік підприємств, що використовуються для кластерного аналізу

Підприємство

Дохід від реалізації

тис.грн

Вартість статутний капітал

тис. грн

Роки існування компанії

Кіл-сть

праців

ників

Прибуток

(збиток)

тис. грн

Кількість відділень

У

Х1

Х2

Х3

Х4

Х5

ТОВ «ТД ИРБИС»

396675

3150

24

300

26731

8

ЧП «ГалПідшипник»

208670

1260

21

150

10692

5

ООО «ВТК»

16,75

25

15

75

1086

2

«Бином»

211621

200

15

287

8387

1

«Світ підшипників»

30

20

20

50

1666

3

«BRB АВТО»

91105

340

10

75

3037

1

«Карника»

32408

250

15

45

1080

5

«Автопідшипник»

10201

198

20

100

3400

2

«АЛК»

55403

400

18

158

1846

3

«УПЕК»

18243

280

25

100

6086

2

«Підипникзбут»

381824

3222

30

200

13394

6

«Інтерпідшипник»

51222

3011

22

150

1737

4

«Промпідшипник»

84101

2516

20

100

2803

3

«АРКОВ Украина»

25611

191

12

75

8536

2

«Старт Ап»

94312

200

5

50

3143

1

«ЕПК Запоріжжя»

213510

111

7

80

3783

1

До проведення класифікації доцільно перевірити, які ознаки значно впливатимуть на результати класифікації, а які ні. Для цього розраховуються коефіцієнти варіації для виділених ознак за формулою:

(2.1)

де , х - середнє значення ознаки;

- стандартне відхилення.

= (∑(x - xср)2) / n), (2.2)

де, n – кількість показників;

x - значення показника.

Таблиця 2.8

Значення стандартного відхилення для вихідних даних

Показник

Дохід від реалізації

тис.грн

Вартість статутний капітал

тис. грн

Роки існування компанії

Кіл-сть

працівників

Прибуток

(збиток)

тис. грн

Кількість відділень

У

Х1

Х2

ХЗ

Х4

Х5

Значення стандартного відхилення

129913,5579

1220,371

6,722785

79,11234

6951,141

2,048373

Якщо значення коефіцієнта варіації не перевищує 0,33 (або 33%), то відповідна ознака вважається слабо змінною, отже слабко впливає на результати класифікації. Такі ознаки варто виключити з розгляду.

Розраховані коефіцієнти варіації для вихідних даних наведені в табл.2.9.

Таблиця 2.9