Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
goss_legche_nekuda.docx
Скачиваний:
5
Добавлен:
01.07.2025
Размер:
1.76 Mб
Скачать
  1. Як застосовується кластерний аналiз для побудови типологiй об'єктiв?

Якщо ми маємо набір певних об’єктів (наприклад, перелік областей підчас виборів), ми можемо за допомогою кластерного аналізу (а краще ієрархічного КлА) розбити їх за певним принципом на групи (кластери), кожна з яких матиме свою інтерпретацію, відштовхуючись від того, які саме об’єкти туди потрапили. Так об’єднання в один кластер Львівської, Івано-Франківської та Тернопільської області говорить ро приналежність до Західних областей та специфічною культурою і історією, що могло стати причиною того чи іншого електорального вибору, приклад якого ми розглядаємо.

  1. Як застосовується кластерний аналiз для групування ознак? Кластерний аналіз – це автоматична класифікація подібних але не тотожних об’єктів за певною основою, створення однорідних, подібних груп, за умови, що один об’єкт належить лише до одного класу (групи), а в межах групи об’єкти однакові. Паніотто визначає кластер ний аналіз як багатомірну статистичну процедуру, що дозволяє класифікувати об’єкти або спостереження в порівняно однорідні групи, названі кластерами. Отже, результат кластерного аналізу – кластери, які мають бути кількісно чисельними, добре інтерпретуватися як деякі змістовні типи. Кластеризація здійснюється на основі формалізованих відстані/близькості або подібності між об’єктами. Дистанція (відстань) є мірою того, наскільки об’єкти віддалені одне від одного. Близькість – навпаки. За таких умов відстань має бути мінімальною, а подібність – максимальною. Мета кластерного аналізу – побудова алгоритмів класифікації досліджуваних об’єктів. Кожен об’єкт характеризується однаковим числом з n змінних і тому є точкою деякого n – мірного простору M. В результаті кластеризації близькі об’кти включаються в одну гурпу. Таким чином, множина вивчуваних ою’жєктів розбивається на групи. Група близьких об’єктів – кластер – представляє собою згусток точок в просторі M.

  1. Наведiть аксiоми вiдстанi.

1) невід’ємність – d (x, y) 0

2) нерозрізненість, тотожність об’єктів d (x, x) = 0

3) Розрізненість, нетотожність об’єктів

4) симетричність (від х до у, від у до х) – d (x, y) = d (y, x)

5) нерівність трикутника d (x, y) + d (y, z) d (x, z) – тобто сума двох сторін буде більшою за третю сторону.

(остання, п’ята, властивість для кластерного аналізу може і не виконуватися, що говорить про неоднозначні кластери)

Найбільш часто вживані відстані:

«Відстань між точками». чи .

«Геометрична Евклідова відстань». . Простір Розмірності К-ознак. Одиниці вимірювання є однаковими, чи не впливають (або однаково впливають) на результат.

Вагові коефіцієнти для кожного виміру . Пошук вагових коефіцієнтів – емпіричним шляхом. Ваговий коефіцієнт – коефіцієнт стандартизованого рівняння регресії.

«Відстань за Міньковським». . В випадку, коли корінь не добувається – квадрат Евклідової відстані.

«Міра за Хемінгом». . k – номер стовпчика. Міра для ознак розмірностей (0,1). Співпадають чи не співпадають 1 та 0 відповідних об’єктів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]