Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3blok_Аналіз даних.doc
Скачиваний:
22
Добавлен:
14.02.2016
Размер:
316.42 Кб
Скачать

5. Регресійний аналіз.

Задачу апроксимації експерим. результатів можна подати так:

Встановити функціональну залежність y=(f1,…, fn) де n – кількість параметрів.Можливі два випадки:

1. Залежність f відома і необхідно встановити тільки її конкретні параметри, які називають параметрами моделі, а сама задача називається задачею параметричної ідентифікації.

2. Залежність f невідома, і необхідно визначити як конкретний вид моделі так і її параметри і таку задачу назив. задачою ідентифікації.

На практиці для апроксимації експерим. даних використ. різні методи (апроксимація поліномом, сплайнами, експонентами тощо)

Часто задачу апроксимації поліномами називають регресійним аналізом. У цьому випадку р-ня моделі є лін. відносно її параметрів.

де - вектор параметрів моделі

- вектор відносних даних

- наперед задані ф-ції, l=0..m

Тоді, якщо вважати, що структура такої моделі повністю відома необхідно провести N дослідів, причому N>m і визначити тільки відомі параметри моделі, значення яких відповідали б наперед заданій умові.

Умову, за якою визнач. параметри моделі можна сформ. так: необхідно визначити параметри моделі такі, щоб значення ф-ї (b-вимірний параметр) мало відрізнялось від експкриментільнихybj у всіх точках j=1..N

За міру близькості між порахованим і дійсним значеннямybj беруть ф-цію:

Значення вектора обчислюються виходячи зщо досягається у випадку, якщо

Часто такий підхід до визнач. параметрів моделі назив. методом найменших квадратів.

6. Кластерний аналіз.

Кластеризація призначена для розбиття сукупності об’єктів на однорідні групи (кластери, класи). Якщо дані вибірки представити як точки у деякому просторі, то завдання кластеризації зводиться до визначення “згущень точок”.

Мета кластеризації – пошук існуючих структур.Кластеризація є описовою структурою. Вона не робить таких статит. Висновків, але дає можл. Проводити розвідувальний аналіз і вивчити структуру даних.Хар-ми кластера можна назвати 2 ознаки: внутрішню однорідність і зовнішня ізольованість. Питання, що задається аналітиками при виріш. задач , полягає в тому, як організовувати дані у научні структури, тобто розгорнути таксономії.

Характеристики підходів до кластеризації:

- алгоритми, що базуються на розділенні даних;

- ієрархічні а-ми;

- методи, що базуються на концентрації об’єктів;

- Грід-методи;

- т.зв. модельні методи.

Постановка проблеми

Кластер ний аналіз – набір засобів для побудови груп (кластерів) багатовимірних об’єктів.

Мета – побудувати групи із гомогенними вл-ми всередині та гетерогенними вл-ми між групами.

Кластерний аналіз складається з:Вибору виміру близькості (подібність-відмінність),вибору алгоритму побудови груп;

Подібність об’єктів

Вихідною точкою кластерного аналізу є набір об’єктів зn вимірюваннями та p характеристиками.

Подібність між об’єктами записується за допомогою матриці D(n*n) Матриця D вміщує міру подібності чи відмінності між n обктами. Якщо відстань то елемент описує відмінність. Подібність та відмінність дуальні, тому якщо відмінність позначає , тоmax { }=позначає подібність. Вибір для аналізу подібності і відмінності залежить від природи об’єктів.

Подібність об’єктів бінарної структури

Метою визначення подібності між об’єктами порівнюють пари спостережень (), де,

Загальний вираз для визначення відстані

,,

,Метод Джакарта -для (),Метод Танімотодля (),Метод Дайса -для (),Метод Кульчинські -

12

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]