Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лек№12 КМ ЗВТ.doc
Скачиваний:
10
Добавлен:
16.05.2015
Размер:
1.24 Mб
Скачать

6.3 Кореляційний аналіз даних

6.3.1 Матриця даних

Багато об'єктів дослідження характеризуються безліччю параметрів, і за результатами спостереження за їх функціонуванням формуються матриці вимірювань (експериментальних даних -ЕД)

(6.1)

Рядки такої матриці відповідають результатам регістрації всіх вимірюваних параметрів об'єкта в одному експерименті, а стовпці містять результати спостережень за одним параметром (фактором, варіантом) у всіх експериментах. Позначимо кількість параметрів через , а кількість спостережень - через.

У матриці елементвідповідає значеннюj-го варіанта в i-му спостереженні. Матриця, взагалі кажучи, може містити порожні елементи, наприклад, через пропуски в регістрації значень параметрів. У багатовимірному аналізі бажано усунути пропущені значення. Для цього існують спеціальні прийоми, зокрема, викреслювання відповідних рядків матриці або занесення середніх значень замість відсутніх. Надалі будемо вважати, що матриця не містить порожніх елементів, а параметри об'єкта характеризуються неперервними випадковими величинами.

Методи обробки матриці ЕД засновані на наступному припущенні: якщо об'єкт піддати новому обстеженню і отримати, взагалі кажучи, іншу матрицю даних, то після її обробки за допомогою тих же методів будуть отримані результати, близькі до результатами обробки першої матриці. Дане припущення грунтується на статистичній гіпотезі формування матриці ЕД. Матриця породжується випадковим чином відповідно до визначеної імовірнісної закономірності, а саме: в -вимірному просторі параметрів існує деякий (нехай і невідомий) розподіл ймовірностей, і кожен рядок матриці з'являється у відповідності з цим розподілом незалежно від появи інших рядків.

Кожен стовпець матриці уявляє собою випадкову вибірку значень одного параметра об'єкта. Вказане припущення означає, по-перше, що оцінки моментів і параметрів розподілу, обчислені за вибіркою, будуть близькі до істинних значень, по-друге, значення неперервних функцій, побудованих за цими оцінками, будуть близькі до значень функцій, побудованим за істинним значенням параметрів.

Таким чином, об'єктом дослідження в багатовимірному аналізі є багатовимірна випадкова величина, представлена ​​вибіркою кінцевого об'єму.

Параметри, що характеризують об'єкт дослідження, мають різний фізичний зміст, і матриця даних істотно змінюється, якщо змінюються шкали, в яких вимірюються ті чи інші параметри. Матрицю даних ще до проведення аналізу доцільно привести до стандартного вигляду, тобто стандартизувати значення варіант (нагадаємо, що середнє значення стандартизованої варіанти дорівнює нулю, дисперсія - одиниці). У тих випадках, коли всі варіанти вимірюються в одній шкалі, це перетворення таки бажано, бо воно спрощує подальші перетворення. Стандартизовану матрицю будемо позначати через. Перехід від вихідної до стандартизованої матриці здійснюється наступним чином:

обчислюються оцінки математичного сподівання і дисперсіїкожної варіанти,; обчислюються елементи стандартизованої матриці

,

Елементи матриці є безрозмірними величинами. Саме матриця U буде об'єктом наступної обробки.