
Лекція № 12 Тема: Елементи кореляційного та регресійного аналізу
План лекції:
1. Види зв’язку між випадковими величинами.
2. Вибірковий коефіцієнт кореляції.
3. Згладжування експериментальних даних методом найменших квадратів.
4. Лінійна регресія.
1. Види зв’язку між випадковими величинами
В попередніх темах ми розглядали ситуації, коли під час експерименту досліджувалась одна якась ознака (випадкова величина). Інші наявні у досліджуваної сукупності ознаки або вважалися сталими, або відносилися до випадкових факторів, які впливають на зміни ознаки, яка вивчалася. Але, насправді, статистичні дослідження значно складніші і виникає питання про взаємозв’язок (залежність) між окремими випадковими величинами.
Зв’язки (залежності) між різними явищами навколишнього середовища складні і багатогранні, але при математичному моделюванні ці зв’язки можна певним способом класифікувати.
В
природознавстві і техніці часто
зустрічається функціональний
зв’язок.
Суть функціонального
зв’язку
полягає
в тому, що деяка величина визначається
як однозначна функція однієї або
декількох величин. Наприклад, залежність
між довжиною кола і радіусом виражається
законом
;
залежність між силою ваги і масою
;
залежність між тиском та об’ємом і
температурою
.
Для
випадкових величин строго функціональний
зв’язок
реалізується рідко. Це пов’язано з тим,
що в системі
обидві
величини або одна з них зазнають впливу
випадкових факторів. Більш того, серед
цих факторів можуть бути і спільні,
тобто такі, які впливають на обидві
величини одночасно.
В тих випадках, коли зв’язок між випадковими величинами втрачає функціональний характер і досліджуваний об’єкт або система об’єктів переходить не в однозначно визначений стан, а в один з можливих станів, має місце так званий стохастичний зв’язок. Суть стохастичного зв’язку полягає в тому, що із зміни однієї випадкової величини випливає зміна закону розподілу другої.
В практиці
статистичних досліджень часто
розглядається окремий випадок
стохастичного
зв’язку,
який називається статистичним
зв’язком.
Про цей зв’язок можна говорити тоді,
коли умовне математичне сподівання
однієї випадкової величини
є функцією значення, якого набуває друга
випадкова величина
,
тобто
Таким чином, щоб вивчати статистичний зв’язок, потрібно знати умовне математичне сподівання. Для його оцінки необхідно знати закон розподілу двовимірної випадкової величини .
На практиці закон розподілу представлено результатами вибірки, тому від умовного математичного сподівання переходять до умовного середнього значення. Зв’язок між однією випадковою величиною і умовним середнім значенням другої випадкової величини називається кореляційним, а саме:
Кореляційною
залежністю
випадкової
величини
від
називається функціональна залежність
умовного середнього
від аргументу х,
що можна записати так:
.
Аналогічно,
кореляційною
залежністю
випадкової величини
від
називається функціональна залежність
умовного середнього
від аргументу y,
що можна записати так:
Кореляційний зв’язок має важливе теоретичне і практичне значення. Він характеризується силою і формою зв’язку.
При вивченні статистичних залежностей розрізняють прямолінійні та криволінійні кореляційні зв’язки. Прямолінійні кореляційні зв’язки оцінюються коефіцієнтами кореляції, а криволінійні – кореляційним відношенням.
Метод статистичного аналізу для дослідження і оцінки залежностей між випадковими величинами за відповідними коефіцієнтами кореляції називається кореляційним аналізом.
Крім того, кореляційний аналіз оцінює, наскільки значні невипадкові зміни у випадкових величинах у процесі проведення експерименту.