
- •Кореляційний та регресійний аналіз
- •Кореляція і кореляційний аналіз.
- •Каваріація. Її властивості.
- •Коефіцієнт лінійної кореляції та його властивості. Кореляціне поле.
- •Кореляційний аналіз і його задачі.
- •Статистична оцінка коефіцієнтів лінійної кореляції.
- •Перевірка гіпотези про значущість коефіцієнта кореляції
- •Кореляційна матриця
- •Порівняння двох коефіцієнтів лінійної кореляції
- •Регресія, регресійний аналіз
- •Простата лінійна регресія
- •Перевірка гіпотез при простій лінійній регресії
- •Гіпотеза про рівність коефіцієнтів регресії визначеному значенню
- •Інтервальне оцінювання при простій лінійній регресії
Коефіцієнт лінійної кореляції та його властивості. Кореляціне поле.
Коваріація має розмірність добутку розмірності величин на якій вона побудована. То б то, величина коваріації залежить від масштабу цих величин. Ця властивість утруднює її використання в якості міри залежності – важко використовувати в якості критерію величину, значення якої міняється в залежності від конкретної ситуації.
Тому, для оцінки лінійного зв’язку між двома випадковими величинами, використовують коефіцієнт лінійної кореляції, який можна визначити за рівнянням:
За цим рівнянням коефіцієнт лінійної кореляції це коваріація віднесена до добутку стандартних відхилень випадкових величин. Оскільки за нерівністю Коші-Буняковського |cov(X,Y)| ≤σX∙σY, то рівняння -- це нормування коваріації, а коефіцієнт лінійної кореляції – нормована коваріація, що приймає значення від -1 до 1 для будь яких випадкових величин. Завдяки цій властивості коефіцієнт лінійної кореляції є зручною величиною для оцінки ступені взаємодії двох випадкових величин.
При тому рівність
коефіцієнту кореляції 1 та -1 спостерігається
лише тоді коли між випадковими величинами
спостерігається лінійна залежність.
Точніше, якщо елементи вибірки X
можна зв’язати з елементами вибіркиY строгою
залежністю.
Строгість полягає в тому, що
коефіцієнтиa
іb цієї
залежності є константами – їх значення
не випадкові і однакові для всіх пар
значень вибірок. Реалізується така
ситуація лише в тому випадку, коли
елементиXтаYзв’язані між собою лінійною залежністю,
а їх визначення не супроводжується
статистичною помилкою, або значення
цієї помилки є значно меншим ніж точність
оцінки значень коефіцієнтівaтаb. Формально в цьому
випадку немає підстав говорити, що
величини, які спостерігаються, є
випадковими.
У
Рис._
. Вигляд кореляційних полів при різних
значеннях коефіцієнту парної кореляції.
В
Рис.__.
Кореляціні поля з більш складною за
лінійну залежність
між випадковими величинами.
Лише локалізація значень між -1 і 1 є власною властивістю коефіцієнту лінійної кореляції. Всі інші є властивостями коваріації. Зокрема, як і у випадку коваріації, нульове значення коефіцієнту лінійної кореляції означає лише що між двома величинами немає лінійної залежності. Але це ще не означає, що ці дві величини незалежні. Дві величини можуть бути пов’язані більш складним за лінійний зв’язком. Такі випадки ілюструють кореляційні поля що приведені на рис.__. По при те що на цьому рисунку зображені кореляційні поля залежних випадкових величин значення лінійного коефіцієнту кореляції близькі до нуля, або рівні нулю.
Слід пам’ятати ще одне обмеження що пов’язане з коефіцієнтом лінійної кореляції. Відмінність коефіцієнту кореляції від нуля дозволяє висновок, що між двома величинами є стохастичний зв’язок. Але лише стохастичний. Коефіцієнт лінійної кореляції не дозволяє зробити висновок, що між двома випадковими величинами є причинено-наслідковий зв'язок. Далеко не кожен стохастичний зв'язок є причинно-наслідковим. Дуже часто спостерігають стохастичний зв'язок між двома величинами що спричинений впливом на них спільного фактора, про існування якого або про його вплив експериментатор може і не знати. А саме з ним, а не між собою, випадкові величини знаходяться в причино-наслідковому зв’язку.