Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект для заочників з МПСД.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
4.53 Mб
Скачать
  1. Кореляційний аналіз випадкових величин

Розглянемо дві випадкові величини і , задані таблицею. Необхідно визначити, чи існує зв’язок між цими величинами, тобто, чи впливає величина на величину . Для початку побудуємо точковий графік розташування точок з координатами на площині – поле розсіювання. Характер розташування точок може дати наглядне уявлення про вид формули, яка зв’язує досліджувані величини і тісноту зв’язку між ними. Найбільш тісним зв’язком є функціональний (всі точки лягають на одну лінію). При відсутності зв’язку точки рівномірно розсіюються по координатній площині (Рис. 2).

Рис.2. (зліва) лінійний зв’зок величин X i Y; (по центру) нелінійний зв’зок величин X i Y; (справа) зв’язок між X i Y відсутній.

Для оцінки сили зв’язку між випадковими величинами і використовують коваріацію

. (6)

Більш точною оцінкою сили зв’язку величин і є коефіцієнт кореляції

. (7)

Відмітимо деякі властивості коефіцієнта кореляції r.

  1. 1 r 1;

  2. Якщо r =1, зв’язок між X i Y є функціональним. Якщо r  0, зв’язок відсутній; при - зв’язок слабкий; при зв’язок помірний; при - зв’язок помірний; при зв’язок щільний; при зв’язок функціональний. Розглянута класифікація носить назву шкала Чеддока.

  3. Якщо r > 0, це означає, що функція y = f(x) є зростаючою. Якщо r < 0, це означає, що функція y = f(x) є спадною.

  1. Принцип найменших квадратів. Лінійна регресія.

Процес побудови емпіричних формул складається з двох етапів: встановлення загального виду цієї формули і визначення найкращих її параметрів. Поле розсіяння візуально підказує вигляд графіка функції. Найчастішу підбирають найпростіші функції: лінійну, квадратичну, логарифмічну.

Найточніші значення коефіцієнтів емпіричної формули визначають методом найменших квадратів (Гаусс, Лежандр).

Принцип Лежандра. Сума квадратів відхилень (нев’язок) емпіричної функції y = f(xi) від експериментальних значень yi повинна бути мінімальною

. ( 8 )

Розглянемо найпростіший випадок залежності між X i Y – лінійну

y = ax + b , ( 9 )

де коефіцієнти a та b – невідомі. Згідно з принципом Лежандра

. (10 )

Умовою мінімуму функції S(a,b) є умова: . Звідси отримуємо систему двох лінійних алгебричних рівнянь відносно невідомих a i b.

( 11 )

Верифікація моделі регресії.

Верифікація (перевірка) моделі регресії відбувається у два етапи.

Перший етап – перевірка адекватності моделі – здійснюється за критерієм Фішера. Спочатку обчислюють коефіцієнт детермінації

. (12)

Коефіцієнт детермінації показує, на скільки відсотків варіація залежної змінної y визначає-ться варіацією незалежної змінної x. Перевірка адекватності моделі здійснюється на основі F – критерію Фішера. Спочатку розраховується відношення (F – статистика):

. (13)

Потім для рівня значущості (як правило він дорівнює 0,05 або 0,01) та ступенів свободи визначається критичне значення критерію Фішера . Якщо виконується співвідношення F > Fкр, то побудована регресійна модель адекватно апроксимує дані спостережень.

Необхідно також здійснити перевірку статистичної значущості параметрів моделі .

Якщо доведена адекватність і статистична значущість моделі парної лінійної регресії її можна використати для прогнозування значення залежної змінної у. При цьому можна отримати два види прогнозів: точкові та інтервальні.

Точковий прогноз для будь-якого значення фактора xn+1 дає середнє очікуване значення залежної змінної y на основі вибірки, за якою побудована вибіркова модель :

. (14)

Для визначення дійсних прогнозних значень залежної змінної необхідно побудувати інтервальний прогноз. Інтервальний прогноз дає можливість визначити інтервали довіри для змінної y, у який з ймовірністю p можуть потрапити справжні значення залежної змінної у. Ширина довірчого інтервалу визначається співвідношенням

(15)

Нижня і верхня межа інтервального прогнозу визначаються за співвідношеннями

. (16)