Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Topolnik_V.G._MATEMATIKO-STATISTICHNI_METODI_DO...doc
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
3.49 Mб
Скачать

5.1. Загальні поняття

Регресійний аналіз досліджує кількісні зв'язки між двома (чи декількома) ознаками. Наприклад, якщо між двома ознаками існує лінійний статистичний зв'язок (залежність), то рівняння, задане лінією регресії, дає можливість для будь-якого значення незалежної змінної величини (значення аргумента-регресора) розрахувати відповідне значення залежної змінної величини (зна­чення функції). Регресійний аналіз є основним статистичним мето­дом побудування математичних моделей об'єктів чи явищ за експериментальними даними.

Необхідно відмітити, що функція регресії, яка визначається в ході аналізу, встановлює кількісну відповідність між результуючими та чинниковими змінними величинами лише формально, хоча в дійсності ці змінні величини можуть і не стояти в причинно-наслідкових відношеннях. Тому зв'язки, які встановлюються, можуть інколи невірно тлумачитись як причинно-наслідкові. Отож, перед застосуванням статистичного апарату необхідно на основі профе­сійно-логічного аналізу вирішити, яку із змінних величин розгля­дати як результуючу, а які із зареєстрованих величин - як чинни­кові.

Регресійний аналіз дозволяє оцінити коефіцієнт регресії, який являє собою міру середньої зміни результуючої ознаки при зміні чинникової ознаки (яка вважається незалежною) на одну оди­ницю, а також оцінити сумарні та середні значення ознаки без докладного дослідження цієї ознаки у великої кількості одиниць сукупності.

Функція f(х1, х2, ..., хп), що описує залежність умовного середнього значення у результуючого показника від заданих фіксованих значень передбачаючих змінних величин, називається функці­єю регресії. Найпростіший вигляд функції регресії - лінійний:

f(х) = Y = А + Вх .

Оцінка вільного члена А рівняння регресії для сукупності - є вільний член а рівняння регресії для вибірки.

. (5.1)

Так як та - випадкові величини ( ), то і а - теж випадкова величина.

Оцінкою коефіцієнта регресії В для сукупності є вибірковий коефіцієнт регресії b.

. (5.2)

Так як b є функцією вибірки, тому також є випадковою величи­ною.

Параметри лінійної функції регресії а і b мають геометричну інтерпретацію: вільний член рівняння регресії а являє собою від­стань від початку координат до точки перетину лінії з ординатою чи, іншими словами, це відрізок, який відсічений на ординаті лінією регресії; коефіцієнт регресії b являє собою тангенс кута нахилу лінії регресії до осі абсцис.

Якщо результативна ознака (у) корелює з чинниковою ознакою (х), то це означає, що середнє значення результативної ознаки, що досліджується, залежить від чинникової ознаки, тобто середнє значення розглядається як функція чинникової ознаки. Такі се­редні значення називають умовними. Умовні середні оцінюються за допомогою емпіричної функції регресії

= а+ , (5.3)

побудованої за п парами (хі , уі) значень ознак одиниць вибірки за допомогою найменших квадратів.

Оскільки параметри емпіричної функції регресії (а і b) ви­падкові величини, то значення цієї функції теж випадкова ве­личина.

, (5.4)

де Sу - середнє квадратичне відхилення окремих значень від лі­нії регресії

, (5.5)

де значення функції регресії у точці хі ;.

Формула розрахунку показує, що при обчисленні оцінки та її стандартної помилки для визначеного значення чинникової ознаки враховуються всі значення цієї ознаки, що спостерігають­ся, а не лише ті, що лежать достатньо близько від значення, що розглядається. Ця формула дає міру точності умовного середнього, яке оцінюється за допомогою лінійної регресії. За допомогою цієї формули та квантилів tα - розподілу Стьюдента можна побудувати певну зону для лінії регресії при рівні певної ймовірності (1−α) ×100%.

{ } (5.6)

Ширина певної зони залежить від трьох величин:

  • середнього квадратичного відхилення окремих значень від лінії регресії (вона пропорційна ) ;

  • обсягу вибірки п (вона зменшується зі збільшенням обсягу вибірки) ;

  • відстані ( ) між поточними значенням хі та середнім значенням (вона володіє мінімумом за хі = ).