Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Bashirov_I.H.,Uzbek__K.M.,SHCHetinina_O.K.Marke...doc
Скачиваний:
44
Добавлен:
15.11.2019
Размер:
5.81 Mб
Скачать

4. Регресійні однофакторні моделі

Регресійний аналіз є дуже потужним методом дослідження і аналізу економічних процесів та явищ.

Етапи проведення регресійного аналізу:

  1. Формулювання проблеми, задача, гіпотези.

  2. Розробка моделі регресії для реалізації проблеми.

  3. Оцінка параметрів обраної моделі.

  4. Перевірка моделі на адекватність і надійність. Статистичні оцінки і висновки.

  5. Маркетингова інтерпретація отриманих результатів.

  6. Прогнозування на основі отриманої моделі.

  7. Використання моделі для обґрунтування висновків маркетингового дослідження.

Кожен з цих етапів реалізується з використанням того або іншого математичного апарата.

Статистичною називається залежність між випадковими величинами і , при якій зміна одній з них приводить до зміни розподілу ймовірності другої. Зокрема, статистична залежність, при якій умовна середня однієї ознаки змінюється функціонально при випадковій зміні іншої ознаки , називається кореляційною залежністю. Функція, що відображає кореляційний зв'язок між середнім значенням і випадковим значенням , називається вибірковим рівнянням регресії на .

Етапи кількісного вивчення кореляційного зв'язку:

  • знаходження теоретичної лінії регресії (встановлення форми зв'язку);

  • визначення значень параметрів зв'язку.

  • визначення тісноти (сили) зв'язку;

Коли відоме емпіричне поле розсіювання вибірки, а тип функції визначено, слід привести форму кривої у відповідність з величинами даного поля розсіювання. Для цього треба визначити параметри регресійного рівняння. Є дві основні групи методів підбору параметрів функції.

Перша група методів. Підбір проводиться за допомогою окремих величин. Наприклад, проводиться по двох точках пряма лінія. Це значно полегшує визначення параметрів лінійної, степеневої і експоненціальної функцій.

Друга група методів. Підбір проводиться за допомогою всіх величин емпіричного поля розсіювання. Розрізняють два випадки:

  1. всі величини рівнозначні – підбір параметрів рівняння з урахуванням рівнозначності всіх величин (метод ковзної середньої; метод найменших квадратів);

  2. рівнозначність величин відсутня – підбір параметрів рівняння за умови нерівнозначності дослідних даних (адаптивні методи).

4.1. Лінійне рівняння регресії. Метод найменших квадратів

Найбільш поширеним через свою простоту і широку область застосування є метод найменших квадратів (МНК), вперше розроблений Гаусом в 1797р. Його ідея полягає у знаходженні оцінок параметрів функції регресії, яка відповідає мінімальному значенню суми квадратів відхилень розрахункових значень досліджуваного показника від його експериментальних значень. Одержувані за допомогою МНК оцінки параметрів регресійної залежності мають властивості незміщеності, спроможності та ефективності.

Для лінійного виду зв'язку рівняння регресії має вигляд

, (4.1)

де – точне фактичне значення показника, і – невідомі параметри регресії, – випадкова величина, яка характеризує вплив на показник відмінних від факторів (її називають залишками або відхиленнями).

Точні значення коефіцієнтів і обчислити неможливо в силу обмеженості числа спостережень, тому на основі статистичного матеріалу визначають оцінки (тобто наближені значення) і , які є розрахунковими значеннями параметрів і . Тоді рівняння лінійної регресії

(4.2)

буде оцінкою моделі (4.1).

Позначимо фактичні рівні результативного показника, а через його розрахункові (теоретичні) значення, обчислені за формулою (4.2), тут , де – кількість спостережень. Тоді різниця характеризує відхилення розрахункових значень показника від його фактичних значень. МНК полягає у підборі таких оцінок параметрів регресії і , для яких сума квадратів відхилень спостережених значень показника від розрахункових буде найменшою. Складемо суму квадратів відхилень теоретичних від фактичних значень показника

. (4.3)

Необхідною умовою існування мінімуму функції двох змінних (4.3) є рівність ну-

лю її перших частинних похідних З цієї системи одержимо систему нормальних рівнянь для обчислення оцінок параметрів однофакторної лінійної моделі регресії

(4.4)

Перевірку практичної значущості моделі здійснюють за допомогою показників тісноти зв’язку між ознаками і .

Коефіцієнт кореляції або парний коефіцієнт кореляції характеризує ступінь лінійної кореляційної залежності показника від фактору

, (4.5)

де – середньоквадратичне відхилення значень ; – середньоквадратичне відхилення значень .

Слід зауважити, що коефіцієнт кореляції приймає значення з відрізку , тобто . Чим ближче абсолютне значення коефіцієнту кореляції до одиниці, тим тісніший кореляційний зв’язок між показниками.

Висновок про ступінь кількісного зв’язку між змінними можна зробити на основі шкали Чеддока (табл. 4.1).

Таблиця 4.1 – Шкала Чеддока

Показники тісноти зв’язку

< 0,5

0,5–0,6

0,6–0,7

0,7–0,8

0,8–0,9

0,9–0,99

Характеристика сили зв’язку

Дуже слабкий

Слабкий

Помітний

Середній

Сильний

Дуже сильний

Коефіціеєт детермінації у випадку однофакторної лінійної регресії дорівнює квадрату парного коефіцієнта кореляції. Він вимірює долю загальної дисперсії (розсіяння навколо середнього значення), яку можна пояснити побудованою регресійною залежністю.

Після побудови регресійної залежності її перевіряють на адекватність фактичним даним. Адекватність регресійної моделі може бути встановлена за допомогою статистичних величин:

1. Середнья помилка апроксимації – це середній відсоток відносних відхилень теоретичних значень, знайдених за рівнянням регресії, від фактичних значень досліджуваного показника.

За рівнянням регресії знаходять теоретичні значення , підставляючи в них відповідні значення фактору . для кожного значення розраховують відсоток відносного відхилення теоретичного значення від фактичного за формулою

. (4.6)

Для рівняння в цілому підраховують середній відсоток відносних відхилень теоретичних значень від фактичних

. (4.7)

частіше за все в маркетингових дослідженнях допускається п’ятивідсоткова погрішність (іноді 10-відсоткова), тобто модель регресії вважають адекватною (а значить, і придатноюдля подального аналізу та прогнозу), якщо (іноді, якщо ).

2. Залишкова дисперсія (або залишкове среднєквадратичне відхилення ) використовується при оцінці отриманого рівняння регресії. Так, наприклад, вибір найбільш підходящої моделі можна проводити на основі залишкового среднєквадратичного відхилення

(4.8)

де кількість спостережень, кількість параметрів в рівнянні (для лінійної однофакторної моделі ).

Для лінійного рівняння регресії залишкову дисперсію можна також обчислити за формулою .

Вибір кращої (тобто найточнішої) серед декількох моделей здійснюють за найменшою величиною залишкової дисперсії.

3. Критерій Фішера: спостережене значення критерію Фішера

(4.9)

порівнюють з критичним , яке визначають за таблицею критичних точок Фішера по ступенях свободи і , задаючи рівень значущості (додаток 4).

Якщо , то рівняння регресії неадекватно описує зв'язок між і .

Якщо , те рівняння регресії адекватно описує зв'язок між і .

Чим більше розрахункова величина критерію (4.9), тим значимішою, надійнішою вважають модель.

Приклад 4.1. Залежність загального об'єму товарообігу підприємства від товарообігу продовольчих товарів (табл.4.2) може бути представлена у вигляді лінійної однофакторної регресії (4.2), де – товарообіг підприємства, тис. грн., – товарообіг продовольчих товарів, тис.грн.

Таблиця 4.2 – Вихідні дані приклада 4.1

Товарообіг продовольчих товарів

5,4

5,7

6,1

6,3

6,5

6,8

7,1

Товарообіг підприємства

8,7

9,4

10,1

10,6

11

11,5

12,1

Знайти лінійне рівняння регресії, визначивши його параметри. Обчислити коефіцієнт кореляції між та , перевірити адекватність моделі.

Розв’язок: Для проведення розрахунків побудуємо таблицю 4.3, на підставі якої система нормальних рівнянь (4.4) має вигляд

Звідки ; . Рівняння регресії має вигляд:

. (4.10)

Таблиця 4.3 – Допоміжні розрахунки

5,4

8,7

29,16

46,98

75,69

8,78

0,92

5,7

9,4

32,49

53,58

88,36

9,37

0,32

6,1

10,1

37,21

61,61

102,01

10,17

0,69

6,3

10,6

39,69

66,78

112,36

10,57

0,28

6,5

11

42,25

71,5

121

10,97

0,27

6,8

11,5

46,24

78,2

132,25

11,56

0,52

7,1

12,1

50,41

85,91

146,41

12,16

0,5

43,9

73,4

277,45

464,56

778,08

3,51

За допомогою пакету EXCELL одержимо наступну діаграму (рис. 4.1).

Рисунок 4.1 – Лінія тренда залежності загального товарообігу

підприємства від товарообігу продовольчих товарів

Визначаємо среднєквадратичні відхилення:

;

.

Знайдемо значення вибіркового коефіцієнту кореляції:

.

Обчислений коефіцієнт кореляції свідчить про дуже високу ступінь лінійної кореляційної залежності досліджуваних економічних показників діяльності підприємства торгівлі.

Оцінимо точність, а тим самим і адекватність одержаного рівняння регресії, визначивши середній відсоток відхилення за формулою 4.7. Теоретичні значення , визначені підстановкою значень фактору у рівняння регресії (4.10), записано в колонці таблиці 4.3.

З результатів таблиці 4.3 маємо .

Точність вибору параметрів рівняння регресії є високою, оскільки . Можемо зробити висновок, що лінійна модель регресії адекватно описує залежність загального об'єму товарообігу підприємства від товарообігу продовольчих товарів.