- •Основні положення регресійного аналізу. Парна регресійна модель. Множинний регресійний аналіз
- •Інтервальна оцінка функції регресії
- •Преревірка значущості рівняння регресії. Інтервальна оцінка параметрів парної моделі
- •Нелінійна регресія
- •Множинний регресійний аналіз
- •Контрольні питання
- •Введення в аналіз часових рядів Загальні відомості про часові ряди і завдання їх аналізу
- •Стаціонарні часові ряди та їх характеристики. Автокореляційна функція
- •Аналітичне вирівнювання (згладжування) часового ряду (виділення невипадкової компоненти)
- •Часові ряди і прогнозування. Автокореляція збурень
- •Авторегресійна модель
- •Перевірка гіпотез про рівність часток ознаки в двох і більше сукупностях
- •Порівняння часток ознаки в кількох сукупностях
- •Порівняння дисперсій декількох сукупностей
- •Перевірка гіпотез про закон розподілу. Критерій Колмогорова
- •Поняття про багатовимірний кореляційний аналіз. Множинний та частинний коефіцієнти кореляції. Рангова кореляція
- •Множинний коефіцієнт кореляції
- •Частинний коефіцієнт кореляції
- •Рангова кореляція
- •Коефіцієнт рангової кореляції Кендалла
- •Матриця коваріації і її вибіркова оцінка
- •Мультиколінеарність
- •Поняття про інші методи багатовимірного статистичного аналізу
- •Метод головних компонент (компонентний аналіз)
- •Лінійні регресійні моделі фінансового ринку
- •Регресійні моделі
- •Ринкова модель
- •Моделі залежності від дотичного портфеля
- •Неврівноважені і врівноважені моделі
- •Модель оцінки фінансових активів (сарм)
- •Зв'язок між очікуваною прибутковістю і ризиком оптимального портфеля
- •Багатофакторні моделі
- •Список використаної та рекомендованої літератури
11Equation Section 1РОЗДІЛ 7
Основні положення регресійного аналізу. Парна регресійна модель. Множинний регресійний аналіз
Завданнями
регресійного аналізу
є встановлення форм залежності між
змінними, оцінка функцій регресії,
оцінка невідомих значень залежної
змінної. В регресійному аналізі
розглядається одностороння залежність
випадкової залежної змінної Y
від
однієї (або декількох) невипадкової
незалежної змінної X,
яка часто називається пояснюючою
змінною.
Вказана залежність Y
від X
може бути представлена також у вигляді
модельного рівняння регресії (6.1). За
рахунок впливу неврахованих випадкових
факторів і причин окремі спостереження
у
будуть у більшій або меншій мірі
відхилятися від функції регресії
В цьому випадку рівняння взаємозв’язку
двох змінних (парна регресійна модель)
може бути представлене в вигляді:
де
- випадкова змінна, яка характеризує
відхилення від функції регресії. Цю
змінну будемо називати збуреною або
просто збуренням.
Розглянемо лінійний
регресійний аналіз,
для якого функція
лінійна відносно оцінюваних параметрів:
(7.1)
Припустимо, що для оцінки параметрів
лінійної функції регресії (7.1)
взято
вибірку, яка містить n
пар значень змінних (
),
де i
= 1,2,
…, n.
В цьому випадку лінійна парна регресійна модель має вигляд:
.
(7.2)
Основні положення регресійного аналізу:
В моделі (7.2) збурення
(або залежна змінна
)
є величина випадкова, а пояснювальна
змінна
– величина
невипадкова.Математичне сподівання збурення рівне нулю:
;
Дисперсія збурення (або залежної змінної ) постійна для довільного i:
.
Збурення і
(або змінні
і
)
не корельовані:
,
.Збурення
(або залежна змінна
)
є нормально розподілена випадкова
величина.
Оцінка
моделі (7.2) по вибірці є рівнянням регресії
=
.
Параметри цього рівняння
і
визначаються на основі методу найменших
квадратів. Вплив неврахованих випадкових
факторів і помилок спостережень в моделі
(7.2) визначається за допомогою дисперсії
збурення (помилок) або залишкової
дисперсії
.
Незміщеною оцінкою цієї дисперсії є
вибіркова залишкова дисперсія
=
,
де
-
групове середнє, знайдена з рівняння
регресії;
=
- вибіркова оцінка збурення
або залишок регресії. В знаменнику
виразу оцінки стоїть число степенів
вільності
n-2,
а не n,
оскільки
два степеня вільності губляться при
визначенні двох параметрів прямої
.
Інтервальна оцінка функції регресії
Побудуємо
довірчий інтервал для функції регресії,
тобто для умовного математичного
сподівання
,
яке із заданою надійністю
накриває невідоме значення
.
Знайдемо дисперсію групового середнього
,
що є вибірковою оцінкою
:
рівняння дисперсії запишемо у вигляді:
.
(7.3)
На
рис. 7.1 лінія регресії зображена графічно.
Для довільного значення
,
що спостерігається, виділені його
складові: середнє
,
приріст
,
що утворюють значення
і збурення
.
Рис. 7.1
Дисперсія
групового середнього дорівнює сумі
дисперсій двох незалежних доданків:
.
Дисперсія
вибіркового середнього
:
.
Для знаходження дисперсії
представимо коефіцієнт регресії у
вигляді:
.
Тоді
Знайдемо
оцінку дисперсії групових середніх,
замінюючи
її груповою оцінкою
:
.
Виходячи з того, що статистика
має
розподіл Стьюдента із
степенями вільності, можна побудувати
довірчий інтервал для умовного
математичного сподівання
,
де
-
стандартна помилка групового середнього
.
Екстраполяція
кривої регресії, тобто її використання
поза границями знайденого діапазону
значень пояснюючої змінної може привести
до значних похибок. При визначені
довірчого інтервалу для деякого
індивідуального значення
необхідно враховувати ще і розсіювання
навкруги лінії регресії: оцінка дисперсії
індивідуального значення
при
дорівнює
,
а відповідний довірчий інтервал для
прогнозування індивідуальних значень
буде визначатися за формулою
.
◄Приклад 7.1 Маємо данні про видобуток вугілля на одного робітника Y (т) і потужності шару Х (м), що характеризують процес видобування вугілля в 10 шахтах (табл. 7.1).
Таблиця 7.1
і |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
8 |
11 |
12 |
9 |
8 |
8 |
9 |
9 |
8 |
12 |
|
5 |
10 |
10 |
7 |
5 |
6 |
6 |
5 |
6 |
8 |
Оцінити середній видобуток вугілля на одного робітника для шахт із потужністю шару 8 м. Знайти 95%-вий довірчий інтервал для індивідуального і середнього значень видобутку вугілля на 1 робітника для таких шахт.
Розв’язання.
Складемо рівняння регресії:
,
,
,
,
,
рівняння
,
тобто при збільшенні потужності шару
Х
на 1м видобуток вугілля на одного
робітника Y
збільшується в середньому на 1,016 т.
Потрібно
оцінити умовне математичне сподівання
.
Вибірковою оцінкою
є групове середнє
,
яке знайдемо за рівнянням регресії:
.
Для
побудови довірчого інтервалу для
необхідно знайти дисперсію його оцінки
.
Складемо допоміжну таблицю 7.2, враховую-чи
те, що
,
а значення
визначаються
за отриманим рівнянням регресії.
Таблиця 7.2
|
8 |
11 |
12 |
9 |
8 |
8 |
9 |
9 |
8 |
12 |
|
|
1,96 |
2,56 |
6,76 |
0,16 |
1,96 |
1,96 |
0,16 |
0,16 |
1,96 |
6,76 |
24,4 |
|
5,38 |
8,43 |
9,44 |
6,39 |
5,38 |
5,38 |
6,39 |
6,39 |
5,38 |
9,44 |
- |
|
0,14 |
2,48 |
0,31 |
0,37 |
0,14 |
0,39 |
0,15 |
1,94 |
0,39 |
2,08 |
8,39 |
Отже,
,
,
.
За таблицею значень
критерію
Стьюдента
.
Шуканий довірчий інтервал
або
(т).
Отже, середній видобуток вугілля на одного робітника для потужності шару 8 м з надійністю 0,95 знаходиться в межах від 4,38 до 6,38 т.
Щоб
побудувати довірчий інтервал для
індивідуального значення
,
знайдемо дисперсію його оцінки
і
(т).
Шуканий
довірчий інтервал
і
.
Отже, індивідуальний видобуток вугілля
на одного робітника для шахт із потужністю
шару 8 м із надійністю 0,95 знаходиться в
межах від 2,81 до 7,95 т.►
