- •6 .1. Регресія на змішаних факторних множинах
- •6.2. Адаптація регресійної моделі до неоднорідної сукупності
- •6.3. Регресія на групуваннях
- •Визначальними виявляються параметри: μ, а1, а2, b1, (ab)11 та (ab)21. Це мінімальна їх кількість, і модель з цими параметрами записується так:
- •6.4. Модель стандартизованих групувань
- •Завдання для самоконтролю
6.2. Адаптація регресійної моделі до неоднорідної сукупності
За допомогою структурних змінних можна адаптувати регресійну модель до неоднорідної сукупності. Якщо неоднорідність проявляється розшаруванням сукупності на р ізольованих класів (груп), то кожен клас розглядається як градація номінальної ознаки і тим одиницям, що належать до j-го класу, приписується структурна змінна uj = 1, а тим, що не належать, — uj= 0. Параметри при структурних змінних класів інтерпретуються так само, як і при градаціях текстових ознак.
Специфіка моделювання процесів у неоднорідній сукупності зумовлена своєрідністю внутрішньокласової варіації і характером взаємозв’язків. Ефекти впливу одного й того ж фактора хі на у по класах можуть істотно різнитися. Наприклад, у вугільній промисловості виділяються класи шахт за гірничо-геологічними умовами: потужністю та нахилом залягання пластів, їх газоносністю, глибиною розробки лав тощо. Кожному типу цих природних умов відповідають певна технологічна схема і певний рівень механізації виробничих процесів. Вплив механізації на трудомісткість, скажімо, очисних робіт залежить від класу шахти. Залежність сили впливу одного фактора від рівня іншого називається взаємодією. В неоднорідних сукупностях йдеться про взаємодію факторів і специфічних умов окремих класів. Для цього використовують змінні взаємодії хіuj, значення яких дорівнює добутку значень відповідних ознак.
Отже, при моделюванні взаємозв’язків у неоднорідних сукупностях ознакова множина моделі включає, окрім факторних ознак хі, два типи інструментальних змінних: структурні змінні uj, які відображують особливості класів, і змінні взаємодії хі uj, що характеризують особливості взаємозв’язків в окремих класах. За рахунок цих змінних модель регресійного аналізу розширюється:
.
Зміст параметрів моделі: bi — чистий ефект впливу і-го фактора в середньому по сукупності;
aj — відхилення середнього значення показника-функції в j-му класі від середнього його рівня в класі, взятому за базу порівняння;
сij — відхилення ефекту впливу і-го фактора в j-му класі від середнього по сукупності.
Істотність параметрів aj та сij свідчить про неоднорідність сукупності.
Модель такого типу Е. Маленво назвав коваріаційною. В ній поєднуються регресія на факторних ознаках метричної шкали і модель дисперсійного аналізу міжкласових відмінностей. Вона уможливлює одночасну оцінку декількох рівнянь, і така оцінка може бути точнішою, ніж оцінки покласових регресій.
Як приклад розглянемо модель продуктивності праці робітників очисних вибоїв за даними 21 шахти, з-поміж яких за гірничо-геологічними умовами 12 належать до першого класу (пологі пласти), дев’ять — до другого класу (крутопадаючі пласти). Акцентуючи увагу на особливостях коваріаційної моделі, обмежимося одним фактором — швидкістю просування лави. Первинні дані наведено в табл. 6.4.
Таблиця 6.4
Перший клас (u1 = 1) |
Другий клас (u1 = 0) |
||||
Номер шахти |
Швидкість просування лави, м/міс. |
Продуктивність праці, т/місяць |
Номер шахти |
Швидкість просування лави, м/міс. |
Продуктивність праці, т/міс. |
1 |
46 |
139 |
1 |
36 |
129 |
2 |
64 |
183 |
2 |
28 |
104 |
3 |
48 |
165 |
3 |
43 |
132 |
4 |
62 |
175 |
4 |
25 |
106 |
5 |
41 |
147 |
5 |
30 |
128 |
6 |
76 |
192 |
6 |
32 |
98 |
7 |
57 |
149 |
7 |
21 |
83 |
8 |
65 |
158 |
8 |
17 |
76 |
9 |
87 |
190 |
9 |
29 |
117 |
10 |
80 |
175 |
|
|
|
11 |
48 |
153 |
|
|
|
12 |
82 |
198 |
|
|
|
Модель має вигляд: Y = a0 + b1 x1 + a1 u1 + c11 x1 u1. Параметри її наведено в табл. 6.5. Коефіцієнт детермінації показує, що 92,1% варіації продуктивності праці робітників очисних вибоїв (VAR1) пояснюється класом шахт (VAR3) і швидкістю просування лави (VAR2). Адекватність моделі підтверджується значеннями F-критерію та p-level, істотність впливу факторів — характеристиками t-критерію. На шахтах з пологими пластами (клас 1) середня місячна продуктивність праці в очисних вибоях на 57,5 т вища, ніж на шахтах, що мають крутопадаючі пласти (клас 2). Зі збільшенням швидкості просування лави на 1 м продуктивність праці зростає в середньому на 2,23 т, на шахтах першого класу ефект впливу цього фактора на 1,15 т менший за середній.
Теоретичний рівень продуктивності праці визначається так:
для шахт першого класу Y = (43,525 + 57,5) + (2,227 – 1,153) x1,
для шахт другого класу Y = 43,525 + 2,227 x1.
Таблиця 6.5
Regression Summary for Dependent Variable: VAR1 |
||||||
R= ,96 RІ= ,921 Adjusted RІ= ,907 F(3,17)=66,4 p<,000 Std.Error of estimate: 11,05 |
||||||
N = 21 |
BETA |
St. Err. of BETA |
B |
St. Err. of B |
t(17) |
p-level |
Intercpt |
|
|
43,525 |
15,078 |
2,89 |
0,010 |
VAR2 |
1,31 |
0,296 |
2,227 |
0,504 |
4,42 |
0,000 |
VAR3 |
0,80 |
0,286 |
57,500 |
20,484 |
2,81 |
0,012 |
VAR4 |
–1,08 |
0,512 |
–1,153 |
0,548 |
–2,11 |
0,050 |
Аналогічно здійснюється модельна специфікація за наявнос- ті трьох і більше класів. Наприклад, ознакова множина моделі включає дві факторні ознаки (х1, х2) та дві структурні змінні (u1, u2):
Структурні змінні |
Специфікація моделі |
|
u1 |
u2 |
|
0 |
0 |
Y = a0 + b1 x1 + b2 x2 |
1 |
0 |
Y = (a0 + a1) + (b1+ c11 ) x1 + b2 x2 |
0 |
1 |
Y = (a0 + a2) + b1 x1 + (b2+ c22) x2 |
1 |
1 |
Y = (a0 + a1 + a2) + (b1+ c11 ) x1 + (b2+ c22) x2 |
За допомогою структурних змінних можна врахувати в моделі нетиповість певної групи одиниць, які класифікуються як аномальні. Належним до такої групи елементам сукупності приписується uj = 1.
Якісна однорідність є однією з умов моделювання динаміки. Вона виявляється неперервністю ряду, сталістю тенденції розвитку. Проте в рядах соціально-економічних показників ця умова часом порушується; спостерігаються розриви однорідності рядів через зміни в причинному комплексі формування тенденцій. Скажімо, зміна форми власності, фінансова криза, несприятливі погодні умови тощо. Тоді ряд динаміки в точці розриву tр поділяється на інтервали за допомогою структурної змінної ut. У першому інтервалі (до точки розриву) змінній ut, яка вводиться в трендову модель лінійно, приписується значення «0». У другому інтервалі (після змін) ut = 1, 2,…, m, де m — довжина інтервалу. Значення змінної часу t, навпаки, у першому інтервалі зростають, у другому фіксуються на рівні tр.
Наприклад, у ряду динаміки yt, де t = 1, …, 5, зміни відбулися при t = 3. Файл первинних даних можна сформувати так:
yt |
y1 |
y2 |
y3 |
y4 |
y5 |
t |
1 |
2 |
3 |
3 |
3 |
ut |
0 |
0 |
1 |
2 |
3 |
Трендова модель має вигляд:
Y = a + bt + сut.
Параметри при змінній часу b і структурній змінній с характеризують абсолютну швидкість динаміки відповідно до і після змін.
Якщо в межах динамічного ряду зафіксовано два і більше зрушень, то відповідно збільшується кількість введених у модель структурних змінних.