1.2.Множественная регрессия
Задание: Исследуется зависимость урожайности y зерновых культур ( ц/га ) от ряда факторов (переменных) сельскохозяйственного производства, а именно,
х1 - число тракторов на 100 га;
х2 - число зерноуборочных комбайнов на 100 га;
х3 - число орудий поверхностной обработки почвы на 100 га;
х4 - количество удобрений, расходуемых на гектар (т/га);
х5 - количество химических средств защиты растений, расходуемых на гектар (ц/га).
Исходные данные для 20 районов области приведены в табл. 2.
Таблица 2
|
y |
x1 |
x 2 |
x 3 |
x 4 |
x 5 |
1 |
9.7 |
1.59 |
.26 |
2.05 |
.32 |
.14 |
2 |
8.4 |
.34 |
.28 |
.46 |
.59 |
.66 |
3 |
9.0 |
2.53 |
.31 |
2.46 |
.30 |
.31 |
4 |
9.9 |
4.63 |
.40 |
6.44 |
.43 |
.59 |
5 |
9.6 |
2.16 |
.26 |
2.16 |
.39 |
.16 |
6 |
8.6 |
2.16 |
.30 |
2.69 |
.32 |
.17 |
7 |
12.5 |
.68 |
.29 |
.73 |
.42 |
.23 |
8 |
7.6 |
.35 |
.26 |
.42 |
.21 |
.08 |
9 |
6.9 |
.52 |
.24 |
.49 |
.20 |
.08 |
10 |
13.5 |
3.42 |
.31 |
3.02 |
1.37 |
.73 |
11 |
9.7 |
1.78 |
.30 |
3.19 |
.73 |
.17 |
12 |
10.7 |
2.40 |
.32 |
3.30 |
.25 |
.14 |
13 |
12.1 |
9.36 |
.40 |
11.51 |
.39 |
.38 |
14 |
9.7 |
1.72 |
.28 |
2.26 |
.82 |
.17 |
15 |
7.0 |
.59 |
.29 |
.60 |
.13 |
.35 |
16 |
7.2 |
.28 |
.26 |
.30 |
.09 |
.15 |
17 |
8.2 |
1.64 |
.29 |
1.44 |
.20 |
.08 |
18 |
8.4 |
.09 |
.22 |
.05 |
.43 |
.20 |
19 |
13.1 |
.08 |
.25 |
.03 |
.73 |
.20 |
20 |
8.7 |
1.36 |
.26 |
.17 |
.99 |
.42 |
Выполнение:
Рис7. Диаграмма рассеяния зависимости урожайности от числа тракторов на 100 га (x1)
Рис7. Диаграмма рассеяния зависимости урожайности от числа зерноуборочных комбайнов на 100 га (x2)
Рис8. Диаграмма рассеяния зависимости урожайности от числа орудий поверхностной обработки почвы на 100 га (x3)
Рис9. Диаграмма рассеяния зависимости урожайности от количества удобрений, расходуемых на гектар (т/га) (x4)
Рис10. Диаграмма рассеяния зависимости урожайности от количества химических средств защиты растений, расходуемых на гектар (ц/га) (т/га) (x5)
Рис11. Регрессионный анализ
Рис12. Матрица парных корреляций для всех факторов
Рис13. Матрица парных корреляций для всех факторов и зависимости урожайности
Рис14. Регрессионный анализ с х4.
Рис15. Регрессионный анализ с x4, x1
Рис16. Регрессионный анализ с x4, x2
Рис17. Регрессионный анализ с x4, x3
Рис18. Регрессионный анализ с x4, x5
Рис19. Регрессионный анализ с x4, x3, x1
Рис20. Регрессионный анализ с x4, x3, x2
Рис21. Регрессионный анализ с x4, x3, x5
Вывод: Проанализировав
регрессионный анализ, получаем оценку
(x)
неизвестной функции регрессии f
(x)
в данном случае:
(x) = 3.51 0.06 x1 + 15.5 x2 + 0.11 x3 + 4.47 x4 2.93 x5
Так же наблюдаем, что стандартные ошибки в оценке всех коэффициентов, кроме 4 , превышают значения самих коэффициентов, что говорит о статистической ненадежности данных коэффициентов. Из рис11. также выявляем p-level -уровень значимости отклонения этой гипотезы; достаточно малым (0.01) этот уровень является только для коэффициента при x4 . Только переменная x4 - количество удобрений, подтвердила свое право на включение в модель. Продолжаем проверку гипотезы об отсутствии какой бы то ни было линейной связи между y и (х1 , ..., х5). Из матрицы парных корреляций (рис13.) видно, что х1 , х2 и х3 (оснащенность техникой) сильно коррелированы (парные коэффициенты корреляции 0.854, 0.882 и 0.978), т.е. имеет место дублирование информации, и потому, по-видимому, есть возможность перехода от исходного числа признаков (переменных) к меньшему. Из матрицы корреляций находим:
r2
(y,
xj)
= r2
(y,
x4)
= (0.577)2
= 0.333
Из регрессионных анализов всевозможных пар (рис15 –рис18) наиболее информативной парой является (х4 , х3 ), которая дает:
(2) =
(х4
, хj)
= 0.421
Получаем оценку уравнения регрессии урожайности по факторам х3 и х4 имеет вид: (х3 , х4) = 7.29 + 0.28 х3 + 3.47 х4
Так же из регрессионных анализов всевозможных троек выбираем наиболее информативную: (х4 , х3 ,х5), которая дает (3) = 0.404,
что меньше, чем (2) = 0.421; это означает, что третью переменную в модель включать нецелесообразно, т.к. она не повышает значение (более того, уменьшает). Итак, результатом анализа является (2).
