Лабораторная работа 12
.pdfСледует отметить, что корреляционное отношение несимметрично, гипотеза о наличии криволинейной корреляционной связи проверяется и по ηx y .
Для вычисления корреляционного отношения значимость уравнения регрессии не важна, поэтому если коэффициент линейной корреляции статистически не значим, коэффициенты уравнения парной линейной регрессии можно определить просто при помощи функций НАКЛОН (коэффициент а) и ОТРЕЗОК (коэффициент b).
Пример 2. Провести регрессионный анализ влияния содержания Pb на содержание Au (табл.1), построив уравнения линейной и квадратичной корреляции, проверив их значимость и сравнить их эффективность.
Решение. Скопируем данные на новый лист Excel. Выделим массив E2:F6 и введем формулу =ЛИНЕЙН(C2:C55;B2:B55;1;1), завершив ввод нажатием CTRL+SHIFT+ENTER.
В ячейке Е4 содержится коэффициент детерминации. Его значение крайне низко, что не позволяет использовать полученное уравнение регрессии для прогнозирования. Низкое значение F-статистики, в свою очередь, указывает на незначимость уравнения регрессии. Впрочем, это неудивительно, поскольку отсутствие линейной корреляции нами уже было доказано в примере 5.1.
Попробуем построить уравнение квадратичной регрессии. Для этого в столбце А вычислим квадраты данных столбца В и в массиве E9:G13 применим функцию ЛИНЕЙН
13
Коэффициент детерминации повысился, хотя остался довольно низким, а значение F- статистики выросло довольно значительно. Проверим значимость полученного уравнения, вычислив критическое значение в ячейке Н12:
Как видим, значение F-статистики выше критического при уровне значимости 0,05, так что полученное уравнение
(Au)=-0,23126(Pb)+1,138285(Pb2)+0,848124
статистически значимо с доверительной вероятностью 0,95.
14
Решение задач корреляционно-регрессионного анализа полезно визуализировать, строя точечные диаграммы. Сделаем это для нашего примера: выделим два столбца исходных данных и выберем на вкладке «Вставка»: «график»-«все типы диаграмм»-«точечная»:
Как видим, поле точек в целом слишком широко и визуально не прослеживается даже криволинейная корреляция. Но также можно заметить, что оно как бы распадается на две части – более узкое поле для бедных по Холестерину анализов (<2,5) явно даст значимую линейную корреляцию. В целях наиболее полного решения задачи следует поэтому выделить из всех данных выборку бедных по Холестерину анализов и провести корреляционнорегрессионный анализ для нее.
Однако вернемся пока к построенной диаграмме. На ней Excel позволяет построить линию регрессии выбранного типа (линейную, полиномиальную, степенную, логарифмическую, экспоненциальную). Для этого следует подвести курсор к одной из точек поля, нажать левую клавишу мыши и выбрать опцию «добавить линию тренда». Можно даже при этом поместить на диаграмму коэффициент детерминации (аппроксимации) этой линии регрессии:
15
Построим на диаграмме обе линии регрессии (линейной и квадратичной):
Задание 1. Построить другие полиномиальные уравнения регрессии для примера 2. и выбрать наилучшее с точки зрения значимости и точности.
Задание 2. Выбрать данные бедных по Холестерину анализов и провести для них регрессионный анализ.
Задание 3.Провести регрессионный анализ влияния долевого распределения способов производства стали на на экологическую ситуацию по удельным выбросам СО2 на основании данных по России за 1997-2007 гг, приведенные в таблице. Для этого:
1)рассчитать долевое распределение способов производства и удельные выбросы
2)при помощи функции ЛИНЕЙН провести полный регрессионный анализ для линейной регрессии
3)сделать прогноз о количестве выбросов в 2008 году
Табл.5.3. Производство стали и выбросы СО2 в России
16
|
1997 |
1998 |
1999 |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
2006 |
2007 |
2008 |
Производство стали - |
48 502 |
43 822 |
51 510 |
59 136 |
58 970 |
59 777 |
61 450 |
65 583 |
66 146 |
70 830 |
72 387 |
68 510 |
Всего |
|
|
|
|
|
|
|
|
|
|
|
|
Производство стали - |
26 652 |
26 103 |
30 327 |
34 300 |
34 589 |
36 725 |
38 500 |
40 373 |
40 750 |
41 686 |
41 209 |
38 907 |
Кислородный |
||||||||||||
конвертер |
|
|
|
|
|
|
|
|
|
|
|
|
Производство стали - |
6 215 |
5 531 |
6 603 |
8 610 |
8 847 |
8 900 |
9 350 |
10 690 |
10 800 |
16 269 |
19 291 |
20 000 |
Электродуговые печи |
||||||||||||
Производство стали - |
15 750 |
12 190 |
14 580 |
16 170 |
15 534 |
14 152 |
13 600 |
14 520 |
14 600 |
12 875 |
11 887 |
11 627 |
Мартеновские печи |
|
|
|
|
|
|
|
|
|
|
|
|
Выбросы СО2– |
94 512 |
85 430 |
98 095 |
114 205 |
117 599 |
120 498 |
119 888 |
124 799 |
131 418 |
133 978 |
134 472 |
|
Черная металлургия |
|
17