
- •Варианты индивидуальных заданий
- •Вариант 4
- •2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
- •3. Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
- •4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
- •Вариант 4
- •5 Временные ряды
- •Тестовые задания Парная регрессия и корреляция
- •Множественная регрессия и корреляция
- •Временные ряды
Вариант 4
Номер предприятия |
|
|
|
Номер предприятия |
|
|
|
1 |
7 |
3,5 |
9 |
11 |
10 |
6,3 |
22 |
2 |
7 |
3,6 |
10 |
12 |
10 |
6,5 |
22 |
3 |
7 |
3,9 |
12 |
13 |
11 |
7,2 |
24 |
4 |
7 |
4,1 |
17 |
14 |
12 |
7,5 |
25 |
5 |
8 |
4,2 |
18 |
15 |
12 |
7,9 |
27 |
6 |
8 |
4,5 |
19 |
16 |
13 |
8,2 |
30 |
7 |
9 |
5,3 |
19 |
17 |
13 |
8,4 |
31 |
8 |
9 |
5,5 |
20 |
18 |
14 |
8,6 |
33 |
9 |
10 |
5,6 |
21 |
19 |
14 |
9,5 |
35 |
10 |
10 |
6,1 |
21 |
20 |
15 |
9,6 |
36 |
№ |
y |
x1 |
x2 |
yx1 |
yx2 |
x1x2 |
x1^2 |
x2^2 |
y^2 |
1 |
7 |
3,5 |
9 |
24,5 |
63 |
31,5 |
12,25 |
81 |
49 |
2 |
7 |
3,6 |
10 |
25,2 |
70 |
36 |
12,96 |
100 |
49 |
3 |
7 |
3,9 |
12 |
27,3 |
84 |
46,8 |
15,21 |
144 |
49 |
4 |
7 |
4,1 |
17 |
28,7 |
119 |
69,7 |
16,81 |
289 |
49 |
5 |
8 |
4,2 |
18 |
33,6 |
144 |
75,6 |
17,64 |
324 |
64 |
6 |
8 |
4,5 |
19 |
36 |
152 |
85,5 |
20,25 |
361 |
64 |
7 |
9 |
5,3 |
19 |
47,7 |
171 |
100,7 |
28,09 |
361 |
81 |
8 |
9 |
5,5 |
20 |
49,5 |
180 |
110 |
30,25 |
400 |
81 |
9 |
10 |
5,6 |
21 |
56 |
210 |
117,6 |
31,36 |
441 |
100 |
10 |
10 |
6,1 |
21 |
61 |
210 |
128,1 |
37,21 |
441 |
100 |
11 |
10 |
6,3 |
22 |
63 |
220 |
138,6 |
39,69 |
484 |
100 |
12 |
10 |
6,5 |
22 |
65 |
220 |
143 |
42,25 |
484 |
100 |
13 |
11 |
7,2 |
24 |
79,2 |
264 |
172,8 |
51,84 |
576 |
121 |
14 |
12 |
7,5 |
25 |
90 |
300 |
187,5 |
56,25 |
625 |
144 |
15 |
12 |
7,9 |
27 |
94,8 |
324 |
213,3 |
62,41 |
729 |
144 |
16 |
13 |
8,2 |
30 |
106,6 |
390 |
246 |
67,24 |
900 |
169 |
17 |
13 |
8,4 |
31 |
109,2 |
403 |
260,4 |
70,56 |
961 |
169 |
18 |
14 |
8,6 |
33 |
120,4 |
462 |
283,8 |
73,96 |
1089 |
196 |
19 |
14 |
9,5 |
35 |
133 |
490 |
332,5 |
90,25 |
1225 |
196 |
20 |
15 |
9,6 |
36 |
144 |
540 |
345,6 |
92,16 |
1296 |
225 |
сумма |
206 |
126 |
451 |
1394,7 |
5016 |
3125 |
868,64 |
11311 |
2250 |
средн зн |
10,3 |
6,3 |
22,55 |
69,735 |
250,8 |
156,25 |
43,432 |
565,55 |
112,5 |
Найдем средние квадратические отклонения признаков:
Qy=
-
=
=2.531
Qx1=
-
=
6,3^2=1,934
Qx2=
-
=
=7,552
Вычисление параметров линейного уравнения множественной регрессии.
Для нахождения параметров линейного уравнения множественной регрессии
необходимо
решить следующую систему линейных
уравнений относительно неизвестных
параметров
,
,
:
либо воспользоваться готовыми формулами:
;
;
.
Рассчитаем сначала парные коэффициенты корреляции:
cov(y;x1)=
-
*
=69,735-10,3*6,3=4,845
cov(y;x2)=
-
*
=250,8-10,3*22,55=18,535
cov(x1;x2)=
-
*
=156,25-6,3*22,55=14,185
=
=
=0,989
=
=0,969
=
=0,971
Находим
=
*
=1,308*
=1,101
=
*
=0,335*
=0,047
=10,3-1,101*6,3-0,047*22,55=10,3-6,936-1,059=2,305
Таким образом, получили следующее уравнение множественной регрессии:
Yшл=2,305+1,101*x1+b2*x2
Коэффициенты
и
стандартизованного уравнения регрессии
находятся по формулам:
B1=b1
=1,101*
=0,841
B2=b2
=0,047*
=0,140
Т.е. уравнение будет выглядеть следующим образом:
tшлY=0,841*
+0,140*
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
.
Вычисляем:
=1,101*
=0,67
=0,047*
=0,10
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,67% или 0,10% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора .
Коэффициенты парной корреляции мы уже нашли:
=0,989
0,969
0,971
Они
указывают на весьма сильную связь
каждого фактора с результатом, а также
высокую межфакторную зависимость
(факторы
и
явно коллинеарны, т.к
0,971>0,7
). При такой сильной межфакторной
зависимости рекомендуется один из
факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
=
=
=3,42
=
=
=0,258
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции определить через матрицу парных коэффициентов корреляции:
,
где
– определитель матрицы парных коэффициентов корреляции;
– определитель матрицы межфакторной корреляции.
=
=1
=
=0,057
Коэффициент множественной корреляции
=
=
0,996
Нескорректированный коэффициент множественной детерминации
=0,988 оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 98,8% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
=
1 – (1-
)
=1
– ( 1 – 0,988)
=0,987
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 98% ) детерминированность результата в модели факторами и .
Оценку
надежности уравнения регрессии в целом
и показателя тесноты связи
дает
-критерий
Фишера:
.
В нашем случае фактическое значение -критерия Фишера:
=
*
=645,34
Получили,
что
>
(при
),
т.е. вероятность случайно получить такое
значение
-критерия
не превышает допустимый уровень
значимости
.
Следовательно, полученное значение не
случайно, оно сформировалось под влиянием
существенных факторов, т.е. подтверждается
статистическая значимость всего
уравнения и показателя тесноты связи
.
С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:
;
.
Найдем
и
=0,989^2=0,978
=0,969^2=0,938
Имеем
=
*
=19,295
=
*
=1,368
Получили,
что
.
Следовательно, включение в модель
фактора
после того, как в модель включен фактор
статистически нецелесообразно: прирост
факторной дисперсии за счет дополнительного
признака
оказывается незначительным, несущественным;
фактор
включать в уравнение после фактора
не следует.
Если
поменять первоначальный порядок
включения факторов в модель и рассмотреть
вариант включения
после
,
то результат расчета частного
-критерия
для
будет иным.
,
т.е. вероятность его случайного
формирования меньше принятого стандарта
.
Следовательно, значение частного
-критерия
для дополнительно включенного фактора
не случайно, является статистически
значимым, надежным, достоверным: прирост
факторной дисперсии за счет дополнительного
фактора
является существенным. Фактор
должен присутствовать в уравнении, в
том числе в варианте, когда он дополнительно
включается после фактора
.
Общий вывод состоит в том, что множественная модель с факторами и с =0,988 содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:
=0,978