
- •Решение и анализ
- •3) Коэффициент вариации
- •10) Доверительные интервалы для статистически значимых параметров модели.
- •11) Оценка точности прогноза, ошибка прогноза и его доверительный интервал.
- •Расчеты, выполненные для степенной модели.
- •Постановка задачи
- •Решение и анализ
- •Шкала атрибутивных оценок тесноты корреляционной зависимости
Решение и анализ
Корреляционная зависимость между фактором х (среднедушевым прожиточным минимумом в день одного трудоспособного) и результирующим признаком у (среднедневной заработной платой). Параметры уравнения линейной регрессии, экономическая интерпретация коэффициента регрессии.
y=f(x)+E ,yт=f(x) – теоретическая функция, Е=у- yт
yт=a+bx
– корреляционная
зависимость среднедневной заработной
платы (у) от среднедушевого прожиточного
минимума в день одного трудоспособного
(х)
a+b=
a+b
=
b=
- коэффициент регрессии.
Он показывает, на сколько единиц в среднем изменяется средняя заработная плата (У) при увеличении среднедушевого прожиточного минимума в день одного трудоспособного (Х) на 1 единицу.
b==
0,937837482
Это означает, что при увеличении среднедушевого прожиточного минимума в день одного трудоспособного (х) на 1 единицу, среднедневная заработная плата увеличится в среднем на 0,937 единиц.
a=-b
,
a=135,4166667-0,937837482•86,75=54,05926511
3) Коэффициент вариации
Коэффициент вариации показывает, какую долю среднего значения СВ составляет её средний разброс.
υх = δх/x = 0,144982838, υy = δy/y = 0,105751299
4) Коэффициент корреляции
Коэффициент корреляции используется для оценки тесноты линейной связи между среднедушевым прожиточным минимумом в день одного трудоспособного и среднедневной заработной платой.
rxy = b• δх/δy = 0,823674909 т.к. rxy ˃0 , то корреляционная связь между переменными называется прямой
Всё это показывает зависимость среднедневной заработной платы от среднедушевого прожиточного минимума в день одного трудоспособного.
5) Коэффициент детерминации
Коэффициент детерминации используется для оценки качества подбора уравнений линейной регрессии.
Коэффициент детерминации характеризует долю дисперсии результативного признака У (среднедневной заработной платы), объясняемую регрессией в общей дисперсии результативного признака.
R2xy = ( ∑(yт - yср)2 ) / ( ∑(y - yср)2 ) = 0,678440355, 0,5 < R2 < 0,7 ,
значит сила связи заметная, близка к высокой, и уравнение регрессии хорошо подобрано.
6) Оценка точности модели, или оценка аппроксимации.
=1/n
•∑ ׀(yi-
yт)/yi
׀
•100%
- средняя ошибка аппроксимации.
Ошибка менее 5-7% свидетельствует о хорошем подборе модели.
При ошибке более 10% следует подумать о выборе другого типа уравнения модели.
Ошибка
аппроксимации
=0,015379395•100%=1,53%
, что свидетельствует о хорошем подборе
модели к исходным данным
7) Схема дисперсионного анализа.
∑(y - yср)2=∑(yт - yср)2+∑(yi- yт)2 n – число наблюдений, m – число параметров при переменной х
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
Общая |
∑(y - yср)2 |
n-1 |
S2общ=(∑(y - yср)2)/(n-1) |
Факторная |
∑(yт - yср)2 |
m=1 |
S2факт=(∑(yт - yср)2)/m |
Остаточная |
∑(yi- yт)2 |
n-m-1 |
S2ост=(∑(yi- yт)2)/ ( n-m-1) |
Дисперсионный анализ | |||
Компоненты |
Сумма квадратов |
Число степени свободы |
Дисперсия |
общая |
2460,916667 |
11 |
223,719697 |
факторная |
1669,585177 |
1 |
1669,585177 |
остаточная |
791,3314895 |
10 |
79,13314895 |
8) Проверка адекватности модели по F-критерию Фишера (α=0,05).
Оценка статистической значимости уравнения регрессии в целом осуществляется с помощью F-критерия Фишера.
H0 – гипотеза о статистической значимости уравнения регрессии.
H1 – статистическая значимость уравнения регрессии.
Fрасчетное определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.
Fрасч = S2факт / S2ост = ((∑(yт - yср)2)/m) / ((∑(yi- yт)2)/ ( n-m-1)) =1669,585177 / 79,13314895 = 21,09842966
Fтабличное - максимально возможное значение критерия, которое могло сформироваться под влиянием случайных факторов при данных степенях свободы, т.е. К1 = m, К2 = n-m-1, и уровне значимости α (α=0,05)
Fтабл (0,05; 1; n-2) , Fтабл (0,05; 1; 10), Fтабл = 4,964602701
Если Fтабл < Fрасч , то гипотеза H0 о случайной природе оцениваемых характеристик отклоняется, и признаётся их статистическая значимость и надёжность уравнения регрессии. В противном случае H0 не отклоняется, и признаётся статистическая незначимость и ненадёжность уравнения регрессии. В нашем случае Fтабл < Fрасч , следовательно признаётся статистическая значимость и надёжность уравнения регрессии.
9) Оценка статистической значимости коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).
Оценка значимости коэфф. регрессии.,t – критерий Student., Проверим статистическую значимость параметра b.
Гипотеза
H0:
b=0,
tb
(расч)= ׀b
׀/
mb,
mb
= Sост
/ (δх•)
, где n
– число наблюдений
mb
= 79,13314895 /
(12,57726123•)
= 0,204174979
tb (расч)= 0,937837482 / 0,204174979 = 4,593302697
tтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы (К=n-2), и уровне значимости α (α=0,05). tтабл = 2,2281, Если t(расч) > tтабл , тогда гипотеза H0 отклоняется, и признаётся значимость параметров уравнения.
В нашем случае tb (расч) > tтабл , следовательно гипотеза H0 отклоняется, и признаётся статистическая значимость параметрa b .
Проверим статистическую значимость параметра a. Гипотеза H0: a=0 tа (расч)= ׀а ׀/ mа
mа
= (Sост
•)/(n•
δх)
, ma
=
(79,13314895•
)/(12•
12,57726123)=
17,89736655, ta
(расч)=
54,05926511 /
17,89736655=3,020515055
ta (расч) > tтабл следовательно гипотеза H0 отклоняется, и признаётся статистическая значимость параметрa a.
Оценка значимости корреляции. Проверим статистическую значимость коэффициента корреляции.
trxy = ׀r׀/mr
mrxy
=
,
mrxy
=
=0,179320842,
trxy
= 0,823674909/
0,179320842 =
4,593302697
tr = tb , tr > tтабл , следовательно признаётся статистическая значимость коэффициента корреляции.