1)Параметры уравнения найдем путем составления и решения системы нормальных уравнений способом наименьших квадратов:
Параметры уравнения парной линейной регрессии удобно исчислять по следующим формулам:
Осуществим проверку значимости уравнения с помощью критерия F-критерия Фишера.
Если вычисленное значение F –отношения - F факт при заданном уровне значимости α больше критического (табличного) F табл , т.е.
F факт > F табл
то признаётся статистическая значимость уравнения регрессии, т.е. связь между рассматриваемыми признаками есть и результаты наблюдений не противоречат предположению о её линейности.
Если F факт < F табл, то уравнение регрессии считается статистически незначимым.
Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа.
Дисперсионный анализ результатов регрессии
Источники вариации |
Число степеней свободы |
Сумма квадратов отклонений |
Дисперсия на одну степень свободы |
F - отношение |
|
фактиче- ское |
таблич- ное
|
||||
Факторная |
1 |
|
|
|
|
Остаточная |
n– 2 |
|
|
F табл = F(α;1,n-2) |
|
Общая
|
n– 1 |
|
|
|
Используя Excel осуществим дисперсионный анализ:
уравнение значимо.
Используя критерий Стьюдента оценим статистическую значимость коэффициентов регрессии.
По таблице Стьюдента находим tкрит = 2,11.
Для коэффициента регрессии а0
, где
- остаточная дисперсия уравнения регрессии;
n – численность выборки;
m – число переменных в выборке;
Получаем:
tнаб <tкрит , следовательно, коэффициент регрессии незначим.
Для коэффициента регрессии а1
Получаем:
tнаб <tкрит , следовательно, коэффициент регрессии незначим.
2) показывает, что с изменением х (соотношение мужчин и женщин) на одну единицу Y (смертность) в среднем измениться на 4,3%. Связь между ними прямая.
Определим коэффициент парной корреляции по формуле:
, где
, , , ,
Рассчитываем парный коэффициент корреляции:
Коэффициент эластичности:
Изобразим на графике теоретическую линию регрессии
4) Сопоставляя результаты аналитической группировки и корреляционно регрессионного анализа видим слабую зависимость между признаком х (соотношение мужчин и женщин) и у (смертность).
Вывод: Модель построенной регрессии , оказалась значимой в целом и незначимы отдельные коэффициенты. Коэффициент корреляции показывает слабую связь между х и у, коэффициент эластичности показывает что при изменение соотношения мужчин и женщин на 1% смертность изменится на 0,46%.
Задача № 7
Определите тесноту связи между средней месячной номинальной начисленной заработной платой работников крупных и средних организаций городов Оренбургской области в 2006 г. и объемом платных услуг на душу населения с помощью коэффициента Спирмэна. Сделайте выводы.
Города области |
Среднемесячная номинальная заработная плата, р. |
Объем платных услуг на душу населения, р. |
Города области |
Среднемесячная номинальная заработная плата, р. |
Объем платных услуг на душу населения, р. |
Абдулино |
7007 |
7644,5 |
Новотроицк |
9355 |
10059,1 |
Бугуруслан |
7831 |
8999,1 |
Оренбург |
10245 |
15063,1 |
Бузулук |
10482 |
11842 |
Орск |
8494 |
9408,1 |
Гай |
9612 |
10491,9 |
Соль-Илецк |
6941 |
10230,9 |
Кувандык |
5800 |
10673,2 |
Сорочинск |
7213 |
11075,4 |
Медногорск |
7521 |
7717 |
Ясный |
7917 |
10942,2 |