
- •3 Курс группа киэф2 – 0702 (д)
- •1) Основные характеристики выборки
- •2) Линейная парная регрессионная модель
- •3) Коэффициент детерминации
- •5) Оценка статистической значимости коэффициентов регрессии и коэффициента корреляции
- •6) Доверительные интервалы для параметров регрессионной модели 0 и 1
- •7) Оценка качества уравнения регрессии в целом
- •8) Прогнозирование по полученному уравнению регрессии
6) Доверительные интервалы для параметров регрессионной модели 0 и 1
Доверительный
интервал для 0
с надежностью =1–α:
.
Выбрав уровень значимости =0,05,
получаем надежность =0,95.
Все необходимые цифровые значения уже
рассчитаны ранее, тогда
,
откуда получаем
.
Доверительный
интервал для 1
с надежностью =1–α:
.
При выбранной надежности =0,95:
,
откуда
.
Таким образом, с надежностью 95% можно утверждать, что истинное значение параметра 0 для всей генеральной совокупности будет заключено в пределах от 135,958 до 251,9, а истинное значение параметра 1 - расположено в границах от 0,0155 до 0,0565. Следует отметить, что доверительные интервалы не очень широки, но и не узки. А это подтверждает, что количество автомобилей в регионах действительно зависит от среднедушевых доходов, но вместе с тем оказывают существенное влияние и другие факторы, и ими не стоит пренебрегать. Именно потому, что они не учтены в модели, доверительные интервалы получились не узкими, а, значит, точность модели невысока, но вполне приемлема.
7) Оценка качества уравнения регрессии в целом
F-критерий Фишера
Выдвигается
нулевая гипотеза Н0
о статистической незначимости уравнения
регрессии. Альтернативная ей гипотеза
Н1
о
статистической значимости. Чтобы
опровергнуть гипотезу Н0
и подтвердить гипотезу Н1
должно
выполняться неравенство
.
Рассчитаем
наблюдаемое значение F-критерия
(воспользуемся свойством для линейной
парной регрессии):
.
Табличное значение по таблице распределения Фишера на уровне значимости α=0,05 с ν1=1 и ν2=n–2=21–2=19 степенями свободы: Fтабл= FРАСПОБР(α, ν1, ν2) = 4,381.
Наблюдаемое значение F–критерия превышает табличное: 13,292 > 4,381, то есть выполнено неравенство , а значит, гипотеза Н0 о случайной природе полученного уравнения регрессии отклоняется в пользу гипотезы Н1, свидетельствующей в 95% случаев о статистической значимости и существенности зависимости между количеством легковых автомобилей и среднедушевыми доходами. Уравнение по данным регионам можно признать надежным и значимым, доказывающим наличие исследуемой зависимости.
Оценка аппроксимации модели
Потребуется
сделать промежуточные вычисления:
остатки еi
разделим на фактические значения уi,
полученные частные от этих делений
возьмем по модулю
и просуммируем; результаты представлены
в расчетной таблице.
Средние
ошибки аппроксимации:
,
В среднем теоретические (смоделированные) значения количества легковых автомобилей отклоняются от фактических на 17–19%. Подбор модели к фактическим данным можно оценить как не очень точный, но приемлемый, так как средняя ошибка аппроксимации не превышает 20%.
Выводы: Статистически значимые коэффициенты регрессии b0 и b1, коэффициент корреляции rух свидетельствуют о наличии зависимости количества легковых автомобилей от среднедушевого дохода населения в месяц по регионам, это подтверждается и оценкой качества уравнения регрессии по F-критерию Фишера в 95% случаев. Т.е., можно считать, что наличие этой зависимости статистически доказано, направление и общая тенденция отражена уравнением регрессии верно и согласуется с экономической теорией. При этом, средняя ошибка аппроксимации свидетельствует, что модель подобрана вполне приемлемо, в среднем теоретические (смоделированные данные) отличаются от фактических на 17–19%. Значения стандартных ошибок и для коэффициентов b0 и b1 не малы, и доверительные интервалы для параметров модели 0 и 1 достаточно широки, а также невысокое значение коэффициента детерминации R2 указывают, что на формирование количества легковых автомобилей в регионах существенное влияние оказывают и другие экономические (и случайные, в том числе) факторы.
А это означает, что применение полученного уравнения на другие периоды или другие регионы, страны и пр. вполне возможно, но было бы целесообразным для повышения прогностической силы и практической ценности этой модели добавление в нее других значимых и существенных факторов, изучение данных и за другие периоды, увеличение объема выборки.
Рекомендации по улучшению модели: проверить и устранить, если будут обнаружены, нарушения предпосылок МНК, в частности гетероскедастичности и/или автокорреляции остатков (исходя из экономических соображений, в данной модели можно предполагать наличие гетероскедастичности, так как в случае малых доходов дисперсия количества автомобилей, наверняка, больше, чем дисперсия количества автомобилей при больших доходах); добавить в модель другие существенные факторы; увеличить объем выборки.