- •3 Курс группа киэф2 – 0702 (д)
- •1) Основные характеристики выборки
- •2) Линейная парная регрессионная модель
- •3) Коэффициент детерминации
- •5) Оценка статистической значимости коэффициентов регрессии и коэффициента корреляции
- •6) Доверительные интервалы для параметров регрессионной модели 0 и 1
- •7) Оценка качества уравнения регрессии в целом
- •8) Прогнозирование по полученному уравнению регрессии
6) Доверительные интервалы для параметров регрессионной модели 0 и 1
Доверительный интервал для 0 с надежностью =1–α: . Выбрав уровень значимости =0,05, получаем надежность =0,95. Все необходимые цифровые значения уже рассчитаны ранее, тогда , откуда получаем .
Доверительный интервал для 1 с надежностью =1–α: . При выбранной надежности =0,95: , откуда .
Таким образом, с надежностью 95% можно утверждать, что истинное значение параметра 0 для всей генеральной совокупности будет заключено в пределах от 135,958 до 251,9, а истинное значение параметра 1 - расположено в границах от 0,0155 до 0,0565. Следует отметить, что доверительные интервалы не очень широки, но и не узки. А это подтверждает, что количество автомобилей в регионах действительно зависит от среднедушевых доходов, но вместе с тем оказывают существенное влияние и другие факторы, и ими не стоит пренебрегать. Именно потому, что они не учтены в модели, доверительные интервалы получились не узкими, а, значит, точность модели невысока, но вполне приемлема.
7) Оценка качества уравнения регрессии в целом
F-критерий Фишера
Выдвигается нулевая гипотеза Н0 о статистической незначимости уравнения регрессии. Альтернативная ей гипотеза Н1 о статистической значимости. Чтобы опровергнуть гипотезу Н0 и подтвердить гипотезу Н1 должно выполняться неравенство .
Рассчитаем наблюдаемое значение F-критерия (воспользуемся свойством для линейной парной регрессии): .
Табличное значение по таблице распределения Фишера на уровне значимости α=0,05 с ν1=1 и ν2=n–2=21–2=19 степенями свободы: Fтабл= FРАСПОБР(α, ν1, ν2) = 4,381.
Наблюдаемое значение F–критерия превышает табличное: 13,292 > 4,381, то есть выполнено неравенство , а значит, гипотеза Н0 о случайной природе полученного уравнения регрессии отклоняется в пользу гипотезы Н1, свидетельствующей в 95% случаев о статистической значимости и существенности зависимости между количеством легковых автомобилей и среднедушевыми доходами. Уравнение по данным регионам можно признать надежным и значимым, доказывающим наличие исследуемой зависимости.
Оценка аппроксимации модели
Потребуется сделать промежуточные вычисления: остатки еi разделим на фактические значения уi, полученные частные от этих делений возьмем по модулю и просуммируем; результаты представлены в расчетной таблице.
Средние ошибки аппроксимации: ,
В среднем теоретические (смоделированные) значения количества легковых автомобилей отклоняются от фактических на 17–19%. Подбор модели к фактическим данным можно оценить как не очень точный, но приемлемый, так как средняя ошибка аппроксимации не превышает 20%.
Выводы: Статистически значимые коэффициенты регрессии b0 и b1, коэффициент корреляции rух свидетельствуют о наличии зависимости количества легковых автомобилей от среднедушевого дохода населения в месяц по регионам, это подтверждается и оценкой качества уравнения регрессии по F-критерию Фишера в 95% случаев. Т.е., можно считать, что наличие этой зависимости статистически доказано, направление и общая тенденция отражена уравнением регрессии верно и согласуется с экономической теорией. При этом, средняя ошибка аппроксимации свидетельствует, что модель подобрана вполне приемлемо, в среднем теоретические (смоделированные данные) отличаются от фактических на 17–19%. Значения стандартных ошибок и для коэффициентов b0 и b1 не малы, и доверительные интервалы для параметров модели 0 и 1 достаточно широки, а также невысокое значение коэффициента детерминации R2 указывают, что на формирование количества легковых автомобилей в регионах существенное влияние оказывают и другие экономические (и случайные, в том числе) факторы.
А это означает, что применение полученного уравнения на другие периоды или другие регионы, страны и пр. вполне возможно, но было бы целесообразным для повышения прогностической силы и практической ценности этой модели добавление в нее других значимых и существенных факторов, изучение данных и за другие периоды, увеличение объема выборки.
Рекомендации по улучшению модели: проверить и устранить, если будут обнаружены, нарушения предпосылок МНК, в частности гетероскедастичности и/или автокорреляции остатков (исходя из экономических соображений, в данной модели можно предполагать наличие гетероскедастичности, так как в случае малых доходов дисперсия количества автомобилей, наверняка, больше, чем дисперсия количества автомобилей при больших доходах); добавить в модель другие существенные факторы; увеличить объем выборки.