Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Konspekt_lektsy_po_distsipline_Ekonometrika.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
380.42 Кб
Скачать

Свойства линейной регрессии

1. Видно, что прямая регрессии всегда проходит через центр рассеивания корреляционного поля, т.е. через точку ( ).

2. Из выражения следует, что угловой коэффициент b1 выражается через коэффициент корреляции rxy и среднее квадратичное отклонение фактора и отклика, т.е. знак b1 совпадает со знаком коэффициента корреляции (т.к. всегда).

Если rxy>0, то b1>0, связь между х и у – прямая, т.е. с ростом х у возрастает.

Если rxy<0, то b1<0, связь между х и у обратная.

Проверка линейной регрессии на адекватность

После того, как была построена модель линейной регрессии y=b0+b1x, необходимо проверить ее на адекватность, т.е. проверить, соответствует ли построенная модель действительности.

Прежде, чем рассматривать адекватность модели, рассмотрим вариацию (разброс) зависимого показателя Y вокруг своего среднего значения. Отклонение равно . При этом можно без изменения формулы записать: , где - расчетные значения. Т.е. вариацию зависимого показателя Y вокруг своего среднего значения можно разделить на два слагаемых: - вариация расчетных значений вокруг среднего; - вариация расчетных значений вокруг фактичных.

Обозначим:

, с числом степеней свободы - вариация, объясняемая регрессией.

, с числом степеней свободы - остатки, необъясненный разброс.

, с числом степеней свободы - общая вариация.

Тогда можно записать:

Коэффициент детерминации.

Для анализа общего качества оцененной линейной регрессии обычно используют коэффициент детерминации: , .

.В числителе стоит сумма квадратов отклонений линии регрессии от среднего значения, в знаменателе – сумма квадратов отклонений исходных данных от среднего значения. Значит, чем меньше разница между этими величинами, тем больше дробь, тем ближе значение коэффициента детерминации к 1.

Величина показывает, на сколько процентов ( ) разброс данных объясняется линейной регрессией, а какая – случайными ошибками.

Использование в качестве меры адекватности не дает четких критериев проверки на адекватность, особенно для выборок малых объемов.

Проверка с помощью критерия Фишера.

Выдвигаем гипотезу, что b1=0. Т.е. уравнение регрессии будет иметь вид .

Для проверки этой гипотезы сравниваются между собой величины:

и .

Т.е. вычисляем дисперсию остатков и дисперсию расчетных данных , взятых с регрессионной прямой.

Вычисляем k1, k2 – количество степеней свободы для статистик MSR и MSE. Число степеней свободы k1 равно числу независимых факторов в модели, k2=n- k1-1 (n- объем выборки).

Отношение введенных величин представляет собой наблюдаемое значение критерия Фишера со степенями свободы k1, k2. .

Переход от случая, когда мы можем признать Fнабл.=0, а следовательно b1=0 и зависимость у от х отсутствует, к случаю, когда следует признать Fнабл.0  b10  есть зависимость у от х, производят, сравнивая Fнабл с теоретически вычисленным критическим значением для критерия Фишера Fкр.

Рассчитывают точку Fкр, при некотором уровне значимости  и степенями свободы k1, k2. Уровень значимости – вероятность совершить ошибку.

Итак, сравним Fнабл. с Fкр. и обнаружим, что Fнабл< Fкр. - делаем заключение b1=0  у от х не зависит  линейная регрессия неадекватна.

Если же Fнабл. > Fкр, то гипотеза Н0 отвергается, значит b10  у зависит от х  линейная регрессия адекватна (с гарантией (1-)100%).

Иногда в ППП одновременно с вычислением наблюдаемого значения критерия, вычисляется его значимось , т.е. вероятность совершить ошибку. Если это значение переобразовать в проценты, (100%), и полученное значение меньше 5%, то модель считается адекватной.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]