
- •Проверка качества уравнения регрессии
- •Предпосылки метода наименьших квадратов
- •Анализ точности определения оценок коэффициентов регрессии
- •3. Проверка гипотез относительно коэффициентов линейного уравнения регрессии
- •4. Интервальные оценки коэффициентов линейного уравнения регрессии
- •5. Доверительные интервалы для зависимой переменной
- •6. Проверка общего качества уравнения регрессии
- •9 Проверка качества уравнения регрессии
Анализ точности определения оценок коэффициентов регрессии
Оценки коэффициентов регрессии
и
являются тем надежнее, чем меньше их
дисперсии
и
,
т.е. чем меньше их разброс вокруг
и
.
Надежность оценок тесно связана с
дисперсией случайных отклонений.
Фактически
является дисперсией переменнойYотносительно линии регрессии, т.е.
.
Запишем формулы связи дисперсий оценок
коэффициентов с дисперсией случайных
отклонений. Для этого представим формулы
определения
и
в виде линейных функций относительно
значений переменнойY:
;
.
Так как дисперсия переменной Yпостоянна и не зависит от значений
переменнойX, тои
можно рассматривать как некоторые
постоянные. Следовательно:
, (1)
. (2)
Из (1) и (2) можно сделать следующие выводы:
дисперсии оценок
и
прямо пропорциональны дисперсии случайного отклонения
, следовательно, чем больше фактор случайности, тем менее точными будут оценки;
чем больше число наблюдений n, тем меньше дисперсии оценок, т.е. тем вероятнее получение более точных оценок;
чем больше дисперсия объясняющей переменной (шире область изменений значений:
), тем точнее будут оценки.
В силу того, что случайные отклонения
по выборке определены быть не могут,
при анализе надежности оценок коэффициентов
регрессии они заменяются оценками
,
.
Дисперсия случайных отклонений
заменяется ее несмещенной оценкой
.
– этонеобъясненная дисперсия, т.е.
доля разброса зависимой переменной
не объясненная регрессией.
Тогда выборочные исправленные дисперсии имеют вид:
;
.
Корень квадратный из необъясненной
дисперсии
называетсястандартной ошибкой
регрессии.
Соответственно
и
называютсястандартными ошибками
коэффициентов регрессии.
3. Проверка гипотез относительно коэффициентов линейного уравнения регрессии
При проведении статистического анализа
возникает необходимость сравнения
оценок коэффициентов регрессии
и
с теоретически ожидаемыми значениями
и
.
Такой анализ осуществляется по схеме
статистической проверки гипотез.
Гипотеза
подлежащая проверке, называетсянулевой
(основной).
Гипотеза
,
которая принимается при отклонении
,
называетсяальтернативной (конкурирующей).
Для проверки гипотез
,
,
используетсяt–статистика
,
которая при справедливости гипотезы
имеет распределение Стьюдента с числом
степеней свободы
,
гдеn– объем выборки.
Гипотеза
отклоняется, если
,
где
– требуемый уровень значимости,
– критическая точка.
На начальном этапе важно установить наличие линейной зависимости между переменными XиY. Эта задача может быть решена по аналогичной схеме:
,
.
Гипотеза в такой постановке называется
гипотезой о статистической значимости
коэффициента регрессии. Если гипотезапринимается, то коэффициент
статистически незначим, т.е. близок
к нулю. Если гипотеза
отклоняется, то коэффициент
статистически значим, что указывает
на наличие определенной линейной
зависимости между переменнымиXиY.
Поскольку считается, что
,
то значимость оценки коэффициента
регрессии
проверяется с помощьюt–статистики
,
которая при справедливости гипотезы
также имеет распределение Стьюдента с
числом степеней свободы
.
Для t–статистики проверяется нулевая
гипотеза о равенстве ее нулю,
что равносильно
,
что свидетельствует об отсутствии
линейной связи между переменнымиXиY.
Гипотеза
отклоняется на основании критерия
.
По аналогичной схеме на основе t–статистики
проверяется гипотеза о статистической
значимости коэффициента.
При оценке значимости эмпирических коэффициентов линейной регрессии можно использовать «грубое» правило:
если
, то коэффициент не может быть признан значимым, так как доверительная вероятность составит менее чем 0,7;
если
, то найденная оценка может рассматриваться как относительно (слабо) значимая. Доверительная вероятность в этом случае лежит между 0,7 и 0,95;
если
, то это свидетельствует о значимой линейной связи междуXиY. В этом случае доверительная вероятность колеблется от 0,95 и 0,99;
если
, то это почти гарантия наличия линейной связи.