Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрия-курс лекций.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
5.84 Mб
Скачать

7. Связь между коэффициентом корреляции (r) линейного уравнения регрессии и коэффициентом детерминации (r2).

Коэффициент детерминации вычисляется по одной из формул (1.16) или (1.17).

Напомним, что

(1.18)

Перепишем (1.18) в виде:

С учетом этой формулы перепишем (1.17) для следующим образом

В силу (1.9) имеем

, (1.19)

т.е. коэффициент детерминации равен квадрату коэффициента корреляции.

Отметим, что соотношение (1.19) справедливо только для линейного уравнения регрессии. Выборочный коэффициент корреляции используется для оценки тесноты связи только линейного уравнения регрессии, в то время как коэффициент детерминации можно использовать и для нелинейного уравнения.

8. Понятие о степенях свободы. Анализ дисперсий.

Вернемся к тождеству (1.12), которое связывает общую сумму квадратов с суммой квадратов остатков и суммой квадратов, которая объясняет регрессию:

Каждая сумма квадратов связана с числом, которое называется ее степенью свободы. Это число показывает, сколько независимых элементов информации, которые образовались из элементов , необходимо для подсчета данной суммы квадратов.

В статистике количеством степеней свободы некоторой величины называют разность между количеством различных опытов и количеством констант, установленных в результате этих опытов, независимо один от одного. Отдельное использование этого понятия относится к сумме квадратов.

Рассмотрим, сколько степеней свободы имеет каждая из рассмотренных выше сумм квадратов.

Начнем с общей суммы квадратов (SST). Для образования SST необходимо независимое число, так как из чисел независимы только в силу свойства:

Сумму квадратов, которая объясняет регрессию (SSR), получают, используя только одну независимую единицу информации, которая образуется из , а именно а.

Покажем, что действительно, наклон а можно получить как функцию от .

Отклонение, которое объясняет регрессию можно записать в виде . Тогда

Таким образом, сумму квадратов, которая объясняет простую линейную модель, можно образовать, используя только одну единицу независимой информации, а именно а. Поэтому SSR имеет одну степень свободы. Обратим внимание на то, что степень свободы в данном случае совпадает с количеством независимых переменных, которые входят в уравнение регрессии.

Сумма квадратов ошибок (SSE) имеет степеней свободы. Эта сумма базируется на количестве степеней свободы, которое равняется разности между количеством наблюдений и количеством параметров, которые оцениваются. В случае линейной регрессии оцениваются два параметра a и b. Если объем выборки n, то для SSE имеем степеней свободы.

Средним квадратом называется сумма квадратов разделенная на соответствующую ей степень свободы.

Таким образом, средним квадратом ошибок MSE называется сумма квадратов ошибок разделенная на соответствующую ей степень свободы, которая в случае простой линейной регрессии равна . Следовательно,

(1.20)

Средний квадрат, который объясняет регрессию, обозначается MSR и определяется аналогично. В случае простой линейной регрессии

(1.21)

Для общей суммы квадратов средний квадрат не рассчитывается.