Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций по ТВМС.doc
Скачиваний:
119
Добавлен:
23.04.2019
Размер:
5.02 Mб
Скачать

А. Парная корреляция

Уравнение как линейной, так и нелинейной регрессии всегда дополняется показателем тесноты связи.

При использовании линейной регрессии в качестве показателя тесноты связи выступает линейный коэффициент корреляции, рассмотренный выше.

Важно понимать, что величина линейного коэффициента корреляции оценивает тесноту связи рассматриваемых признаков в ее линейной форме. Поэтому близость его абсолютной величины к нулю еще не означает отсутствия связи между признаками. При другом выборе уравнения регрессии связь между признаками может оказаться достаточно тесной.

В случае нелинейной регрессии вместо коэффициента корреляции используется индекс корреляции, рассчитываемый по формуле:

.

Характеристикой доли дисперсии, объясняемой регрессией, в общей дисперсии является коэффициент (в случае линейной регрессии) или индекс (в нелинейном случае) детерминации . Соответственно, величина характеризует долю дисперсии, вызываемую влиянием остальных, не учтенных в модели факторов. Величина коэффициента (индекса) детерминации:

служит одним из критериев оценки качества модели. Данный параметр представляет собой квадрат коэффициента (или индекса) корреляции.

Для анализируемого уравнения регрессии необходимо провести оценку значимости как самого уравнения в целом, так и отдельных его параметров.

Оценка значимости уравнения регрессии в целом

Оценка значимости (качества) уравнения регрессии в целом производится с помощью F-критерия Фишера (F-теста). При этом выдвигается нулевая гипотеза, что коэффициент регрессии (в линейном случае - коэффициент перед x) равен нулю, и, следовательно, фактор x не оказывает влияния на результат y. Иными словами, проверяется нулевая гипотеза о статистической незначимости уравнения регрессии и показателя тесноты (силы) связи. Выполняется сравнение фактического и табличного значений критерия Фишера. Fфакт определяется из соотношения:

где - число наблюдений, - число параметров при переменной x. Последнее равенство относится к случаю линейной регрессии, для которой .

Табличное значение F-критерия – это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня значимости и данного числа степеней свободы. В случае Fфакт > Fтабл, нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи.

Если Fфакт < Fтабл, то уравнение регрессии считается статистически незначимым и не отклоняется.

Далее мы ограничимся случаем парной линейной регрессии вида

.

Оценка значимости отдельных параметров регрессии

По каждому из параметров определяется его стандартная ошибка. Стандартная ошибка линейного коэффициента регрессии определяется по формуле:

.

Стандартная ошибка коэффициента определяется выражением:

,

а стандартная ошибка коэффициента корреляции – выражением

.

После расчета стандартных ошибок рассчитывается значение t-критерия Стьюдента по формулам

Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Сравнивая фактическое и критическое (табличное) значения t-статистики (число степеней свободы n – 2), гипотеза принимается или отвергается. При этом, если tфакт > tтабл, - то - отклоняется, т.е. делается вывод о том, что не случайно отличаются от нуля и сформировались под действием систематически действующего фактора . Если же tфакт < tтабл, - то нулевая гипотеза не отклоняется и признается случайная природа формирования одного или всех параметров регрессии.

Рассмотрим вопрос о прогнозировании значений результативного признака.

В прогнозных расчетах по уравнению регрессии определяется предсказываемое значение как точечный прогноз при , т.е. путем подстановки в уравнение регрессии соответствующего значения . Однако точечный прогноз не обладает высокой точностью, в связи с чем он дополняется расчетом стандартной ошибки , обозначаемой как , и интервальной оценкой прогнозирования

.

Расчет стандартной ошибки предсказываемого по линии регрессии значения осуществляется по формуле:

, (2)

характеризующей ошибку положения линии регрессии. Величина стандартной ошибки возрастает по мере того, как удаляется от в любом направлении.

В заключение рассмотрим вопрос о средней ошибке аппроксимации модели регрессии. Она рассчитывается по формуле:

,

справедливой и в случае множественной регрессии.