Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Линейные модели1.doc
Скачиваний:
10
Добавлен:
01.03.2025
Размер:
3.46 Mб
Скачать
  1. Множественная линейная регрессия

В практике зачастую встречаются ситуации, когда на результирующий параметр влияет ряд факторов. В таком случае модель линейной регрессии можно представить в виде:

,

    1. у – результирующий параметр;

а – свободный член регрессии;

b1 … bk – искомые коэффициенты множественной регрессии;

х1 … хk – независимые аргументы (факторы).

Уравнение для i-ого наблюдения:

.

Представим а=bixi0 со всеми xi0=1. Тогда модель i-ой записи перепишется как:

.

Определив наборы переменных и факторов как матрицы (вектора):

; ; ; ,

представим модель в матричной форме:

.

Для получения наилучшей оценки на модель накладываются следующие ограничения:

,

,

    1. – единичная матрица ранга N.

Методика определения искомых коэффициентов «b»:

      1. Определить вариансу ошибки:

.

      1. Получить частные дифференциалы по «b»:

.

      1. Приравнять частный дифференциал к 0:

.

      1. Решить уравнение относительно «b»:

,

.

Поскольку по определению хi0=1, то

.

Соответственно:

.

Анализ вариансы:

  1. Варианса ошибки оценивается как:

,

    1. ;

r – число независимых параметров в уравнении множественной регрессии, включая свободный член.

    1. Варианс-ковариансная матрица оценки « »:

.

В итоге получается матрица размером rхr. Диагональные элементы матрицы представляют собой вариансы, а внедиагональные – ковариансы; матрица – симметричная. Стандартные ошибки оценок определяются как корни квадратные из соответствующих значений варианс.

    1. Вычисление сумм квадратов.

      1. Общая сумма квадратов:

.

      1. Регрессионные (редуцированные) суммы квадратов:

.

      1. Значимые (факториальные) суммы квадратов:

.

      1. Регрессионные суммы квадратов, скорректированные на значимые:

.

      1. Общие суммы квадратов, скорректированные на значимые:

.

      1. Остаточные (ошибочные) суммы квадратов:

, или .

        1. Точность построенного уравнения определяется коэффициентом множественной корреляции (детерминации):

(обычно умножается на 100%).

        1. Проверка свойств распределения:

~ ;

~ ;

~ ;

F(R) проверяет гипотезу Н0: b=0 против гипотезы Нa: b≠0

F(М) проверяет гипотезу Н0: Е( )=0 против гипотезы Нa: Е( )≠0

F(R) проверяет гипотезу

против .

        1. Редуцированные модели.

Значимость включения отдельных конкретных значений « » определяется посредством применения уменьшенных моделей.

F-соотношение имеет вид:

    1. q – поднабор из общего набора векторов «b»;

К – число проверяемых векторов;

Сqq – инверсия частной матрицы (размер и структура матрицы определяется набором «b» – параметров из общей модели).

Полученное значение сравнивается с табличным значением Fisher-criteria для (К, N-r) степеней свободы.

Пример.

В процессе эксперимента получили следующий набор данных:

Свиноматка

Число поросят в опоросе, гол.

Возраст опороса, мес.

Порядковый номер опороса

1

6

11

1

2

9

17

2

3

8

13

1

4

12

23

3

5

11

25

3

6

7

12

1

7

10

18

2

Предполагается использовать следующую модель множественной регрессии:

,

    1. уi – размер помета i-ой свиноматки;

а – свободный член уравнения;

b1 – коэффициент регрессии размера помета на возраст опороса свиноматки;

b2 – регрессионный коэффициент размера опороса на порядковый номер опороса;

ei – случайная ошибка с нулевой средней и вариансой .

Система нормальных уравнений:

приводит к следующим решениям:

.

На основе сумм квадратов, вычисленных по общепринятым методикам, таблица анализа вариансы выглядит следующим образом:

Источник

Число степеней свобода

Сумма квадратов

Средний квадрат

F-критерий

Р>F

Регрессия

2

25,2727

12,6364

18,53**

0,0095

Возраст опороса

1

0,3610

0,3610

0,53

0,5072

Порядковый номер опороса

1

0,0536

0,0536

0,08

0,7930

Ошибка

4

2,7273

0,6818

Квадрат регрессионного значения проверяет гипотезу против альтернативной гипотезы и, основываясь на значимом значении F-критерия (Р<0,01), Нa гипотеза принимается. Вместе с тем ни один из показателей, включенных в модель и анализируемых раздельно, не дает значимого критерия (Р1=0,51 и Р2=0,79). Это на первый взгляд выглядит парадоксом, и нами должна приниматься нулевая гипотеза в обоих случаях.

В этой ситуации часто делается ошибочный вывод о том, что ни номер опороса, ни возраст матки не оказывают значимого влияния на число поросят в опоросе. Однако единичное число степеней свободы при анализе вариансы в данном случае показывает, что влияние возраста опороса определялось после принятия значимости порядкового номера опороса и наоборот. Если нами будет устанавливаться влияние указанных аргументов на размер помета раздельно, т.е. используя субмодели

и ,

то каждый из них окажется значимым (b1=0.376±0,056 и F(H)=45,34**; b2=2,26±0,36 и F(Н)=40,33*). Следовательно, можно сделать вывод, что включать в модель показатели возраста свиноматки и порядкового номера опороса одновременно нет необходимости, но один из них должен быть включен обязательно.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]