Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпаргалки для студентов.doc
Скачиваний:
4
Добавлен:
21.08.2019
Размер:
1.27 Mб
Скачать

Вопрос 43

Отбор факторов в уравнение множественной регрессии. Приемы анализа корреляционной матрицы.

ОТВЕТ

Отбор факторов обычно осуществляется в два этапа:

1) Теоретический (содержательный) анализ взаимосвязи результата и факторов, оказывающих на него существенное влияние;

2) Количественная оценка (расчет соответствующих показателей) и анализ взаимосвязи факторов с результатом. При линейной форме связи между признаками данный этап сводится анализу корреляционной матрицы (матрицы парных линейных коэффициентов корреляции).

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

  • Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов).

  • Каждый фактор должен быть достаточно тесно связан с результатом (при линейной связи коэффициент парной корреляции фактора с результатом rxj,y должен существенно отличаться от нуля).

  • Факторы не должны быть коррелированы друг с другом, тем более находиться в строгой функциональной связи (т.е. они не должны быть интеркоррелированы). Разновидностью интеркоррелированности факторов является мультиколлинеарность - наличие высокой линейной связи между всеми или несколькими факторами.

Мультиколлинеарность может привести к нежелательным последствиям:

1) затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны;

2) становится невозможным определить изолированное влияние факторов на результативный показатель.

Корреляционная матрица - это квадратная матрица размером (m+1;m+1) m- число факторов в модели. Ее размер определяется числом признаков, участвующих в анализе: m признаков-факторов и один признак-результат.

ry,y ry,x1 ryx2 .... ry,xm

rx1,y rx1,x2 rx2x2 .... rx2,xm

...... - корреляционная матрица

rxm,y rxm,x1 rxm,x2 .... rxm,xm

Анализ корреляционной матрицы позволяет:

  • Ранжировать факторы по степени их влияния на результат.

  • Выявить мультиколлинеарные факторы.

Таким образом, анализ корреляционной матрицы позволяет решить вопрос о составе факторов в уравнении множественной регрессии.

Вопрос 44 Расчет параметров уравнения линейной множественной регрессии и их интерпретация.

ОТВЕТ

Параметры уравнения линейной множественной регрессии: Y=a+bX1+bX2+...+bm·Xm (*) можно определить:

  • методом наименьших квадратов, решив систему нормальных линейных уравнений:

(для решения данной системы можно воспользоваться, например, метод Гаусса (определителей));

- через -коэффициенты (параметры уравнения регрессии в стандартных масштабах):

, j=1;m; .

Коэффициент регрессии bj при факторе Хj в уравнении (*) называют условно-чистым коэффициентом регрессии. Он измеряет среднее по совокупности отклонение признака-результата от его средней величины при отклонении признака-фактора Хj на единицу, при условии, что все прочие факторы модели не изменяются (зафиксированы на своих средних уровнях).

Если не делать предположения о значениях прочих факторов, входящих в модель, то это означает, что каждый из них при изменении Хj может также изменяться (т.к. факторы (пусть и несильно) связаны между собой). Изменение прочих факторов модели вызовет изменение признака-результата. Таким образом, изменение признака-результата будет обусловлено изменением всех факторов модели, а не только интересующего нас фактора Хj.