Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
UP_Stat_meto_na_GRIF_1-1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
3.21 Mб
Скачать

Контрольные вопросы

  1. Дать определение корреляционной зависимости между двумя признаками и .

  2. Дать определение условной средней признака и записать формулу для ее нахождения.

  3. Записать уравнения регрессий y на x и x на y, используя коэффициент линейной корреляции r.

  4. Дать определение коэффициента линейной корреляции, сформулировать его свойства.

  5. Как определяется значимость коэффициента линейной корреляции?

  6. Записать доверительные интервалы для оценки коэффициента линейной корреляции.

  7. Записать формулу для нахождения коэффициента детерминации в случае парной линейной корреляции и рассказать о его назначении.

  8. Как производится оценка коэффициентов и уравнения линейной регрессии ?

  9. Записать систему нормальных уравнений для нахождения коэффициентов , , уравнения регрессии .

  10. Рассказать о применении необходимых условий выбора одной из предполагаемых нелинейных зависимостей.

  11. Рассказать об установлении тесноты связи между признаками в случае нелинейной зависимости с помощью корреляционного отношения и индекса корреляции.

  12. Как осуществляется проверка адекватности нелинейной регрессионной модели?

Глава 4. Множественная регрессия и корреляция

4.1.Спецификация модели. Отбор факторов при построении уравнения множественной регрессии

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Однако, производственные взаимосвязи, как правило, определяются большим числом одновременно и совокупно действующих факторов. Например, себестоимость продукции зависит от стоимости материала, основной зарплаты рабочих, премиальных, расходов на содержание оборудования и др. В связи с этим возникает задача исследования зависимости между факторными признаками (называемыми также регрессорами или предикторами) , , . . ., и результативным признаком . Для этого используется множественный регрессионный анализ, т.е. построение уравнений множественной регрессии:

, (1.79)

где - результативный признак (зависимая переменная),

– признаки-факторы (независимые, или объясняющие, переменные).

Основной целью множественной регрессии является построение модели с большим числом факторов и определение при этом влияния каждого из них в отдельности, а также совокупно на моделируемый показатель (результативный признак).

Построение уравнения множественной регрессии начинают с решения вопроса о спецификации модели, который включает в себя отбор признаков-факторов и выбор вида уравнения регрессии.

Включение в уравнение множественной регрессии определенного набора факторов связано, в первую очередь, с представлениями исследователя о природе взаимосвязи моделируемого показателя с другими социально-экономическими явлениями. Важно отметить, что факторы, которые включаются в уравнение множественной регрессии, должны объяснить вариацию зависимой переменной, т.е. результативного признака.

В случае, когда строится модель с набором факторов в первую очередь необходимо определить показатель детерминации , фиксирующий долю объясненной вариации результативного признака за счет рассматриваемых в регрессии факторов. Влияние не учтенных в регрессионной модели факторов, оценивается как (1-R2) с соответствующей величиной остаточной дисперсии S2.

Отбор факторов осуществляется в два тапа: на первом подбираются факторы исходя из сущности изучаемой проблемы; на втором – на основании матрицы показателей корреляции определяют статистики для параметров регрессии.

Коэффициенты корреляции между объясняющими переменными позволяют исключать из модели дублирующие факторы. Считают, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключать из регрессионной модели.

Предпочтение при этом отдается тому факторному признаку, который при достаточно тесной связи с результативным признаком имеет наименьшую тесноту связи с другими признаками-факторами. В этом требовании проявляется специфика использования множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.

Следует отметить, что наибольшие сложности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторных признаков, когда имеет место совокупное воздействие факторов друг на друга, т.е. более чем два признака-фактора связаны между собой линейной зависимостью. В результате вариация в исходных данных перестает быть полностью независимой и поэтому невозможно оценить воздействие каждого фактора в отдельности. Включение в модель мультиколлинеарных факторных признаков нежелательно в силу следующих последствий:

  1. Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде – в виду того, что факторы коррелированы параметры линейной регрессии теряют экономический смысл.

  2. Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений не только по величине, но и по знаку - это делает модель непригодной для анализа и прогнозирования.

Отбор факторов, включаемых в регрессию, является одним из важнейших этапов практического использования методов регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Наиболее широкое применение получили такие методы построения уравнения множественной регрессии как:

  1. Метод исключения – отсев факторов из полного его набора.

  2. Метод включения – дополнительное введение фактора.

  3. Шаговый регрессионный анализ – исключение ранее введенного фактора.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]