Множественный корреляционно-регрессионный анализ. Непараметрические методы измерения взаимосвязей
Основные требования к формированию множественной корреляционной модели.
Обоснование формы связи и определение тесноты связи при множественном корреляционном анализе.
Корреляционный анализ в рядах динамики.
Корреляция качественных признаков. Непараметрические показатели корреляционной связи.
Вопрос 1.
Если ограничиться проведением только парного корреляционного анализа, т.е. зависимости между одним результатом и одним факторным признаком, то может создаться ложное впечатление, что на данный результативный признак наибольшее влияние оказывает именно рассматриваемый признак, т.е. "У" или переменная величина преимущественно зависит от того фактора, который был введен в модель.
На самом деле это не так, ведь в природе и в обществе явления и процессы связаны друг с другом и зависят друг от друга. Т.е. на любой результативный признак действует одновременно большое множество факторных признаков.
Например, совокупное влияние на величину урожайности удобрений, вносимых в почву, степени увлажнения ее, сроков сева, глубины вспашки и т.д.
Совместное влияние на производительность труда образования работника, его стажа, фондовооруженности, оплаты труда и т.д. – это примеры такой множественной корреляции, которую экономист может изучить с помощью статистических методов.
Для того чтобы изучить влияние на результат двух и более факторов, применяют множественную корреляцию.
Под множественной корреляцией понимается исследование статистической зависимости результативного признака от нескольких факторных признаков.
Требования к формированию множественной корреляционной модели
Логический анализ для предотвращения "ложной" корреляции.
Проверка совокупности на качественную однородность по результативному признаку "У" и по всем вводимых факторным признаком "Х".
На практике чаще всего совокупность на качественную однородность проверяется по результативному признаку "У".
Многочисленность совокупности
Эмпирически было установлено, что на каждый дополнительно вводимый фактор, совокупность должна увеличиваться на 8-10 единиц.
Из всей массы факторов, оказывающих влияние на "У" отбирают те факторы, которые, по мнению исследователя, в первую очередь характеризуют вариацию результативного признака "У".
Факторы должны иметь количественное выражение.
Наряду с факторами, значение которых может быть выражено количественно, существуют так называемые "неуловимые факторы", которые не могут иметь количественного значения, хотя их влияние на результативный признак может быть довольно значительным. В большинстве своем они относятся к, скажем так, "человеческому фактору".
Например, условия труда работников, использование достижений научно-технического прогресса, уровень жизни работников, моральный климат в коллективе.
В некоторых случаях влияние таких признаков может быть выражено опосредованно через другие, имеющие количественное значение, например, использование достижений НТП через обеспеченность новой техникой, выраженной количеством новых машин на 1 га или на 1 голову животных или через сумму затрат, в денежных единицах, направленных на приобретение новой техники, находящейся в рабочем состоянии.
Однако не всегда такой подход удачен. Поэтому еще может быть использована субъективная оценка неуловимых факторов в баллах.
Факторы не должны дублировать друг друга.
Каждый фактор, включаемый в модель, должен быть представлен один раз либо в натуральной, либо в стоимостной форме, абсолютной или относительной величиной, но не тем и другим одновременно.
В корреляционную модель не включаются взаимозависимые факторы, т.е. между факторами должна отсутствовать коллинеарность и мультиколлинарность.
При экономическом анализе множественных связей возникает задача рассмотрения большого числа факторов, влияющих на результативный признак, и выбора наиболее значительных, совместное влияние которых формирует его величину.
Наличие тесной
линейной
связи между двумя факторами называют
коллинеарностью, а между несколькими
факторами – мультиллинеарностью.
Эта проблема решается посредством двух подходов.
I-й подход. Факторы систематизируются по уровням в следующие группы:
а) природно-климатические:
- качество почв;
- климатические условия;
- количество выпавших осадков;
- сумма активных температур;
- метеоусловия;
б) технологические и технико-экономические:
- сроки проведения агромероприятий;
- качество проведения агромероприятий;
- удобренность полей;
- нормы высева;
- качество семян;
- способ уборки;
- обеспеченность агротехникой;
- уровень кормления животных;
- способ содержания;
- себестоимость, трудоемкость;
в) организационно-экономические:
- уровень специализации хозяйства;
- уровень концентрации производства;
- уровень интенсивности производства;
- уровень материального стимулирования;
- обеспеченность трудоресурсами;
- фондообеспеченность и фондовооруженность отрасли;
- энергообеспеченность и энерговооруженность.
Во множественную модель желательно вводить факторы, относящиеся к одному уровню, поскольку один уровень подготавливает другой.
Однако применение этого способа часто ограничивается недостатком имеющегося числа исходных данных. И Вы в этом убедитесь на практике, при написании курсовой работы, когда подобрать 5-6 факторных признаков из одной из выше перечисленных групп не представляется возможным.
II-й подход. Суть второго подхода заключается в недопустимости тесной связи между факторами.
Прежде всего нельзя допустить наличия функциональной связи между признаками х1 и х2, когда | r |=1.
Кроме того, исключению из анализа обычно подлежат те факторы, которые при парном коррелировании друг с другом дают высокий линейный коэффициент корреляции, превышающий по абсолютной величине 0,85 (| rх1х2 | 0,85)
В крайнем случае, эти факторы можно поместить в модель, если соблюдается такое условие:
ryx1 > rx1x2
ryx2 > rx1x2
Если это условие не соблюдается, то исключению из модели подлежит тот фактор, который наименее тесно связан с результативным признаком "у".
Желательно, чтобы все факторы и "у" были рассчитаны на одну и ту же хозяйственную единицу (на 1 год, 1 га, 1 час и т.д.).
Количество факторов должно быть минимальным, но достаточным для объяснения основной доли вариации результативного признака.
Введение в анализ большого числа факторов и поиски такого их сочетания, которое почти целиком определяло бы поведение изучаемого признака, вовсе не так целесообразно, как иногда кажется.
Правильнее произвести отбор лишь сравнительно небольшого числа факторов, которые носят характер основных. Присоединение к ним еще ряда других дополнительных факторов может не прояснить, а, напротив, затушевать всю картину множественных связей.
При необоснованном уменьшении числа факторов, вводимых в модель, происходит упрощение модели, она перестает отражать основные свойства моделируемого процесса или явления.
