Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОС по социологии - все части.doc
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
3.64 Mб
Скачать

5.3 Ограничения регрессионной модели. Способы их преодоления.

Ограничения, которые предъявляет к данным статистическая модель регрессионного анализа, одновременно оказываются требованиями и к содержательным социологическим моделям, которые строятся на основании моделей регрессионных.

Нормальность распределения остатков. Построение доверительных интервалов при оценивании коэффициентов регрессии происходит в предположении, что возможное значение этих коэффициентов подчиняется закону нормального распределения. Без выполнения данного требования нельзя пользоваться формулами для определения доверительных интервалов для коэффициентов регрессии и, соответственно, переносить результаты, полученные на выборке, на характеристики генеральной совокупности. Это требование означает, что маленьких остатков должно быть много, а больших остатков – мало. То есть, основная масса точек должна лежать близко к регрессионной прямой, и чем дальше от прямой, тем точек должно быть меньше, и лишь небольшое число точек может лежать далеко от прямой.

Центральная предельная теорема: «если случайная величина является общим результатом взаимодействия большого числа других случайных величин, ни одна из которых не является доминирующей, то она будет иметь приблизительно нормальное распределение». Исходя из этой теоремы, предположение о нормальности распределения остатков выглядит вполне естественным.

Способ преодоления. Если требование нормальности не выполняется, необходимо выяснить причину этого. Посмотрев на распределение остатков можно увидеть, что данные являются совокупностью двух или более существенно разных массивов, для которых нельзя построить одну модель. Если разделить эти массивы, можно построить для каждого из них модель, которая будет отвечать исходным данным.

Равная дисперсия распределения остатков (гомоскедастичность). Обязательным условием для построения регрессионной модели является требование одинакового разброса наблюдений вокруг линии регрессии для всех значений x. Это требование называется требованием гомоскедастичности, что означает «одинаковый разброс». С социологической точки зрения нарушение гомоскедастичности, то есть гетероскедастичность, фактически означает, что для разных значений x мы должны строить разные регрессионные модели.

Основным выводом, который можно сделать при обнаружении гетероскедастичности, является необходимость разделения массива на несколько относительно гомоскедастичных подмассивов и построение для каждого из них отдельной модели регрессии. Представляется, что при таком подходе и с содержательной точки зрения результаты будут гораздо адекватнее.

Требование отсутствия мультиколлинеарности (ограничение модели множественного регрессионного анализа). Наличие высокой корреляции между какой-то парой независимых переменных приводит к резкому увеличению значений стандартных ошибок у соответствующих регрессионных коэффициентов. В ситуации сильной корреляции между независимыми переменными, доверять оценкам коэффициентов регрессии нельзя. Таким образом, мы не можем решить задачу выявления более сильно влияющих факторов с использованием метода множественной регрессии. Можно только построить модель парной регрессии для каждой из независимых переменных.

Ограничение – уровень измерения переменных, используемых в модели. Все те рассуждения, статистические характеристики и меры связи, которые использовались при построении модели регрессии, применимы только к показателям, измеренным на интервальном или абсолютном уровне. В отношении социологических данных это очень неприятно, поскольку большинство переменных, с которыми работают социологи, измерены на порядковом или номинальном уровнях. Однако эта проблема преодолевается с помощью использования, наряду с классической регрессионной моделью, модели с фиктивными переменными и логистической регрессионной модели.