6.1.4. Пошаговая процедура построения модели

Основным критерием отбора аргументов должно быть качественное представление о факторах, влияющих на зависимую переменную, которую мы пытаемся смоделировать. В SPSS очень хорошо реализован процесс построения регрессионной модели: на машину переложена значительная доля трудностей в решении этой задачи. Возможно последовательное построение модели путем добавления и удаления переменных блоками или по отдельности. Но мы рассмотрим только работу с отдельными переменными.

По умолчанию программа включает в уравнение все заданные переменные (метод ENTER).

Метод включения и исключения переменных (STEPWISE) состоит в следующем.

Из множества факторов, заданных исследователем в качестве возможных аргументов регрессионного уравнения, отбирается один x^k, который более всего связан корреляционной зависимостью сy. Для этого рассчитываются частные коэффициенты корреляции остальных переменных сyприx^k, включенном в регрессию, и выбирается следующая переменная с наибольшим частным коэффициентом корреляции. Это равносильно следующему: вычислить регрессионный остаток переменнойy; вычислить регрессионный остаток независимых переменных по регрессионным уравнениям их как зависимых переменных от выбранной переменной (т. е. устранить из всех переменных влияние выбранной переменной); найти наибольший коэффициент корреляции остатков и включить соответствующую переменнуюxв уравнение регрессии. Далее проводится та же процедура при двух выбранных переменных, при трех и т. д.

Процедура повторяется до тех пор, пока в уравнение не будут включены все аргументы, выделенные исследователем, удовлетворяющие критериям значимости включения.

Замечание: во избежание зацикливания процесса включения/исключения уровень значимости включения устанавливается меньше значимости исключения (напримерP_in = 0.05,P_out = 0.1).

6.1.5. Переменные, порождаемые регрессионным уравнением

Сохранение переменных, порождаемых регрессией, производится подкомандой SAVE. В диалоговом окне эта возможность включается одноименной кнопкойSave.

Благодаря полученным оценкам коэффициентов уравнения регрессии могут быть оценены математические ожидания зависимой переменной . Иногда в данных для некоторых объектов отсутствуют наблюдения дляy, а имеются лишь значенияx. На основании уравнения регрессии SPSS оценивает ожидаемые значения и значения ненаблюдаемыхy.

Поскольку коэффициенты регрессии – случайные величины, линия регрессии также случайна. Поэтому предсказываемые значения случайны и имеют некоторое стандартное отклонение, зависящее отX. Благодаря этому можно получить и доверительные границы для прогнозных значений регрессии (математических ожиданийM(y)).

Кроме того, с учетом дисперсии остатка могут быть вычислены доверительные границы значений y(не средних, а индивидуальных!).

Для каждого объекта может быть вычислен остаток (оценка_i). Остаток полезен для изучения адекватности модели данным. Это означает, что должны быть выполнены требования независимости остатков для отдельных наблюдений, дисперсия не должна зависеть отX.

Для изучения отклонений от модели удобно использовать стандартизованный остаток, деленный на стандартную ошибку регрессии.

Случайность оценки коэффициентов регрессии вносит дополнительную дисперсию в регрессионный остаток, из-за этого дисперсия остатка зависит от значений независимых переменных (S_x = S_x(x₁, …, x_p)). Стьюдентеризованный остаток – это остаток, деленный на оценку дисперсии остатка: (Sresid = S_x(x₁, …, x_p)).

Таким образом, мы можем получить: (прогнозную) оценку значений зависимой переменной Unstandardized predicted value), ее стандартное отклонение (S.E. of mean predictions), доверительные интервалы для математического ожиданияM(y(x)) и для индивидуального значенияy(x). В окне, включенном кнопкойSave, такое сохранение назначается в разделеPrediction intervals включением позиций Mean и Individual.

Это далеко не полный перечень переменных, порождаемых SPSS.

<<< < Предыдущая 37 38 39 40 41 42 43 44 45 46 47 4849 / 6949 50 51 52 53 54 55 56 57 58 59 60 61 > Следующая >>>