Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика / Регрессия.doc
Скачиваний:
137
Добавлен:
19.02.2016
Размер:
947.71 Кб
Скачать

Регрессионный анализ в пакете statistica

Для проведения регрессионного анализа в системе STATISTICA пользователю предлагается два модуля — Множественная регрессия и Нелинейное оценивание.

Модуль Множественной регрессии включает в себя построение линейной модели и фиксированной нелинейной — полиномиалъной, экспоненциалъной, логарифмической и др., — используя как иерархические, так и пошаговые методы включения и ис-ключения. Кроме того, модуль содержит возможность оцени-вания гребневой регрессии.

Модуль Нелинейное оценивание содержит процедуры оце-нивания любых нелинейных зависимостей между переменными, ряд из которых предлагается на стартовой панели — логистическая регрессия, регрессия экспоненциального роста и кусочно-линейная регрессия, а также определенная пользователем рег-рессия, задаваемая произвольной алгебраической функцией.

В ходе работы программа вычисляет все необходимые пара-метры и характеристики модели, оценивает ее адекватность, аиализирует остатки как с помощью описательных характеристик, так и на основе графического метода. Оба модуля имеют возможности по построению дальнейших прогнозов на основе полученного регрессионного уравнения и графического изображения зависимости предсказанных значений от объясняющих еременных.

1. Множественная линейная регрессия

Вызовем на экран компьютера стартовую панель модуля ножественная регрессия (см. рис. 4.1). При оценивании множественного и частных коэффициентов корреляции мы уже рассмотрели некоторые опции этого диалогововго окна, в частности, выбор переменных для анализа, режимы работы с пропущенными данными Удаление ПД, типы представления исходной информации. Напомним, что в даннном окне пользователь может выбрать стандартную или фиксисированную нелинейную регрессию.

Построим множественную линейную регрессию по данным римера 3.1., где в качестве зависимой переменной возьмем ренабелъность, независимых — фондоотдачу, непроизводственные расходы. Для линейного уравнения выберем тип Стандартная. Этот же режим стоит по умолчанию вместе с помеченной галочкой опцией Провести анализ по умолчанию (не пошаговый).

Рис. 1

Нажмем ОК и рассмотрим таблицу результатов (см. рис. 2). Множественный коэффициент корреляции оказался значи-мым на уровне 0,008882, что значительно ниже чаще всего вы-бираемого уровня 0.05.

Рис. 2

Коэффициент детерминации составил около 30,% (довольно низкое значение, указывающее на слабую корреляцию между зависимой и независимыми переменными). Скорректированное его значение — около 23%. Поясним, что под этим понимается.

При небольшом числе наблюдений величина множественного коэффициента корреляции, как правило, завышается. Две переменные, включенные в уравнение регрессии, объясняют 30% вариации показателя рентабельности, если мы рассмат-ваем 23 предприятия как генеральную совокупность, не считаясь с тем обстоятельством, что это выборка. Если же учесть это, а также то свойство, что по мере приближения числа включенных в модель факторов k к числу наблюдений п коэффициент детерминации автоматически приближается к единице и достигает ее при k= п -1 независимо от реальной роли факторов, то необходимо скорректировать коэффициент множественной детерминации на потерю степеней свободы вариации:

— скорректированное значение множественного коэфициента корреляции;

п — число наблюдение (у нас 23);

k — число переменных, вошедших в модель (у нас 2).

Стандартная ошибка оценки регрессионной модели равна 26,683008389. Это одна из наиболее важных характеристик точности полученного уравнения, показывающая рассеяние наблюдаемых значений относительно линии регрессии. Если выбрана регрессия, включающая свободный член, то нижняя строка информационной части окна содержит его значение с вычисленными статистическими характеристиками:

стандартной ошибкой (среднеквадратическим отклонением), наблюдаемым значением t-критерия с указанным в скобках числом степеней свободы и вероятностью отклонения гипотезы о значимости коэффициента. В нашем примере значение вероятности меньше чем 0,0711, что позволяет говорить о значимости свободного члена регрессии, например, на уровне 0.05.

Под информационной частью окна отображаются и выделяются синим либо красным цветом статистически значимые коэффициенты регрессии — бета-коэффициенты. Из переменных, включенных в анализ в нашем примере, значима «фондоотдача» и «непредв расходы»

Критерий статистической значимости (по умолчанию — 0.05) может быть изменен. В белом окошке напротив строки Выдел. знач. укажите его новое значение (от 0.0001 до 0.5.) и нажмите кнопку Применить. Система заново проверит гипотезу о значимости коэффициентов, и в окне появятся результаты, ветствующие заданному уровню. Например, изменим его значение на 0.06. После нажатия кнопки Применить независимая переменная «непроизводственные расходы», будучи до этого незначимой, выделилась также красным цветом. Таким об разом, коэффициент при данном факторе значим, но уже с вероятностью в 6 случаях из 100, что мы все-таки ошибаемся.

Рассматриваемая таблица результатов содержит коэффици-енты регрессии не в абсолютных единицах измерения призна-ков, а в долях среднего квадратического отклонения результа-тивного признака, в так называемом стандартизованном виде (бета-коэффициенты). Связано это с тем обстоятельством, что оценка влияния переменных, включенных в модель, на резуль-тативный признак может быть значительно затруднена, если они разны по своей сущности и имеют различные единицы измерения. В стандартизованной модели регрессии все значе-ния исследуемых признаков переведены в стандарты по формуле:

где xi - значение переменной в абсолютном выражении.

Стандартизованные коэффициенты можно перевести в «нату-ральные» через соотношение

где — коэффициент регрессии в натуральном масштабе.

В свою очередь свободный член уравнения из стандартизованного масштаба переводится в натуральный путем следующего вычисления:

Рассмотрим кнопки вывода результатов регрессионного анализа.

Опция Итоговая таблица регрессии выводит электронную таблицу результатов со стандартизованными (бета) и нестан-дартизованными (В) регрессионными коэффициентами, их стан-дартными ошибками и уровнями значимости (вероятностями принятия ошибочных гипотез). Кроме того, заголовочная строка таблицы содержит основные статистики регрессионного анали-за: множественный коэффициент корреляции (К.); коэффициенты детерминации (К.2), вычисленные и скорректированные по данным 23 предприятий; среднеквадратическое отклонение оценки, статистики для проверки гипотезы о значимости множественно-го коэффициента корреляции.

Рис. 3 Окно с результатами вычислений коэффициентов регрессии.

Таким образом, искомое уравнение регрессии имеет вид: V = 16,48963 + 4,86982*Х, - 0,57461*Х2 ,

е У — рентабельность;

X, — фондоотдача;

Х2 — непроизводственные расходы.

Построенная модель отражает зависимость уровня рентабель-зсти от факторов следующим образом: при увеличении фон-гдачи рентабельность возрастает, а увеличение непроизвод-венных расходов уменьшает ее. Свободный член модели определяет некие начальные условия развития, а коэффициенты при переменных — индивидуальное влияние на результативный признак при условии отсутствия между ними мультиколлениарности (ранее мы установили, что между нашими признаками ее нет).

Нажатие на кнопку Дисперсионный анализ вызовет на экран полную таблицу дисперсионного анализа для построенного эавнения регрессии.

Рис. 4 Дисперсионная таблица регрессионной модели

Верхнее значение графы Сумма квадратов, соответствующее строке Регрессия, характеризует вариацию результативного признака от объясняющих переменных: фондоотдачи и непроизводственных расходов (факторная вариация). Напротив строки Остатки находится остаточная вариация, обусловленная воздействием на результативный показатель всех прочих неуч-тенных в модели факторов. Данная величина используется для оценки качества построенного уравнения. При выборе лучшей регрессионной модели из некоторого их множества руковод-ствуются минимальной величиной остаточной дисперсии. Поскольку линия регрессии должна проходить в максимальной близости к эмпирическим данным, то минимальная величина остаточной дисперсии свидетельствует о более удачном выборе вида регрессионного уравнения. На основе правила «сложения» дисперсий сумма факторной и остаточной вариаций равна общей величине колеблемости результативного признака. Отношение остаточной вариации к факторной приводит к получению коэффициента детерминации.

Опция Ковариации коэффициентов строит две таблицы результатов:

  • Корреляционную матрицу коэффициентов регрессии.

  • Ковариационную матрицу коэффициентов регрессии. На ее главной диагонали находятся оценки дисперсий регрессионных коэффициентов, которые затем используются при оценке их значимости.

Рис. 5 Окно с анализом ковариаций регрессионных коэффициентов

Опция Частные корреляции позволяет просмотреть оценки частных коэффициентов корреляции и проверить их значимость. Кнопка Корреляции и описательные статистики открывает ди-алоговое окно Просмотр описательных статистик (см. рис. 6). В нем можно выбрать для просмотра таблицы средних и стан-дартных отклонений, ковариационную и корреляционную матрицу, сохранить ее в формате матричного файла SТАТІSТІСА c помощью кнопки Сохранить корреляции.

Рис. 6 Окно с кнопками ввода описательных статистик, корреляционной и ковариационной матриц

Одним из самых важных направлений оценки качества построенного регрессионного уравнения является анализ остатков.