- •Содержание
- •Статистический анализ данных в системе statistica может быть разбит на следующие основные этапы:
- •1 Множественная регрессия
- •1.1 Создание электронной таблицы с исходными данными
- •1.2 Вызов стартовой панели модуля и определение режимов исследования
- •1.3 Построение и оценивание уравнения множественной регрессии
- •1.3.1 Проведение анализа множественной регрессии исследователем
- •1.3.2 Проведение автоматического анализа множественной регрессии
- •1.4 Визуализация данных и результатов
- •Замечание
- •1.5 Исследование остатков
- •1.6 Вывод результатов анализа в файл с отчетом
- •Список литературы
Замечание
Численные результаты анализа в STATISTICA выводятся в виде электронных таблиц. Они называются электронными таблицами Scrollsheet и служат для вывода текстовой и численной информации о результатах анализа. В дальнейшем они могут быть сохранены в различных форматах или выведены на внешнее устройство (File – Save…/File – Print…). Имеется возможность их вывода (в том числе автоматического) в специальный файл с результатами анализа, который называется отчетом (см. п. 1.6).
1.5 Исследование остатков
Остатки – это разность между исходными (наблюдаемыми) значениями зависимой переменной и предсказанными значениями. Исследуя остатки, вы можете оценить степень адекватности модели.
В модуле Множественная регрессия в STATISTICA остатки можно исследовать в специальном окне Residual Analysis - Анализ остатков (рисунок 1.27). Для этого выберите опцию Residual analysis в окне Multiple Regression Results (см. рисунок 1.7), и на экране появится следующее окно:
**
Рисунок 1.27. Окно Анализ остатков
С помощью функциональных кнопок в данном окне можно всесторонне просмотреть остатки модели, как в графическом виде, так и в электронных таблицах:
Statistics – результаты регрессионного анализа:
Correlations & descr. – корреляция и описательная статистика;
Regression summary - краткие результаты регрессионного анализа (стандартизованные - и нестандартизованные коэффициенты - b, стандартная ошибка оценки свободного члена и уровень значимости p-level);
Display residuals & pred. – таблица остатков и прогнозируемых значений;
Durbin-Watson stat. – позволяет проверить наличие/отсутствие автокорреляции остатков;
Save residuals &pred. – сохранение результатов анализа;
Casewise Plots
Scatter Plots
Histograms - набор всевозможных графиков.
Probability Plots
Bivariate Plots
При выборе пункта Display residuals & pred. на экране появится следующее окно: **
Рисунок 1.28. Таблица результатов анализа
В первом столбце этой таблице отображаются наблюдаемые значения переменной VAR4 (Observed Value), во втором – рассчитанные с помощью составленного уравнения множественной регрессии (Predicted Value), а в третьем столбце – вычисленные остатки (Residual).
Для оценки адекватности нашей модели рассмотрим график остатков, например, на нормальной вероятностной бумаге. Для этого выберем пункт Normal plot of resids. (см. рисунок 1.27), в результате на экране появится график:
**
Рисунок 1.29. График остатков на нормальной вероятностной бумаге
Из этого графика видно, что значения остатков достаточно хорошо ложатся на прямую, поэтому предположение о нормальном распределении ошибок выполнено.
Инициируйте, например, кнопку Resids & indep. var. (см. рисунок 1.27). Вы увидите следующий график:
**
Рисунок 1.30. График остатков
Из этого графика видно, что остатки (точки на плоскости) хаотично разбросаны относительно прямой регрессии остатков, в их поведении нет закономерностей. Нет оснований говорить, что остатки коррелированы между собой, нет также резко выделяющихся остатков. Отсюда можно заключить, что модель достаточно адекватно описывает данные.