- •Содержание
- •Статистический анализ данных в системе statistica может быть разбит на следующие основные этапы:
- •1 Множественная регрессия
- •1.1 Создание электронной таблицы с исходными данными
- •1.2 Вызов стартовой панели модуля и определение режимов исследования
- •1.3 Построение и оценивание уравнения множественной регрессии
- •1.3.1 Проведение анализа множественной регрессии исследователем
- •1.3.2 Проведение автоматического анализа множественной регрессии
- •1.4 Визуализация данных и результатов
- •Замечание
- •1.5 Исследование остатков
- •1.6 Вывод результатов анализа в файл с отчетом
- •Список литературы
1 Множественная регрессия
Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между некоторыми наблюдаемыми переменными. Регрессионный анализ предназначен для изучения связей между одной зависимой (Y) и несколькими независимыми переменными (Xi, i=1,..,m) по результатам наблюдений.
В этих обозначениях задача может быть сформулирована следующим образом:
Y = X + ,
где есть независимые случайные ошибки со средним 0, которые интерпретируются как ошибки наблюдений, а — вектор неизвестных параметров, которые необходимо оценить. Оценки параметров будем обозначать через b.
Если вы хотите построить зависимости между многомерными переменными, подобрать простую линейную модель и оценить ее адекватность, воспользуйтесь модулем Multiple Regression – Множественная регрессия в ППП STATISTICA. Для этого в переключателе модулей (см. рисунок 2) подведите указатель мыши к строке Multiple Regression и дважды щелкните левой кнопкой мыши, откроется основное окно системы STATISTICA:
**
Рисунок 1.1. Основное окно модуля Множественной регрессии.
Модуль Множественной регрессии включает в себя исчерпывающий набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессии, включая пошаговые, иерархические и другие методы.
Система STATISTICA позволяет вычислить всесторонний набор статистик и расширенной диагностики, включая полную регрессионную таблицу, частные и частичные корреляции и ковариации для регрессионных весов, матрицы прогонки, статистику Дурбина-Ватсона, расстояния Махаланобиса и Кука, удаленные остатки и многое другое. Анализ остатков и выбросов может быть проведен при помощи широкого набора графиков, включая разнообразные точечные графики, графики частичных корреляций и многие другие. Система прогноза позволяет пользователю выполнять анализ «что - если». Допускаются чрезвычайно большие регрессионные задачи (до 300 переменных в процедуре разведочной регрессии).
1.1 Создание электронной таблицы с исходными данными
Исходные данные в системе STATISTICA организованы в виде таблицы. Электронная таблица в STATISTICA состоит из строк и столбцов. Столбцы таблицы называются Variables (Vars) — Переменные (зависимая и независимые), а строки Cases — Случаи. В качестве переменных выступают исследуемые величины, а случаи — это значения, которые принимают переменные и которые измеряются в процессе наблюдения.
Ввод данных в таблицу может быть осуществлен автоматически при открытии файла:File – Open Data… (рисунок 1.2) или путем ввода с клавиатуры с помощью меню File – New Data…, где число случаев и переменных задается с помощью клавиш или меню Edit - Vars/Cases.
**
Рисунок 1.2. Открытие файла в окне Открыть файл данных
Чтобы поменять названия переменной (VAR1 и т.д.), необходимо сначала выделить столбец значений этой переменной (или просто нажать на ячейку с названием переменной), а потом в верхней панели инструментов выбрать кнопку, затем – опцию Current Specs… и в появившемся окне в поле Name написать нужное название.
Переменные в электронной таблице могут принимать как текстовые, так и численные значения. Текстовые значения вводятся аналогично численным. Необходимо поместить указатель на ячейку в таблице, щелкнуть левой кнопкой мыши и ввести требуемое значение с клавиатуры.Для переменных, которые принимают текстовые значения в STATISTICA, используется так называемое соглашение "двойной записи", при котором каждому текстовому значению приписывается некоторый численный эквивалент. Для просмотра переменных, принимающих текстовые значения, переключитесь в режим просмотра текстовых значений при помощи кнопки на панели инструментов электронной таблицы. Нажав кнопку Менеджера текстовых значений (рисунок 1.3), вы увидите численные эквиваленты соответствующих текстовых значений.
**
Рисунок 1.3. Менеджер текстовых значений
Кроме значений переменных, таблица может содержать дополнительную информацию (название таблицы, комментарии об источнике данных и т. д.), которая вводится в специальное окно при нажатии клавиши или при выборе пункта менюEdit – Workbook/Headers…
**
Рисунок 1.4. Файл, содержащий дополнительную информацию о данных