- •Содержание
- •Статистический анализ данных в системе statistica может быть разбит на следующие основные этапы:
- •1 Множественная регрессия
- •1.1 Создание электронной таблицы с исходными данными
- •1.2 Вызов стартовой панели модуля и определение режимов исследования
- •1.3 Построение и оценивание уравнения множественной регрессии
- •1.3.1 Проведение анализа множественной регрессии исследователем
- •1.3.2 Проведение автоматического анализа множественной регрессии
- •1.4 Визуализация данных и результатов
- •Замечание
- •1.5 Исследование остатков
- •1.6 Вывод результатов анализа в файл с отчетом
- •Список литературы
1 Множественная регрессия
Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между некоторыми наблюдаемыми переменными. Регрессионный анализ предназначен для изучения связей между одной зависимой (Y) и несколькими независимыми переменными (Xi, i=1,..,m) по результатам наблюдений.
В этих обозначениях задача может быть сформулирована следующим образом:
Y = X + ,
где есть независимые случайные ошибки со средним 0, которые интерпретируются как ошибки наблюдений, а — вектор неизвестных параметров, которые необходимо оценить. Оценки параметров будем обозначать через b.
Если вы хотите построить зависимости между многомерными переменными, подобрать простую линейную модель и оценить ее адекватность, воспользуйтесь модулем Multiple Regression – Множественная регрессия в ППП STATISTICA. Для этого в переключателе модулей (см. рисунок 2) подведите указатель мыши к строке Multiple Regression и дважды щелкните левой кнопкой мыши, откроется основное окно системы STATISTICA:
**
Рисунок 1.1. Основное окно модуля Множественной регрессии.
Модуль Множественной регрессии включает в себя исчерпывающий набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессии, включая пошаговые, иерархические и другие методы.
Система STATISTICA позволяет вычислить всесторонний набор статистик и расширенной диагностики, включая полную регрессионную таблицу, частные и частичные корреляции и ковариации для регрессионных весов, матрицы прогонки, статистику Дурбина-Ватсона, расстояния Махаланобиса и Кука, удаленные остатки и многое другое. Анализ остатков и выбросов может быть проведен при помощи широкого набора графиков, включая разнообразные точечные графики, графики частичных корреляций и многие другие. Система прогноза позволяет пользователю выполнять анализ «что - если». Допускаются чрезвычайно большие регрессионные задачи (до 300 переменных в процедуре разведочной регрессии).
1.1 Создание электронной таблицы с исходными данными
Исходные данные в системе STATISTICA организованы в виде таблицы. Электронная таблица в STATISTICA состоит из строк и столбцов. Столбцы таблицы называются Variables (Vars) — Переменные (зависимая и независимые), а строки Cases — Случаи. В качестве переменных выступают исследуемые величины, а случаи — это значения, которые принимают переменные и которые измеряются в процессе наблюдения.
В![]()
вод
данных в таблицу может быть осуществлен
автоматически при открытии файла:File
– Open
Data…
(рисунок
1.2) или путем
ввода с клавиатуры с помощью меню File
– New
Data…,
где число случаев и переменных задается
с помощью клавиш или меню Edit
-
Vars/Cases.
**
Рисунок 1.2. Открытие файла в окне Открыть файл данных
Ч
тобы
поменять названия переменной (VAR1
и т.д.), необходимо сначала выделить
столбец значений этой переменной (или
просто нажать на ячейку с названием
переменной), а потом в верхней панели
инструментов выбрать кнопку, затем –
опцию Current
Specs…
и в появившемся окне в поле Name
написать
нужное название.
Переменные
в электронной таблице могут принимать
как текстовые, так и численные значения.
Текстовые значения вводятся аналогично
численным. Необходимо поместить указатель
на ячейку в таблице, щелкнуть левой
кнопкой мыши и ввести требуемое значение
с клавиатуры.Для
переменных, которые принимают текстовые
значения в STATISTICA,
используется так называемое соглашение
"двойной записи", при котором
каждому текстовому значению приписывается
некоторый численный эквивалент. Для
просмотра переменных, принимающих
текстовые значения, переключитесь в
режим просмотра т
екстовых
значений при помощи кнопки на панели
инструментов э
лектронной
таблицы. Нажав кнопку
Менеджера
текстовых значений
(рисунок
1.3),
вы увидите численные эквиваленты
соответствующих текстовых значений.
**
Рисунок 1.3. Менеджер текстовых значений
К
роме
значений переменных, таблица может
содержать дополнительную информацию
(название таблицы, комментарии об
источнике данных и т. д.), которая вводится
в специальное окно при нажатии клавиши
или при выборе пункта менюEdit
– Workbook/Headers…
**
Рисунок 1.4. Файл, содержащий дополнительную информацию о данных
