Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методички / Методичка по Statistica 5.doc
Скачиваний:
58
Добавлен:
25.05.2014
Размер:
146.43 Кб
Скачать

1 Множественная регрессия

Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между некоторыми наблюдаемыми переменными. Регрессионный анализ предназначен для изучения связей между одной зависимой (Y) и несколькими независимыми переменными (Xi, i=1,..,m) по результатам наблюдений.

В этих обозначениях задача может быть сформулирована следующим образом:

Y = X + ,

где  есть независимые случайные ошибки со средним 0, которые интерпретируются как ошибки наблюдений, а  — вектор неизвестных параметров, которые необходимо оценить. Оценки параметров  будем обозначать через b.

Если вы хотите построить зависимости между многомерными переменными, подобрать простую линейную модель и оценить ее адекватность, воспользуйтесь модулем Multiple Regression – Множественная регрессия в ППП STATISTICA. Для этого в переключателе модулей (см. рисунок 2) подведите указатель мыши к строке Multiple Regression и дважды щелкните левой кнопкой мыши, откроется основное окно системы STATISTICA:

**

Рисунок 1.1. Основное окно модуля Множественной регрессии.

Модуль Множественной регрессии включает в себя исчерпывающий набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессии, включая пошаговые, иерархические и другие методы.

Система STATISTICA позволяет вычислить всесторонний набор статистик и расширенной диагностики, включая полную регрессионную таблицу, частные и частичные корреляции и ковариации для регрессионных весов, матрицы прогонки, статистику Дурбина-Ватсона, расстояния Махаланобиса и Кука, удаленные остатки и многое другое. Анализ остатков и выбросов может быть проведен при помощи широкого набора графиков, включая разнообразные точечные графики, графики частичных корреляций и многие другие. Система прогноза позволяет пользователю выполнять анализ «что - если». Допускаются чрезвычайно большие регрессионные задачи (до 300 переменных в процедуре разведочной регрессии).

1.1 Создание электронной таблицы с исходными данными

Исходные данные в системе STATISTICA организованы в виде таблицы. Электронная таблица в STATISTICA состоит из строк и столбцов. Столбцы таблицы называются Variables (Vars) — Переменные (зависимая и независимые), а строки Cases — Случаи. В качестве переменных выступают исследуемые величины, а случаи — это значения, которые принимают переменные и которые измеряются в процессе наблюдения.

Ввод данных в таблицу может быть осуществлен автоматически при открытии файла:FileOpen Data (рисунок 1.2) или путем ввода с клавиатуры с помощью меню FileNew Data, где число случаев и переменных задается с помощью клавиш или меню Edit - Vars/Cases.

**

Рисунок 1.2. Открытие файла в окне Открыть файл данных

Чтобы поменять названия переменной (VAR1 и т.д.), необходимо сначала выделить столбец значений этой переменной (или просто нажать на ячейку с названием переменной), а потом в верхней панели инструментов выбрать кнопку, затем – опцию Current Specs и в появившемся окне в поле Name написать нужное название.

Переменные в электронной таблице могут принимать как текстовые, так и численные значения. Текстовые значения вводятся аналогично численным. Необходимо поместить указатель на ячейку в таблице, щелкнуть левой кнопкой мыши и ввести требуемое значение с клавиатуры.Для переменных, которые принимают текстовые значения в STATISTICA, используется так называемое соглашение "двойной записи", при котором каждому текстовому значению приписывается некоторый численный эквивалент. Для просмотра переменных, принимающих текстовые значения, переключитесь в режим просмотра текстовых значений при помощи кнопки на панели инструментов электронной таблицы. Нажав кнопку Менеджера текстовых значений (рисунок 1.3), вы увидите численные эквиваленты соответствующих текстовых значений.

**

Рисунок 1.3. Менеджер текстовых значений

Кроме значений переменных, таблица может содержать дополнительную информацию (название таблицы, комментарии об источнике данных и т. д.), которая вводится в специальное окно при нажатии клавиши или при выборе пункта менюEdit – Workbook/Headers…

**

Рисунок 1.4. Файл, содержащий дополнительную информацию о данных

Соседние файлы в папке методички