- •1. Вводные примеры
- •1.1. Введение
- •Основная цель раздела
- •Основные шаги обработки данных в системе
- •1.2. Обработка данных в рамках линейной регрессионной модели
- •1.2.1. Линейная регрессия. Подбор прямой Формулировка задачи
- •Математическая постановка задачи
- •Запуск statistica
- •Выбор статистического модуля
- •Создание электронной таблицы с исходными данными
- •Ввод исходных данных и дополнительной информации
- •Преобразование исходных данных
- •Визуализация данных
- •Замечание
- •Вызов стартовой панели модуля и определение анализа
- •Выбор переменных для анализа
- •Задание дополнительных параметров анализа
- •Вывод результатов и их анализ
- •Информационная часть
- •Функциональные кнопки
- •Замечание
- •Исследование остатков
- •Замечание.
- •Вывод результатов анализа в файл с отчетом
- •2. Створити таблиці
Запуск statistica
Запустите Windows. Нажмите кнопку Пуск и в меню Программы выберите папку, которая содержит систему STATISTICA. В этой папке выберите ярлык программы STATISTICA и дважды щелкните на нем мышью.
Рисунок 2.3. Запуск системы STATISTICA
Выбор статистического модуля
После запуска программы на экране появится Переключатель модулей — Module Switcher, при помощи которого можно выбрать необходимый для работы модуль. Выберите модуль Множественная регрессия — Multiple Regression. Для этого подведите указатель мыши к названию этого модуля и дважды щелкните левой кнопкой мыши.
Рисунок 2.4 Переключатель модулей позврляет быстро выбрать необходимый модуль
После запуска модуля на экране откроется основное окно системы STATISTICA. При запуске системы в нее автоматически загружается последний файл, с которым вы работали в ней. Если вы запускаете STATISTICA первый раз, то по умолчанию в ней открывается файл с исходными данными, который называется Adstudy.sta. Одновременно с этим появляется Стартовая панель модуля, содержащая основные операции, которые доступны в запущенном модуле и которая позволяет определить различные параметры анализа. Стартовая панель позволяет вам открыть необходимый файл данных для анализа, приписать веса переменным, выбрать необходимое подмножество случаев для анализа (если требуется) и выбрать переменные для анализа (зависимую и независимые переменные в нашем случае). Напомним, что в STATISTICA реализован принцип постоянной логической подсказки. Если вы не знаете, что нужно делать на следующем шаге обработки, то просто нажмите на клавишу ENTER. STATISTICA сама отправит вас к нужному диалоговому окну. Например, если вы не выбрали переменные для анализа, то откроется диалоговое окно выбора переменных, в котором вам будет предложено эти переменные выбрать, если вы не задали значения каких-либо параметров, то они будут заданы по умолчанию и т. д.
Рисунок 2.5 Основное окно модуля Множественной регрессии. На рабочем пространстве открыт файл с данными и стартовая панель
Создание электронной таблицы с исходными данными
Исходные данные в системе STATISTICA организованы в виде таблицы. Большинство реальных данных могут быть структурированы в табличную форму.. Электронная таблица в STATISTICA состоит из строк и столбцов. Столбцы таблицы называются Variables — Переменные, а строки Cases — Случаи. В качестве переменных выступают исследуемые величины, а случаи — это значения, которые принимают переменные и которые измеряются в процессе наблюдения. В нашем примере в качестве переменных могут естественно выступать Год закладки вина и его Цена на аукционе.
Ввод исходных данных и дополнительной информации
Переменные в электронной таблице могут принимать как текстовые, так и численные значения. Электронная таблица с данными из нашего примера приведена на рисунке 2.6, В первом столбце содержится переменная Год (год закладки), во втором — переменная Цена — цена бутылки (в долларах). Кроме значений переменных, таблица может содержать дополнительную информацию (название таблицы, комментарии об источнике данных и т. д.).
Рисунок 2.6 Исходный файл с данными содержит значение переменных и дополнительную информацию о данных
Перед непосредственным применением той или иной статистической процедуры часто возникает необходимость преобразования данных. Так, например, может потребоваться вычислить Возраст (выдержку) вина, которая определяется как разность года аукциона (1972) и года закладки вина.
