- •К лабораторным работам
- •Москва 2014
- •1. Основные сведения о системе statistica.
- •2. Лабораторная работа №1.
- •Задание.
- •Указания по выполнению работы.
- •Настройка файла отчета.
- •Отчет о работе №1.
- •3. Лабораторная работа №2.
- •Задание.
- •Указания по выполнению работы.
- •Отчет о работе №2.
- •3. Лабораторная работа №3. Построение и анализ модели множественной регрессии.
- •Задание.
- •Указания по выполнению работы.
- •Часть 1. Первичная статистическая обработка.
- •Часть 2. Построение модели множественной линейной регрессии.
- •Часть 3. Анализ адекватности полученной модели.
- •Отчет о работе.
- •Содержание
Методические указания
К лабораторным работам
По курсу “Регрессионные модели сложных систем”
Москва 2014
1. Основные сведения о системе statistica.
Универсальный статистический пакет STATISTICA представляет собой интегрированную систему статистического анализа и обработки данных. Пользователю предоставляется возможность провести все этапы статистического анализа, начиная от ввода исходных данных и их преобразования и заканчивая подготовкой отчета, не выходя за пределы системы.
STATISTICA является динамично развивающимся универсальным статистическим пакетом и по некоторым рейтингам [1] является лидером на рынке статистического программного обеспечения: пользователями системы являются крупнейшие университеты, исследовательские центры, компании, банки всего мира.
STATISTICA состоит из следующих основных компонент:
набора статистических модулей, в которых собраны группы логически связанных статистических процедур;
электронных таблиц для данных наблюдений и специальных таблиц для численных результатов анализа;
графической системы для представления данных и результатов анализа;
инструментария подготовки отчетов;
встроенных языков программирования, позволяющих расширить стандартные возможности системы.
Анализ данных может быть проведен в различных режимах: интерактивном, с помощью макрокоманд, в пакетном режиме с помощью встроенного командного языка.
Основная (статистическая) часть системы STATISTICA имеет модульную структуру. Каждый из 19 статистических модулей содержит группу соответствующих теме статистических процедур. Предусматривается возможность одновременного запуска нескольких модулей и использования всех основных функций (таких как электронные таблицы данных, графические процедуры) в каждом из них на любом шаге анализа. Это позволяет сравнивать и интегрировать результаты разных анализов и даже запускать их выполнение одновременно.
После запуска системы STATISTICA в интерактивном режиме на дисплее появляется стартовая панель, содержащая список всех модулей. Среди них:
Основные статистики и таблицы,
Дисперсионный анализ,
Множественная регрессия,
Управление данными,
Факторный анализ,
Временные ряды
и другие.
В совокупности эти и другие модули системы покрывают практически весь спектр современной статистической обработки. Переключатель модулей (как и стартовая панель) выдает краткую информацию о возможностях каждого модуля.
Файлы данных STATISTICA организованы в виде случаев (Case) и переменных (Variables). Каждый случай состоит из набора значений переменных. Данные могут быть как числовыми, так и текстовыми. Текстовые в свою очередь могут иметь числовой эквивалент. Текущий файл данных всегда отображается в электронной таблице. Электронные таблицы STATISTICA поддерживают все стандартные операции, доступные, например, MS Exel, в том числе и пересчет данных по заданным формулам.
Для вывода большинства численных результатов используются так называемые таблицы Scrollsheet. Они могут содержать любую информацию от короткой строчки до мегабайтов результатов, и предлагают множество опций для облегчения просмотра результатов анализа и представления их в виде графиков.
Для наглядного представления исходных данных и результатов исследований имеется Галерея графиков STATISTICA (STATISTICA Graphs Gallery), доступная на любом этапе обработки. Она включает в себя стандартные методы графического представления необработанных данных (диаграммы рассеяния, гистограммы и т.п.), графические аналитические методы (графики доверительных интервалов регрессии, категоризированные графики нормального распределения, ...), специализированные графики статистических процедур, а также пользовательские графики, позволяющие визуализировать любую комбинацию величин из таблиц данных и результатов анализа. Имеются средства настройки и редактирования графиков.
Статистический анализ часто генерирует большое количество итоговых и промежуточных результатов. STATISTICA предлагает гибкий способ организации вывода результата независимо от его размеров. Новые таблицы и графики создаются в порядке очереди и появляются в виде каскада, где старые результаты закрываются по мере возникновения новых.
Результаты анализа могут быть направлены в файл отчета, на принтер или в окно на экране дисплея, которое может также быть переписано в файл. Встроенный текстовый редактор позволяет отредактировать файл отчета, не выходя из системы. Вся информация о файлах, связанных с конкретными данными (графики, отчеты, программы), объединяются в рабочие книги (Workbook).
Система STATISTICA имеет встроенные языки программирования:
- язык SCL управления работой системы в пакетном режиме;
- язык STATISTICA BASIC для преобразования данных наблюдений, если формул электронной таблицы недостаточно;
- язык MML для обработки данных в необычных форматах, например данных с очень большими записями.
Помимо справочной системы контекстной подсказки по всем процедурам и опциям, STATISTICA имеет специальный модуль, встроенный в справочную систему, называемый Статистическим советником (Statistical Advisor). Он задает несложные вопросы о характере стоящей проблемы и типе исходных данных, а затем выдает наиболее связанные с ними процедуры и опции, а также объяснит, как ими пользоваться (на английском языке). Например, в темах Вводного обзора (Introductory Overview) обсуждаются детальные аспекты тех или иных методов и процедур.
В процессе анализа на экране может находиться несколько окон различного типа: таблицы данных, таблицы результатов вычислений, графики, окно с файлом отчета. В зависимости от того, какое окно в данный момент является активным, появляются разные панели инструментов, предоставляющие соответствующие возможности для работы в этих окнах.