- •К лабораторным работам
- •Москва 2014
- •1. Основные сведения о системе statistica.
- •2. Лабораторная работа №1.
- •Задание.
- •Указания по выполнению работы.
- •Настройка файла отчета.
- •Отчет о работе №1.
- •3. Лабораторная работа №2.
- •Задание.
- •Указания по выполнению работы.
- •Отчет о работе №2.
- •3. Лабораторная работа №3. Построение и анализ модели множественной регрессии.
- •Задание.
- •Указания по выполнению работы.
- •Часть 1. Первичная статистическая обработка.
- •Часть 2. Построение модели множественной линейной регрессии.
- •Часть 3. Анализ адекватности полученной модели.
- •Отчет о работе.
- •Содержание
2. Лабораторная работа №1.
Цель работы: Ознакомление с системой статистической обработки данных STATISTICA на примере предварительного анализа данных наблюдений.
Задание.
Для данных наблюдений над двумя переменными провести предварительный анализ данных, включающий в себя вычисление числовых оценок основных статистических характеристик и визуальную оценку статистических характеристик результатов наблюдений по графикам. Сформулировать предположения о типе математической зависимости между переменными
В данной работе необходимо получить оценки следующих статистических характеристик для каждой наблюдаемой переменной:
математическое ожидание (среднее значение),
медиану,
стандартное отклонение (дисперсию),
вариацию,
минимальное и максимальное значения.
Визуальную оценку статистических характеристик выполнить по следующим графикам:
графики рядов наблюдений (зависимость от номера измерения).
гистограммы рядов наблюдений (частоты появления значений измерений).
диаграмма рассеяния.
По гистограммам исследовать соответствие полученных выборочных распределений стандартным распределениям, предлагаемым данной системой.
Построить диаграмму рассеяния и определить по ней тип уравнения связи между наблюдаемыми переменными.
Исходные данные выбираются соответственно номеру варианта в табличном виде или в файле с именем lab1_vi.sta (где i- номер варианта) в директории VAR_LAB1.
Указания по выполнению работы.
Для выполнения данной работы необходимо при обращении к системе STATISTICA выбрать модуль Basic Statistic/Tables - основные статистические характеристики и таблицы (первичная обработка).
Следующим этапом необходимо загрузить исходные данные, с которыми мы будем работать. Все файлы с данными должны иметь расширение .sta. Выбора данных для анализа осуществляется с помощью команды File главного меню. Если данные необходимо взять из уже существующего файла, например на дискете, используется операция Open Data. Если данные необходимо ввести из таблицы, используется операция New Data. В открывшемся окне выбирается имя нового файла, а затем данные вводятся в ячейки таблицы на экране. Добавить или удалить столбцы (переменные) из таблицы можно с помощью кнопки Vars на панели инструментов. Добавить или удалить строки (наблюдения) можно с помощью кнопки Cases.
Данные для различных примеров содержатся также в директории EXAMPLES. Заголовок таблицы, содержащий информацию о характере данных, представленных в этой таблице, можно прочитать полностью, если щелкнуть на нем дважды мышью. При желании можно поэкспериментировать также с файлами из этой директории.
Сформировав или загрузив данные наблюдений, приступаем к их анализу. Сначала исследуем по отдельности ряды наблюдений над каждой над каждой из двух переменных.
В таблице - меню или в разделе Analysis главного меню выбираем функцию Descriptive Statistics - описательная статистика.
Для выбора переменных, с которыми мы хотим работать на данном шаге, используется кнопка Variables. Переменные выбираются путем выделения с помощью мыши, можно также использовать кнопку Select All, если все переменные должны участвовать в анализе.
Вычислим сначала необходимые статистические характеристики для каждой наблюдаемой переменной. Выбрать, какие именно характеристики необходимо вычислить, можно с помощью кнопки More Statistics. В данной работе нам нужны: математическое ожидание (среднее значение) - Mean, медиану - Median, стандартное отклонение - Standard deviation, вариацию - Variance, минимальное и максимальное значения - Minimum&maximum.
На этапе предварительного анализа данных выполняется визуальная оценка статистических характеристик по графикам с целью определения основных гипотез, таких как виды функций распределения, типа уравнения связи и других. В дальнейшем эти гипотезы подвергаются формальной проверке. Построение графиков осуществляется с помощью команды Graf главного меню. В данной работе необходимо выбрать функцию Stats 2D Graphs - двумерную графику, а затем нужные типы графиков в открывшемся далее меню.
Для каждой переменной построить графики рядов наблюдений (зависимость от номера измерения) с помощью функции Line Plot.
Для каждой переменной построить гистограммы рядов наблюдений (частоты появления значений измерений) с помощью функции Histograms. Исследовать соответствие стандартным распределениям из заданного набора, выбирая в окне Fit Tape тип распределения для аппроксимации построенной гистограммы. Сделать выводы о предполагаемом соответствии данных какому-либо из стандартных распределений (или отсутствию такового).
Далее осуществляем совместную обработку наблюдений над обоими переменными с целью исследования типа уравнения связи между ними. Для этого необходимо построить диаграмму рассеяния.
В команде Graf главного меню выбирается сначала функция Stats 2D Graphs, а затем функция Scatterplots – диаграмма рассеяния. По построенному графику исследовать вид функции связи между переменными y=f(x) по предлагаемым зависимостям. Вид зависимости выбирается в окне FIT функции Scatterplots: линейная, полиномиальная, логарифмическая, экспоненциальная и т.д. Для проверки соответствия данных выбранной зависимости построить доверительные интервалы (коридор), нажав в окне CONFIDENCE BANDS кнопку On . Уровень значимости Level выбрать в интервале 0.95 – 0.99.