Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
PMCCmetod14.doc
Скачиваний:
4
Добавлен:
08.02.2015
Размер:
167.94 Кб
Скачать

Отчет о работе №2.

Отчет о работе должен содержать следующие результаты:

  • таблицы исходных данных и данных, полученных в результате преобразования,

  • графики на вероятностной бумаге с выделенными аномальными наблюдениями и те же графики после удаления аномальных наблюдений,

  • графики диаграмм рассеяния, с выводами по каждому графику,

  • предположения о типе функции связи между переменными, сделанные по результатам работы.

3. Лабораторная работа №3. Построение и анализ модели множественной регрессии.

Цель работы: По результатам наблюдений над несколькими переменными построить модель множест­венной линейной регрессии и показать ее адекватность данным наблюдений.

Задание.

Выполнить первичный статистический анализ данных наблюдений. На этом этапе выполнить визуальный (по графикам) анализ данных с целью выявления и исключения аномальных наблюдений. Рассчитать основные статистические характеристики и корреляционную матрицу.

Построить и исследовать модель множественной регрессии. Исследовать значимость различных переменных, включаемых в модель и характер зависимости (линейный или нелинейный) между переменными путем включения в модель квадратов переменных и, при необходимости, более высокие степени переменных. Выбрать среди различных вариантов модели наилучшую и обосновать свой выбор.

Доказать адекватность построенной модели. Для этого выполнить анализ остатков модели, включающий проверку предположений об их нормальном распределении, независимости друг от друга и значений переменных, как наблюдаемых, так и предсказанных по модели. Оценить качество предсказания по диаграмме рассеяния. Провести дисперсионный анализ остатков модели и рассчитать статистику Дарбина-Уотсона. Сделать выводы по полученным результатам.

Если построенная модель не соответствует данным наблюдений, найти причину этого несоответствия, устранить ее, построить новую модель и доказать ее адекватность.

Исходные данные выбираются соответственно номеру варианта в табличном виде или в файле с именем Var3i.sta (где i- номер варианта) в директории Var_kur5 для версии 5.0 или директории Var_kur4 для предыдущих версий.

Указания по выполнению работы.

Для выполнения данной работы необходимо при обращении к системе STATISTICA выбрать модуль Multiple Regression путем переключения на этот модуль на стартовой панели, которая появляется при загрузке системы или с помощью функции Startup Panel в меню Analysis.

Часть 1. Первичная статистическая обработка.

1) В первую очередь выполняется анализ и исключение аномальных наблюдений. Используем визуальные графические методы.

Представление о значениях и распределении переменных можно получить с помощью графика, называемого Box&Whiskers - "ящик с усами". Для этого в меню двумерных графиков выбираем Box Plots, и в открывшемся окне выбираем тип графика Graph Type: Box-Whiskers. Нажимаем кнопку Multiple, чтобы все графики вывелись на одном рисунке.

График для каждой переменной представляет собой "ящик" вокруг средней точки распределения (среднего выборки или ее медианы), куда попадает основная масса точек выборки в соответствии с заданным критерием (заданный процент попадания точек, стандартная ошибка, стандартное отклонение, ...). Вокруг "ящика" рисуются "усы", определяющие разброс минимума и максимума представительной части выборки. Отмечаются допол­нительно значения выделяющиеся (Outliers - не попавшие в “ящик”) и экстремальные (Extremal - выходящие за “усы”), если такие имеются. Последние исключаются сразу, первые нуждаются в дополнительном анализе их пригодности.

Исследовать выборки по всем переменным на наличие особых точек для графика вокруг среднего (Middle Point) с шириной ящика, равной стандартной ошибке (Std Err) и "усами", равными стандартному отклонению (Std Dev).

2) Проверить наличие отклонений с помощью графиков на вероятностной бумаге (функция Probability Plots) (см. лабо­раторную работу №2).

C помощью Кисти выделить "подозрительные" точки, маркировать, отметить номера случаев, и перерисовать графики, временно исключив выбранные точки. Проанализировать результаты.

Если будет принято решение об исключении конкретных наблюдений из дальнейшей работы, исключить их из исходной таблицы. Записать исправленные данные в новый файл и далее работать с ним.

3) Составить таблицу основных статистических характеристик для всех переменных из таблицы наблюдений сразу. В разделе Analysis главного меню выбираем функцию Quick Basic Stats , а затем в открывшемся подменю - Descriptive Statistics.

4) Следующий шаг - исследование парных зависимостей между переменными. Строим сразу гистограммы и диаграммы рассеяния для всех переменных. В команде Graf главного меню выбирается функция Stats Matrix Graphs - матричная графика, а затем в окне Graph Type график Squre Scatter Matrix для всех переменных. На одном рисунке строится матрица, каждый элемент которой представляет собой график: на диагонали - гистограммы, а вне ее - диаграммы рассеяния для соответствующих зависимостей между парами переменных.

По диаграммам рассеяния определить

- для зависимой переменной: с какими из независимых переменных имеется линейная зависимость, где зависимость отсутствует (линия регрессии параллельна оси ординат), для каких зависимость может быть нелинейной;

- для независимых переменных: какие из переменных связаны между собой линейной зависимостью для анализа наличия мультиколлинеарности.

5) Рассчитать корреляционную матрицу (Correlation Matrix) В разделе Analysis главного меню выбираем функцию Quick Basic Stats , а затем в открывшемся подменю - Correlation matrices. Выбрать один полный список переменных (Variables for analyses).

Проанализировать корреляцию между зависимой переменной и всеми независимыми на предмет включения их в модель. Проанализировать корреляцию между независимыми переменными с целью выявления мультиколлинеарности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]