Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
PMCCmetod14.doc
Скачиваний:
6
Добавлен:
08.02.2015
Размер:
167.94 Кб
Скачать

Задание.

Проверить наличие аномальных наблюдений и соответствие данных нормальному распределению с помощью нанесения данных на вероятностную бумагу. Исключить аномальные наблюдения.

Построить предположения о зависимости между переменными в модели по диаграмме рассеяния для двух переменных:

  • аппроксимировать данные наблюдений на диаграмме рассеяния с помощью предлагаемых системой стандартных зависимостей - линейной, логариф­мической, экспоненциальной и т.д., а также полиномиальной;

  • подобрать преобразование данных таким образом, чтобы преобразованные данные были связаны линейной зависимостью;

  • оценить визуально по графикам качество построенных моделей с помощью доверительных интервалов.

  • Сформулировать предположения относительно вида функции связи между наблюдаемыми переменными.

Исходные данные выбираются соответственно номеру варианта в табличном виде или в файле с именем lab2_vi.sta (где i- номер варианта) в директории VAR_LAB2.

Указания по выполнению работы.

Первичная обработка данных наблюдений.

1) Проверить наличие аномальных наблюдений и соответствие данных нормальному распределению с помощью нанесения данных на вероятностную бумагу (функция Probability Plots) - нормальную (Normal) при наличии возможности отклонения в обе стороны и h-нормальную (Half Normal) при наличии возможности отклонения только в одну сторону. Координаты каждой точки на графике можно посмотреть в левом окне на панели инструментов, если указать стрелкой мыши на эту точку.

2) Выявить аномальные наблюдения. При анализе данных по графику удобно воспользоваться инструментом, называемым Кисть. Он может быть вызван из меню Edit с помощью команды Brushing Mode или с помощью кнопки с картинкой в виде "прицела" на панели инструментов. C помощью мыши можно выделить интересующие нас точки. В диалоговом окне кисти Brushing в рамке Action можно задать следующие операции для выбранных точек: Mark - маркировка, отображение другим способом; Label - отметить номера случаев, Turn OFF - временно исключить выбранные точки из процесса анализа, при этом график будет перерисован. Любая из операций выполняется после нажатия кнопки Update. С помощью Кисти удобно выявлять аномальные наблюдения и проверять, что будет, если мы уберем эти данные, не трогая основной таблицы наблюдений.

3) После того, как будет принято решение об исключении конкретных наблюдений из дальнейшей работы, переключиться на таблицу исходных данных и исключить эти наблюдения из таблицы. Можно воспользоваться кнопкой Cases на панели инструментов, выбрав затем функцию Delete в открывшемся меню. Удалится вся строка таблицы, и число наблюдений уменьшится на единицу. Если мы не хотим удалять всю строку, то выделяем ячейку таблицы с аномальным наблюдением и удаляем ее с помощью кнопки Delete на клавиатуре. Теперь содержимое этой ячейки будет считаться пропущенным наблюдением.

Исправленные данные записать в новый файл (File -> Save as). Далее следует работать с этим файлом, сохранив старый набор данных.

Нелинейная модель для двух переменных.

Для построения модели зависимости между двумя переменными необходимо построить диаграмму рассеяния, чтобы определить вид зависимости между переменными y=f(x).

4) Сначала следует попытаться подогнать данные наблюдений на диаграмме рассеяния соответствующим нелинейным соотношением из зависимостей, предлагаемых в окне FIT функции Scatterplots: линейная, логариф­мическая, экспоненциальная и т.д., кроме полиномиальной.

5) Затем следует подогнать данные наблюдений соответствующим полиномиальным соотношением. По виду диаграммы рассеяния подобрать степень аппроксимирующего полинома. В окне построения диаграммы рассеяния задать соответствующую степень (от 2 до 5) нажав кнопку Options, а затем в окне Polinomial FIT отметить нужный порядок (Order) полинома. Рассмотреть аппроксимацию диаграммы рассеяния полиномами разной степени и сравнить результаты.

6) На основании результатов исследования, проведенного в предыдущих пунктах, подобрать преобразование данных таким образом, чтобы преобразованные данные были связаны линейной зависимостью. Для выбора преобразования использовать графики зависимостей из лекций [2]. Для того чтобы выполнить преобразование данных по какой-либо переменной, необходимо дважды щелкнуть мышью на клетке таблицы, содержащей имя переменной. Появится окно, например Variable1 для первой переменной. Внутри его есть окно Long name, в котором можно указать дополнительную информацию о данной переменной, в частности формулу преобразования данных, например, [=log(v1)]. Значения переменных в таблице данных обозначаются как v1, v2, и так далее. Преобразованные данные записать в таблицу исходных данных, добавив к ней новые столбцы и записав в них данные после преобразования.

7) Для преобразованных данных построить диаграмму рассеяния. Она должна соответствовать линейной зависимости между переменными.

8) Оценить в первом приближении (визуально по графикам) качество моделей, построенных в предыдущих пунктах. Для этого при построении аппроксимирующей зависимости посмотреть доверительные интервалы, отметив в окне CONFIDENS BAND режим On и выбрав доверительную вероятность (Level) в пределах 0.95-0.99. Поскольку в режиме построения и аппроксимации диаграммы рассеяния доверительные интервалы строятся только для линейной и полиномиальной зависимости, для других зависимостей сначала преобразовать данные к линейной модели, а затем строить доверительные интервалы.

9) Сравнить разные модели по числу точек, не попавших в доверительный интервал. Если все точки попадают, увеличить доверительную вероятность. Сделать выводы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]