- •Методические указания и порядок выполнения лабораторной работы «Элементы первичной обработки данных»
- •Краткие теоретические сведения
- •Порядок выполнения лабораторной работы
- •Визуализация.
- •Scatterplots- Графики рассеяния
- •Оценка однородности данных.
- •Содержание отчета.
- •Контрольные вопросы.
- •Самостоятельная работа.
- •Список рекомендованной литературы
Порядок выполнения лабораторной работы
Запустите программу STATISTICA V.6.0.
Откройте файл исходных данных, который использовался в предыдущих лабораторных работах.
Визуализация.
Откройте выпадающее меню Graphs (Графики)и изучите перечень графиков, которые могут быть построены с помощью программыSTATISTICA6.0:
2D Graphs - 2D Графики
3D Sequential Graphs - 3D Последовательные графики
3D XYZ Graphs - 3D XYZ графики
Matrix Plots - Матричные графики
Icon Plots - Графики значка…
Categorized Graphs - Категоризированные графики
User-Defined Graphs - Определенные пользователем графики
Graphs of Block Data - Графики данных блока
Graphs of Input Data - Графики входных данных
Multiple Graphs Layouts - Множественные слои графика
Выберите пункт меню 2D Графики (2D Graphs). При этом откроется дополнительное меню, в котором появится следующий список графиков.
Histogram - Гистограммы
Scatterplots- Графики рассеяния
Means w/Error Plots - Средства с ошибками графика
Box Plots - Графики блока
Range Plots - Диапазон графиков
Scatter Icon Plots - Рассеивание значка графиков
Scatter Image Plots - Рассеивание изображения графиков
Scaterplots w/Histograms - Графики рассеяния с гистограммами
Scaterplots w/Box Plots - Графики рассеяния с графиками бокса
Normal Probability Plots - Нормальные графики вероятности
Quantile-Quantile Plots - Графики квантили-квантили
Probability-Probability Plots - Графики вероятности-вероятности
Bar/Column Plots - Графики Строки/Столбца
Line Plots(Variables) - Графики линии (Переменные)
Line Plots(Case Profiles) - Графики линии (Профили регистра)
Sequential/Stacked - Последовательный/Стыковочный
Pie Charts - Смешанные графики
Missing/Range Data Plots - Пропуски/Расположение данных графиков
Custom Function Plots - Выборочные функции графиков
Выберите из дополнительного меню пункт Графики рассеяния (Scatterplots).
В открывшемся окне 2D Графики рассеяния (2D Scatterplots)нажмите кнопкуПеременные (Variables).
При этом откроется окно выбора переменных:
Для анализа выберите две наиболее информативные переменные из массива данных. Нажмите Ок.
Перейдите на вкладку Дополнительно (Advanced). Перед Вами появится окно с установками:
Установочные опции этого окна перечислены в таблице.
Название |
Название | ||
Английское |
Русское |
Английское |
Русское |
Type Graph |
Тип графика |
Fit |
Подгонка |
Regular |
Простой |
Off |
Нет |
Multiple |
Составной |
Linear |
Линейная |
Double-Y |
С двойной осью |
Polynomial |
Полиномиальная |
Frequency |
Частоты |
Logarithmic |
Логарифмическая |
Bubble |
Пузырьки |
Exponential |
Экспоненциальная |
Quantile |
Квантили |
Distance Weighted LS |
Взвешенные расстояния |
Voronoi |
Диаграммы Вороного |
Neg Expon Weighted LS |
Отрицательн. экспоненц.-взвеш. |
|
Spline |
Сплайны | |
Lowess |
Взвешенные лин. расстояния |
В открытом окне 2D Графики рассеяния (2D Scatterplots) сделайте следующие установки:
Подгонка (Fit) – отметьте опцию –Линейная (Linear);
Тип Графика (Graph Type) – отметьте опцию –Простой (Regular).
Нажмите ОK, после чего на экране появится диаграмма рассеяния с графиком линейной регрессии.
Внимательно изучите график. Качественно оцените по графику взаимосвязь переменных. Графически изучите данные на однородность. Оцените, насколько хорошо линейная зависимость аппроксимирует исходные данные. В случае если точки отражают какую-то нелинейную зависимость, вернитесь в окно 2D Графики рассеяния (2D Scatterplots) и попробуйте подобрать логарифмическую, экспоненциальную, полиномиальную зависимость и т.д. Остановитесь на наиболее оптимальной зависимости.
Изучите графические данные на наличие выбросов – резко выделяющихся наблюдений, т.е. данных которые сильно удалены от аппроксимирующей линии. При наличии таких точек, используйте инструмент Кисть (Brushing), который находится в основном меню(вкладка Вид(View)).
Посмотрите внимательно на неё. Обратите внимание на группу опций, объединённых заголовком Действиe (Actions).Сделайте следующие установки на этой панели: выберите опциюВыключить - Turn OFF в группеAction (Действиe). В группе опцийКисть (Brushing) выберите опциюТочка (Point).
Далее войдите в график – щелкните просто по любой точке в его пространстве, сделав тем самым график активным, и отметьте точку, которая, с вашей точки зрения, является аномальной. Щелкните далее на кнопке Обновить (Update)на панелиКисть (Brushing). Выделенная точка будет удалена, уравнение прямой автоматически пересчитано, и вы увидите на экране новый график. Так можно последовательно удалить несколько точек.
Далее вызовите Редактор данных графиков (Graphs Data Editor), который находится в первой строке менюВид (View). Далее найдите аномальные наблюдения в появившейся таблице, которые отмечаются другим цветом. Сохраните информацию об аномальных наблюдениях для отчета. В дальнейшем аномальные наблюдения можно удалить из массива данных.
Зайдите в пункт меню Графики (Graphs). Выберите пункт2D Графики (2D Graphs). Далее в дополнительном меню выберитеГрафики линий (Переменные)–Line Plots (Variables). Линейные графики используются для визуализации данных, поэтомуесли в массиве наблюдений есть временные ряды, то следует построить графикизависимости двух выбранных переменных от времени.
В открывшемся окне зайдите на вкладку Дополнительно (Advanced). В ней отметьте опцию Тип Графика (Graph Type) –Равномерный (Regular). Далее нажмите кнопкуПеременные (Variables) и выберите переменную, для которой выполняется построение временного ряда. В полеПодгонка (Fit)выберите вид подгоночной кривой; для сильно изменяющихся временных рядов лучше использоватьСплайны (Spline).
Нажмите ОК. При этом будет построен график зависимости выбранной переменной от времени:
Аналогичное построение выполните и для другой переменной.
Изучите переменные на построенных графиках и сделайте вывод о уровне взаимосвязи двух временных рядов. Отметьте периоды, где структура рядов отличается: например, период 1 – первая переменная растет, а вторая убывает, период 2 – наоборот и т.д.
Сохраните основные построенные графики. Для сохранения воспользуйтесь кнопкой Сохранить файлна панели инструментов или выберите пунктСохранить(Save)из основного менюФайл (File). Графические файлы системы STATISTICAV.6.0 (с расширением *.stg) используют свой графический формат, который сохраняет все сделанные настройки. Поэтому после открытия графического файла его настройку можно продолжить с того самого места, где она была прекращена. Для сохранения можно также кликнуть правой кнопкой мыши на графике, после чего выбрать пунктСохранить график (Save Graph).
График может быть записан и в других форматах, таких, как МетафайлилиРастровое изображение.
В формате Растрового изображенияграфик представляется в виде последовательности точек, поэтому редактировать его заголовки или условные обозначения будет невозможно.
Формат МетафайлаWindowsсохраняет некоторую «структурную» информацию о графике (текст, обозначения и др.), и его можно редактировать в некоторых других приложениях.