Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка моделирование.doc
Скачиваний:
4
Добавлен:
24.11.2019
Размер:
874.5 Кб
Скачать

4 Лабораторная работа №4

Модель взаимодействия показателей объекта

4.1 Анализ диаграмм рассеяния

Из курса «Математические методы в геологии и экологии» известно, что при изучении взаимосвязей показателей анализируются форма, характер и теснота связи. В наглядном виде их можно определить по диаграммам рассеивания. Такая визуальная оценка может быть рекомендована в большинстве случаев в качестве предварительного этапа анализа любых связей.

Диаграмму рассеивания нужно анализировать на предмет наличия:

  • многомерных выбросов - наблюдений, которые отличаются от остального массива необычным сочетанием значений. Очень часто такие выбросы представляют самостоятельный интерес (если они не результат ошибок анализа или ввода данных).

  • наличие четко различимых групп наблюдений, которые могут представлять собой различные типы или классы испытуемых.

  • формы и различного характера статистической связи между изучаемыми признаками.

На простейшей двумерной диаграмме рассеивания значения первого признака откладываются по оси X, значения второго - по оси Y. Наблюдения представляются на таком графике в виде точек, расположенных на плоскости. Пара значений по переменным представляет собой координаты отдельного наблюдения. В качестве данных будут использованы пары показателей, записанные в ваших файлах данных. Для вызова процедуры построения диаграммы в программе SPSS выберите в главном меню последовательность команд Graph | Scatter. На экране появится диалоговое окно для выбора типа диаграммы. Щелкните по пункту Simple (простая двумерная диаграмма), а затем по кнопке Define (задать). В появившемся диалоговом окне:

  • В поле Y Axis (ось Y) поместите имя переменной, которая будет откладываться по вертикальной оси

  • В поле X Axis (ось X) перенесите переменную, которая будет откладываться по горизонтальной оси.

  • В поле Set markers by ("установить вид точки на графике в зависимости от") перенесите переменную, которая задает разбиение выборки испытуемых на подгруппы - например, различные породы на площади объекта или геохимическую специализацию.

  • В поле Label Cases by ("брать метки испытуемых из") перенесите название (Name) столбца с номерами точек наблюдения и щелкните кнопку OK.

Программа SPSS в соответствии с вашими установками построит диаграмму рассеивания. Поскольку наблюдений в файле достаточно много, отдельные метки будут нечитабельными. Прочесть номера наблюдений удастся только для точек, располагающихся в стороне от общей массы данных. Зафиксируйте их для себя и постарайтесь на основании своих представлений о данном объекте объяснить их необычное расположение на диаграмме.

Затем щелкните по кнопке Edit (редактировать), которая располагается на рамке окна с графиком. После этого SPSS помещает наш график в специальный редактор и выводит новое меню и панель инструментов, которые предназначены для видоизменения диаграммы. Выберите в главном меню последовательность команд Chart | Options. На экране появится диалоговое окно установки параметров графика. Отключите вывод номеров наблюдений, деактивировав флажок Label cases и нажмите кнопку OK. Поскольку теперь они не выводятся на график, можно рассмотреть взаимное расположение точек, принадлежащих различным группам. Замечаете ли вы какие-либо интересные закономерности? Возможно, наблюдения группируются в различных частях графика, или образуют отчетливые конфигурации, или выбросы в основном состоящие из представителей одной подгруппы. Все это надо объяснить с позиций эколого-геологических характеристик изучаемого объекта.

Вновь выберите Chart | Options и теперь отключите вывод подгрупп (снимите флажок Show subgroups) и установите вывод лепестков вокруг точек, где находится одновременно несколько наблюдений (Show sunflowers). Теперь на графике более отчетливо видно, где скапливается наибольшее число наблюдений. Обратите внимание на то, существуют ли на графике несколько четко отделимых друг от друга скоплений. Если это так, попытайтесь определить, какие именно наблюдения принадлежит к этим скоплениям. Возможно, вам удастся обнаружить различные типы загрязнения, пород, их петрографической или геохимической специализации.

Опять выберите Chart | Options и на этот раз установите флажки Fit line: Total и Subgroups. Это приведет к выводу на график трех прямых линий (по умолчанию пакет настроен на подгонку прямолинейных закономерностей). Что можно сказать по поводу связи наших переменных? Образует ли облако точек какую-либо интересную конфигурацию - вытянуто ли оно, располагаются ли точки вдоль известных нелинейных кривых (парабола, гипербола) и т.п. Как соотносятся между собой прямые линии, обобщающие связь переменных по выборке в целом и в отдельных подгруппах - совпадают по внешнему виду или существуют бросающиеся в глаза резкие различия? Как вы можете их объяснить?

Если соотношение между переменными носит нелинейный характер, попытайтесь подобрать не прямую линию, а какой-то иной закон связи. Для этого в диалоговом окне установки опций графика щелкните кнопку Fit options (опции подгонки) и попробуйте различные кривые - квадратические или кубические. Заодно установите флажок Display R-squared in legend (показывать в пояснении к графику долю объясненной вариации зависимой переменной Y). Это число показывает, насколько хорошо подгоняемая линия (модель) соответствует данным. Чем ближе значение R к единице, тем лучше модель описывает данные. Поэкспериментируйте с различными кривыми и посмотрите, какие из них лучше годятся для принятия модели изучаемого объекта по имеющимся исходным данным.