Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка моделирование.doc
Скачиваний:
4
Добавлен:
24.11.2019
Размер:
874.5 Кб
Скачать

3. Лабораторная работа №3

Дисперсионная модель объекта

Дисперсионный анализ - это статистический метод исследования выборочных данных, который проводится с целью выявления и оценки степени влияния на изучаемую случайную величину (геолого-экологический показатель) различных одновременно действующих геологических факторов. В основе дисперсионного анализа лежит такое разложение общей изменчивости выборочных данных, при котором удается отделить изменчивость, связанную с некоторыми фиксируемыми, замеряемыми исследователем факторами, от изменчивости неконтролируемой в данном эксперименте. Задачей дисперсионного анализа является доказательство существенности влияния изучаемых факторов на геологический показатель (случайную величину). Решение о влиянии определенного фактора или группы факторов на изменчивость изучаемого показателя основано на группировке его замеров по факторам и их уровням, проверке гипотезы о статистически незначимом различии между дисперсией, обусловленной проверяемыми факторами, и остаточной (случайной) дисперсией, вызванной неучтенными факторами. Если гипотеза отвергается, то делается вывод о том, что данный фактор оказывает существенное влияние на изменение изучаемого свойства геологического объекта.

В зависимости от количества учитываемых факторов различают однофакторный, двухфакторный и многофакторный дисперсионный анализ. Каждый фактор представляет собой переменную величину, значения которой задаются несколькими точечными (дискретный фактор) либо интервальными (непрерывный фактор) значениями и называются уровнями факторов. Они обозначаются 1, 2, 3 и т.д., в зависимости от известного числа уровней изменения фактора.

Например, задача сравнения средних для нескольких эколого-геологических объектов возникает очень часто: при выборе наиболее перспективных залежей для первоочередной отработки месторождения или выделении загрязненных и наиболее опасных участков территории. Её решают с помощью дисперсионного анализа. В таких случаях мы предполагаем влияние какого-то фактора (независимая переменная) на распределение интересующего нас показателя (содержание полезного компонента или токсичного элемента), называемого зависимой переменной (откликом). Затем определяют значения фактора (уровни фактора), которые наблюдаются в пределах изучаемого объекта. Если проводится однофакторный анализ, то для каждого уровня фактора формируется отдельная выборка (группа). Сравнивая затем средние значения показателя в группах, делают вывод о том, оказывает ли  на нее влияние изменение уровня фактора.

Для вызова процедуры дисперсионного анализа в SPSS следует в главном меню выбрать последовательность Statistics | Compare Means - One-Way ANOVA. На экране появится диалоговое окно процедуры:

Рисунок 11 Диалоговое окно дисперсионного анализа

Интересующий вас показатель следует поместить в список Dependent List. Если показателей несколько, то их можно обработать за один раз. Теперь перенесем независимую переменную factor в поле Factor. Рядом с ее именем в скобках появятся два знака вопроса. Это означает, что процедуре требуется знать, как обозначены минимальный и максимальный уровни фактора. Щелкните кнопку Define Range ("задать диапазон") и в дополнительном окне, показанном на следующем рисунке, введите 1 в поле Minimum и 3 в поле Maximum. Все промежуточные целые значения в указанных границах будут рассматриваться как коды уровней фактора.

Рисунок 12 Диалоговое окно уровней фактора

По умолчанию процедура выводит только небольшую таблицу дисперсионного анализа. Необходимо заказать дополнительные статистики, которые понадобятся для интерпретации результатов анализа. Щелкните кнопку Options и в появившемся дополнительном окне (рис.13) отметьте опции Descriptive (вывод описательных статистик) и Homogeneity-of-variance (проверка гипотезы о равенстве дисперсий).

Рисунок 13 Опции дисперсионного анализа

Установив эти флажки, щелкните кнопку Continue для возврата к основному окну процедуры.

Далее процедура дисперсионного анализа предполагает проверку нулевой гипотезы об отсутствии влияния проверяемого фактора. При наличии значимых различий нулевая гипотеза отвергается и влияние фактора признается существенным. При этом очень важно соблюдать условия её корректного применения. Для дисперсионного анализа это означает следующее: выборки должны извлекаться случайно из генеральных нормально распределенных совокупностей с одинаковыми дисперсиями. Проверка производится по всем уровням фактора методами множественных сравнений средних и дисперсий.

В пакете SPSS предоставляется возможность выбрать несколько подобных методов (рис.14). Мы воспользуемся пока только методом Шеффе.

Рисунок 14 Методы множественной проверки гипотез

Щелните кнопку Post Hoc (см.рис.11) и включите опцию Scheffe в группе Tests, а затем — кнопку Continue для возврата.

Теперь в основном окне можно нажать кнопку OK для выполнения процедуры. В окне распечатки появится листинг, отдельные части которого мы рассмотрим ниже. Прежде всего, рассмотрим таблицу с описательными статистиками:

Standard Standard

Group Count Mean Deviation Error 95 Pct Conf Int for Mean

Grp 1 13 23.6154 2.6627 .7385 22.0064 TO 25.2244

Grp 2 13 21.6154 4.6822 1.2986 18.7860 TO 24.4448

Grp 3 13 19.0769 4.4621 1.2376 16.3805 TO 21.7733

Total 39 21.4359 4.3577 .6978 20.0233 TO 22.8485

В столбце GROUP приведены обозначения для трех групп, созданных по уровням изучаемого фактора. В столбце Count приведены объемы каждой из трех выборок, в столбцах Mean, Standard Deviation и Standard Error — среднее, стандартное отклонение и ошибка среднего соответственно. В конце таблицы приведены 95%-ные доверительные интервалы для средних в соответствующих генеральных совокупностях.