
- •Содержание
- •1.8. Проверка однородности нескольких дисперсий, 23
- •1. Первичная обработка результатов мониторинга
- •1.1. Общие сведения
- •1.2. Статистические оценки результатов наблюдений
- •1.3. Расчет доверительного интервала для математического ожидания
- •1.4. Определение необходимого объема выборки
- •1.5. Отбрасывание сомнительных наблюдений
- •1.6. Проверка гипотезы об однородности двух дисперсий
- •1.7. Проверка однородности нескольких дисперсий, найденных по выборкам одинакового объема
- •1.8. Проверка однородности нескольких дисперсий, найденных по выборкам различного объема
- •1.9. Проверка однородности средних
- •1.10. Проверка нормальности распределения
- •1.11. Коэффициент корреляции
- •1.12. Ранговая корреляция
- •1.13. Обработка экспертных оценок при ранжировании
- •2.2. Дисперсионный анализ данных
- •2.3. Корреляционный анализ данных
- •3.2. Основные задачи планирования эксперимента
- •4.2. Метод наименьших квадратов для моделей с одной переменной
- •4.3. Метод наименьших квадратов для многофакторных экспериментов
- •4.3.1.Случай линейной регрессионной модели с k варьируемыми факторами. Регрессионная модель здесь имеет вид (4.2). Значения факторов, принимаемые в каждом опыте, можно свести в табл. 4.3.
- •4.5. Статистический анализ уравнения регрессии
- •4.5.4.Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта.
- •4.6. Пример обработки результатов экспериментальных исследований
- •5. Построение многофакторной линейной регрессионной модели в excel
- •6. Культура представления числовых значений измерений и вычислений
- •7. Контрольное задание
- •Методические рекомендации при оценке состояния загрязнения атмосферы населенных мест
- •Статистические характеристики загрязнения атмосферы (за)
- •Индексы загрязнения атмосферы
- •Список использованной литературы
Федеральное агентство по образованию РФ
Национальный исследовательский ядерный
университет «МИФИ»
(ИНСТИТУТ АТОМНОЙ ЭНЕРГЕТИКИ)
Г. К. Игнатенко, И. А. Сдельникова
СТАТИСТИЧЕСКАЯ ОЦЕНКА ДАННЫХ
ЭКОЛОГИЧЕСКОГО МОНИТОРИНГА
С ПРИМЕНЕНИЕМ EXCEL
Учебное пособие
Москва 2009
УДК 519.22:502/504
ББК 28.081
И 26
Игнатенко Г.К., Сдельникова И.А. Статистическая оценка данных экологического мониторинга с применением EXCEL: Учебное пособие. М.: НИЯУ МИФИ, 2009. – с.
В пособии излагаются основные методы первичной обработки экологического мониторинга окружающей среды. Описаны этапы и процедуры статистической обработки данных экологического мониторинга, сформулированы цели и задачи. Изложены методы ранжирования данных по значимости и определения согласованности данных, представленных различными аудиторами. Приводятся методы построения регрессионных уравнений, процедуры формирования моделей, определения их адекватности и статистической значимости коэффициентов с применением табличного редактора EXCEL.
Пособие предназначено для студентов, обучающихся по курсам «Обработка данных экологического мониторинга» и «Системный анализ в экологии».
Рекомендовано редсоветом НИЯУ МИФИ к изданию в качестве учебно-методического пособия.
Рецензент В. С. Трошин
ISBN 978-5-7262- Ó Национальный исследовательский
ядерный университет «МИФИ», 2009
Содержание
1.2. Статистические оценки результатов наблюдений 10
1.3. Расчет доверительного интервала 14
для математического ожидания 14
1.4. Определение необходимого объема выборки 16
1.5. Отбрасывание сомнительных наблюдений 19
1.6. Проверка гипотезы об однородности 20
двух дисперсий 20
1.7. Проверка однородности нескольких дисперсий, 22
найденных по выборкам одинакового объема 22
1.8. Проверка однородности нескольких дисперсий, 23
найденных по выборкам различного объема 23
1.9. Проверка однородности средних 24
1.10. Проверка нормальности распределения 26
1.11. Коэффициент корреляции 27
1.12. Ранговая корреляция 29
1.13. Обработка экспертных оценок при ранжировании 31
3. ОСНОВНЫЕ ПОНЯТИЯ И ЗАДАЧИ 48
ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ В ЭКОЛОГИИ 48
3.1. Активные и пассивные, однофакторные 48
и многофакторные эксперименты 48
3.2. Основные задачи планирования эксперимента 53
4. ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА 56
ДЛЯ ПОЛУЧЕНИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 56
ИССЛЕДУЕМЫХ ПРОЦЕССОВ 56
4.1. Основные виды математических моделей, 56
применяемых при исследованиях 56
4.2. Метод наименьших квадратов для моделей 62
с одной переменной 62
4.3. Метод наименьших квадратов 70
для многофакторных экспериментов 70
4.3.1.Случай линейной регрессионной модели с k варьируемыми факторами. Регрессионная модель здесь имеет вид (4.2). Значения факторов, принимаемые в каждом опыте, можно свести в табл. 4.3. 70
Таблицы, составленные по представленному типу, в которых записаны условия опытов, называют матрицами планов. Прежде чем проводить вычисления, запишем регрессионную модель (4.2) в более симметричном виде, введя фиктивный фактор Х0: 71
4.3.2.Составление системы нормальных уравнений для регрессионных моделей в виде многочленов порядка выше первого. Идея обобщения метода наименьших квадратов на этот случай заключается в том, что любое произведение факторов, или их степень можно рассматривать в качестве нового фактора. Пусть, например, экспериментатор, исследуя влияние трех факторов на экологический объект, решил задаться моделью 75
4.3.3.Обобщение МНК на случай регрессионных моделей произвольного вида, линейных по параметрам. Рассмотренное выше обобщение МНК применимо и для регрессионных моделей произвольного вида при условии, что коэффициенты регрессии входят в них линейно. Так, модель 78
4.3.4.Применение ЭВМ для расчета коэффициентов регрессионной модели. Систему уравнений (4.18) можно решить вручную, без применения компьютерных программных средств, если число неизвестных в ней не более трех. В математическом обеспечении компьютера имеются стандартные программы регрессионного анализа и статистической обработки экспериментальных данных, которые позволяют получать уравнения регрессии, не вникая в алгоритм и его программной реализации, для многофакторных моделей. Однако для качественного анализа построения уравнения регрессии с целью применения его для прогнозирования, определения роли различных факторов, оптимизации процесса исследования объектов и т.д. целесообразно рассмотреть алгоритм численной реализации решения системы уравнений для многофакторной модели. 80
4.4.Об интервале съема данных и продолжительности пассивного эксперимента. 82
При проведении пассивного эксперимента и, в частности, в процессе мониторинга окружающей среды (загрязнения атмосферы) возникает вопрос об интервале съема данных и необходимости продолжительности всего эксперимента. Обозначим через временной интервал между последовательными измерениями выходной величины эксперимента. В предположении, что изменения исследуемой выходной величины y во времени представляют собой стационарный случайный процесс, интервал съема данных можно определить из условия некоррелированности наблюдений. Для расчета надо иметь диаграмму изменений y за некоторое время t. По ней подсчитывают число F пересечений диаграммой линии среднего значения y за время t. Вычисляют среднее число пересечений за единицу времени по формуле Тогда искомую величину интервала съема данных отыскивают из условия [4]: 82
4.5. Статистический анализ уравнения регрессии 84
4.5.1.Дисперсия воспроизводимости. После того как уравнение получено, приступают к его статистическому анализу. При этом решают две основные задачи: оценивают значимость коэффициентов регрессии и проверяют адекватность математической модели. Для выполнения каждой из этих процедур необходимо иметь количественную оценку ошибок эксперимента в целом. Соответствующей характеристикой является дисперсия воспроизводимости, обозначаемая через Рассмотрим способы ее вычисления в зависимости от методики дублирования опытов. 84
4.5.2.Оценка точности, значимости коэффициентов регрессии и интерпретации результатов. Статистическую обработку проводят обычно для модели, записанной в нормализованных обозначениях факторов. Для определенности будем иметь в виду линейную модель, содержащую k факторов. После того, как уравнение регрессии получено и рассчитана дисперсия воспроизводимости, следует оценить точность, с которой найдены коэффициенты регрессии. Поскольку они вычислены по результатам эксперимента, а эти результаты являются случайными величинами, то случайными величинами будут и коэффициенты регрессии Вi. Поэтому в качестве показателя точности поиска коэффициентов удобно взять его дисперсию . 86
Изучим сначала случай отсутствия дублированных опытов в основном эксперименте. 86
4.5.3.Проверка адекватности регрессионной модели. Регрессионная модель, построенная по результатам эксперимента, позволяет рассчитать значения отклика в разных точках области варьирования факторов. Для этого в уравнение регрессии подставляют соответствующие значения варьируемых факторов. Проверка адекватности математической модели дает возможность экспериментатору ответить на вопрос, будет ли построенная модель предсказывать значения выходной величины с той точностью, что и результаты эксперимента. 90
4.5.4.Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта. 93
4.6. Пример обработки результатов 94
экспериментальных исследований 94
7. контрольное задание 108
Продолжение ПРИЛОЖЕНИЯ 2 128
ПРИЛОЖЕНИЕ 3 128
Список использованной литературы 130