Содержание
Введение…………………………………………………………………………..3
Расчетно-графическая часть……………………………………………………..5
1.Построение вариационного ряда(Xmin-…-Xmax)…………………………...5
2.Группировка вариационного ряда-деление вариационного ряда на части…5
2.1Определение количества классов(интервалов)……………………….5
2.2Определение длин каждого класса…………………………………….5
2.3Определение границ каждого интервала…...…………………………6
2.4Определение частот…..............................................................................6
3.Определение расчетных статистических характеристик (мер положения, рассеивания и характеристики формы кривой распределения)………………..6
3.1Определение мер положения…………………………………………..6
3.2Меры рассеивания………………………………………………………7
3.3Характеристики формы кривой распределения………………………8
4.Графическое изображение вариационных рядов……………………………..9
5.Проверка статистических гипотез……………………………………………10
5.1Критерии однородности………………………………………………10
5.2Критерии согласия…………………………………………………….12
Заключение………………………………………………………………………14
Введение
Проблема экологизации – актуальная проблема современного общества. Вечные изменения, которые происходят в окружающей среде под влиянием антропогенных факторов, заставляют ученых постоянно разрабатывать и анализировать методики охраны природных ресурсов.
Мониторинг – направление изучения процессов, происходящих в природе, тенденций к изменчивости. Мониторинг окружающей среды – меры, направленные на получение исходной информации и ее обработке. Первый этап – получение информации с помощью гидрометрических постов наблюдений. Полученные данные – данные натурных наблюдений. Государственная гидрометрическая сеть наблюдает за исследуемым объектом и его изменениями. Организует и проводит мониторинг ГосКомГидроМет России. Это наблюдения за атмосферой, гидросферой и почвенным покровом. Пункты контроля находятся на местах развитой антропогенной деятельности и на относительно экологически благоприятных территориях. Их цель: картина экологической обстановки. Второе направление изучения изменений условий – экспедиционный метод: научные исследования с конкретной целью. При организации наблюдений экспериментатору приходиться иметь дело со следующими факторами: выбором, поверкой и установкой прибора для наблюдения, проведение самих измерений, оценкой точности измеряемой величины. После эксперимента результаты подвергаются всесторонней обработке и анализу.
Этапы исследования природных явлений процессов и тенденций:
Получение количественных данных наблюдений в результате проведения натурного эксперимента (теория планирования и организации эксперимента).
Обработка и анализ полученной информации (теория вероятности и математическая статистика).
Моделирование природных процессов (физическое и математическое моделирование).
Принятие управленческих решений на основе полученных результатов обработки и моделирования.
Следует отметить, что ни одна даже самая современная математическая обработка результатов эксперимента не исправит халатности в получении данных натурных наблюдений и наоборот качественные результаты натурных исследований можно испортить неумелым применением математического аппарата.
Целью расчетно-графического задания является выработка у студентов технических специальностей навыков по обработке экспериментальных данных методами математической статистики, оценке полученных результатов, использовании их при принятии управленческих решений в области природоохраны и природопользования.
По рядам результатов натурных наблюдений (взятых, например, из Государственного водного кадастра «Ежегодные данные о качестве поверхностных вод суши» для конкретного загрязняющего вещества, или предложенных преподавателем) на основе теории вероятности и математической статистики необходимо получить основные характеристики расчетных параметров, отработать методику расчета и найти пути практического применения полученных результатов.
Перед тем, как приступить к выполнению задания, необходимо дать характеристику полученных опытным путем количественных величин конкретного контролируемого загрязняющего вещества. Элементы выборки являются случайными величинами. Случайной величиной называется величина, которая в результате эксперимента может принять то или иное значение, причем заранее неизвестно какое именно. Дополнительно элементы (варианты) выборки являются непрерывными, т.к. природные явления и процессы непрерывны во времени и пространстве. Непрерывную случайную величину можно охарактеризовать диапазоном изменения случайной величины и полностью распределения вероятности. Полученные в результате натурного эксперимента количественные оценки данного вида загрязняющего вещества являются размерными характеристиками. Их размерность выражается в мг/л или г/м3 и характеризует массу растворенного вещества в объеме жидкости или газа. Количественное значение с данной размерностью носит название концентрации загрязняющего вещества.
Расчетно-графическое задание основывается на данных натурных наблюдений и заключается в выполнении следующих этапов обработки:
Построение вариационного ряда;
Группировка данных натурных наблюдений;
Определение расчетных данных статических характеристик (мер положения, рассеивания, и форм кривой распределения);
Графическое изображение сгруппированных рядов;
Проверка статических гипотез.
Приведем порядок выполнения задания, расчетные формулы, основные положения и характеристика этапов обработки.
Допустим , что в результате натурного эксперимента получены следующие количественные значения концентрации конкретного загрязняющего вещества(примерами могут служить нормируемые загрязняющие вещества в окружающей среде: биогены, нефтепродукты, тяжелые металлы, фенолы и т.д.) в определенном пункте контроля. Целью расчета является получение основных статических характеристик и их анализ, подбор генеральной совокупности по результатам натурных наблюдений.
Исходные данные:
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
21,43 |
19,01 |
15,96 |
23,55 |
20,23 |
13,56 |
25,36 |
22,44 |
20,62 |
22,64 |
№ |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
|
14,71 |
19,34 |
22,86 |
26,96 |
21,17 |
22,13 |
25,07 |
30,48 |
16,39 |
20,41 |
№ |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
|
18,66 |
24,28 |
22,19 |
15,71 |
28,75 |
22,57 |
25,93 |
20,78 |
16,23 |
18,88 |
Построение вариационного ряда(Xmin-…-Xmax):
№
1
2
3
4
5
6
7
8
9
10
13,56
14,71
15,71
15,96
16,23
16,39
18,66
18,88
19,01
19,34
№
11
12
13
14
15
16
17
18
19
20
20,23
20,41
20,62
20,78
21,17
21,43
22,13
22,19
22,44
22,57
№
21
22
23
24
25
26
27
28
29
30
22,64
22,86
23,55
24,28
25,07
25,36
25,93
26,96
28,75
30,48
Группировка вариационного ряда.
Определение количества классов (интервалов).
Для определения количества классов используем формулу Старжесса
(1)
где К – количество классов.
N – объем выборки или количество значений в ряду.
По формуле (1) определяем количество классов, на которое необходимо разделить вариационный ряд:
2.2 Определение длины каждого класса.
Определение размаха или амплитуды колебания случайной величины:
(2)
(3)
где R –размах (мг/л),
h – длина каждого интервала.
2.3 Определение границ классов:
1.
2.
3.
4.
5.
6.
Результаты расчета:
13,56+2,82=16,38 [13,56;16,38] - Граница первого интервала.
16,38+2,82=19,20 [16,38;19,20] – Граница второго интервала.
19,20+2,82=22,02 [19,20;22,02] – Граница третьего интервала.
22,02+2,82=24,84 [22,02;24,84] – Граница четвертого интервала.
24,84+2,82=27,66 [24,84;27,66] – Граница пятого интервала.
27,66+2,82=30,48 [27,66;30,48] – Граница шестого интервала.
X6=Xmax
г) Определение эмпирической частоты:
Частотой называется количество значений, попавших в каждый интервал.
|
Границы интервалов | |||
1 |
2 |
3 |
4 |
5 |
1 |
[13,56;16,38] |
5 |
14,97 |
74,85 |
2 |
[16,38;19,20] |
4 |
17,79 |
71,16 |
3 |
[19,20;22,02] |
7 |
20,61 |
144,27 |
4 |
[22,02;24,84] |
8 |
23,43 |
187,44 |
5 |
[24,84;27,66] |
4 |
26,25 |
105 |
6 |
[27,66;30,48] |
2 |
29,07 |
58,14 |
|
|
30 |
|
640,86 |
Определение расчетных статических характеристик.
3.1 Определение мер положения.
Целью исследования являются определение центра распределения:
Среднее арифметическое значение(основной показатель, входящий в характеристику большинства законов распределения) является первым начальным моментом и вычисляется по следующей формуле:
(4)
где Xср – среднее арифметическое значение выборки (мг/л);
Xi – элементы выборки (мг/л)
Если учитывать, что ряд наблюдений вариационный и сгруппированный, то среднее арифметическое значение можно рассчитать по следующей зависимости:
(мг/л), (5)
где Xi* - среднее арифметическое значение каждого интервала (мг/л),
ni – частота каждого интервала.
(мг/л)
Мода – значение, имеющее максимальную частоту, т.е. наиболее встречаемое значение случайной величины в выборке. Оно определяется по формуле:
(мг/л), (6)
где X0 – начало модального интервала (мг/л),
ni – частоты модального интервала,
n(i-1) и n(i+1) – частоты предыдущего и последующего за модальным интервалом.
Модальным интервалом называется интервал с наибольшей частотой.
Медиана(определение серединного элемента выборки):
(мг/л), (7)
где X0 – начало медианного интервала,
Ti-1 – сумма частот, предшествовавших медианному,
ni – частота медианного интервала.
Медианный интервал определяется по серединному элементу вариационного ряда. Если в вариационном ряду четное количество значений, то нет серединного элемента. Необходимо определить два центральных элемента, найти среднее арифметическое, как полу сумма их. Полученное значение подставляется в границы интервалов.
(мг/л)
3.2 Меры рассеивания.
Характеристикой рассеивания или отклонения случайной величины от центра распределения выступает дисперсия – второй центральный момент.
Согласно методу моментов дисперсия определяется по формуле:
(мг/л)2 (8)
Для определения стандартного отклонения из дисперсии извлекается квадратный корень, полученная величина называется средним квадратичным отклонением и называется (мг/л).= √M2
Нормированное отклонение определяется коэффициентом вариации
(9)
3.3 Характеристики формы кривой распределения.
Характеристиками формы кривых выступают третий и четвертый центральные моменты.
Третий центральный момент характеризует асимметричность ряда, т.е. неравномерность распределения случайной величины относительно центра и определяются по формуле:
(мг/л)3 (10)
Безразмерный коэффициент асимметрии (Cs) определяется отношением третьего центрального момента к кубу среднего квадратичного отклонения.
Четвертый центральный момент характеризует форму симметричной кривой распределения:
(мг/л)4 (11)
Показателем остро- или плосковершинности выступает коэффициент эксцесса (Ce), который определяется отношением четвертого центрального момента к среднему квадратичному отклонению в четвертой степени, за вычетом коэффициента три.
Общая формула для расчета центральных моментов:
, (12)
№ | |||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 | |||
1 |
5 |
-6,392 |
40,86 |
-261,16 |
1669,35 |
204,3 |
-1305,8 |
8346,75 | |||
2 |
4 |
-3,572 |
12,760 |
-45,58 |
162.81 |
51,04 |
-182,32 |
651,24 | |||
3 |
7 |
-0,752 |
0,560 |
-0,42 |
0,315 |
3,92 |
-2,94 |
2,205 | |||
4 |
8 |
2,068 |
4,280 |
8,85 |
18,30 |
34,24 |
70,8 |
146,4 | |||
5 |
4 |
-4,890 |
23,910 |
116,92 |
571,74 |
95,64 |
467,68 |
2286,96 | |||
6 |
2 |
7,710 |
59,440 |
458,28 |
3533,34 |
118,88 |
916,54 |
7066,68 | |||
|
30 |
|
508,02 |
-36,04 |
18500,235 |
M2=16,93(мг/л)2, ,
M3=-1,20(мг/л)3,
M4=616,67(мг/л)4,
Графическое изображение вариационных рядов.
Для графического изображения рядов распределения применяют гистограмму(кривая распределения вероятностей, дифференциальная кривая распределения).
С помощью гистограммы (кривая распределения плотности вероятностей, дифференциальная кривая распределения) эмпирического распределения можно предугадать вид генеральной совокупности (случайной величины, подчиняющейся определенной функциональной зависимости).
Таблица 3
Определение ординат эмпирических кривых распределения.
|
|
nпр | ||
1 |
[13,56;16,38] |
5 |
0,17 |
0,060 |
2 |
[16,38;19,20] |
4 |
0,13 |
0,046 |
3 |
[19,20;22,02] |
7 |
0,23 |
0,082 |
4 |
[22,02;24,84] |
8 |
0,27 |
0,096 |
5 |
[24,84;27,66] |
4 |
0,13 |
0,046 |
6 |
[27,66;30,48] |
2 |
0,07 |
0,025 |
,
nотн – относительная частота определяется отношением эмпирической частоты к объему выборки и характеризует вероятность появления случайной величины в каждом интервале.
nпр – приведенная частота или плотность распределения случайной величины в заданном интервале.
0.1
0.75
0,05
0.025
13,56 16,38 19,20 22.02 24,84 27,66 30,48