- •Практическая работа "Определение данных натурных наблюдений методами математической статистики"
- •Изучение формы кривой распределения;
- •Проверка статистических гипотез.
- •1.Построение вариационного ряда (Xmin - … - Xmax)
- •2. Группировка вариационного ряда
- •2.1 Определение количества классов (интервалов).
- •2.3 Определение границ каждого интервала:
- •3. Определение расчетных статистических характеристик (мер положения, рассеивания и характеристики формы кривой распределения).
- •3.1 Определение мер положения:
- •3.2 Меры рассеивания:
- •3.3 Характеристики формы кривой распределения:
- •4. Графическое изображение вариационных рядов.
- •5. Изучение формы кривой распределения.
- •6. Проверка статистических гипотез
2. Группировка вариационного ряда
2.1 Определение количества классов (интервалов).
Для определения количества классов используем формулу Старжесса
K =1+ 3,3⋅lg N (1)
где К — количество классов;
N — объем выборки или количество значений в ряду.
По формуле (1) определяем количество классов, на которое необходимо разделить вариационный ряд:
K =1+ 3,3⋅lg 30 ≈ 6.
2.2 Определить длины каждого класса:
Определение размаха или амплитуды колебания случайной величины:
R = Xmin − Xmax (2)
h = R/K (3)
где R — размах (мг/л);
h — длина каждого интервала.
h = (Xmin − Xmax )/K = (25,91 – 18,3)/6=7,61/6 ≈ 1,27
2.3 Определение границ каждого интервала:
1. Xmin + h = X1 — [Xmin; X1] — границы 1-го интервала;
2. X1 + h = X2 — [X1; X2] — границы 2-го интервала;
…………………………………………………………
6. X5 + h = X6 — [X5; X6] — границы 6-го интервала;
Результаты расчета:
Границы 1-го интервала — [18,3; 19,57];
Границы 2-го интервала — [19,57; 20,84];
Границы 3-го интервала — [20,84; 22,11];
Границы 4-го интервала — [22,11; 23,38];
Границы 5-го интервала — [23,38; 24,65];
Границы 6-го интервала — [24,65; 25,92].
2.4 Определение эмпирической частоты
Частота – это количество значений, попавших в каждый интервал.
Расчет выполняем в виде таблицы:
Таблица 1
|
Границы интервалов мг/л |
Частота ni |
Ср.арифм.интервала xi, мг/л |
ni ∙ xi* |
1 |
2 |
3 |
4 |
5 |
1 2 3 4 5 6 |
18,3 - 19,57 19,57 -20,84 20,84 - 22,11 22,11 - 23,38 23,38 - 24,65 24,65 - 25,92 |
6 6 6 5 4 3 |
18,94 20,21 21,48 22,75 24,02 25,29 |
113,61 121,23 128,85 113,75 96,08 75, 87 |
|
∑ |
30 |
∑ |
649,39 |
3. Определение расчетных статистических характеристик (мер положения, рассеивания и характеристики формы кривой распределения).
3.1 Определение мер положения:
Целью исследования является определение центра распределения:
Среднее арифметическое значение (основной показатель, входящий в характеристику большинства законов распределения) является первым начальным моментом и вычисляется по следующей формуле:
(4)
где Xср — среднее арифметическое значение выборки (мг/л);
Хi — элементы выборки (мг/л).
Если учитывать, что ряд натурных наблюдений вариационный и сгруппированный, то среднее арифметическое значение можно рассчитать по следующей зависимости:
(мг/л) (5)
где ni — частота каждого интервала;
Хi*— среднее арифметическое значение каждого интервала (мг/л).
Среднее арифметическое значение каждого интервала рассчитывается, как полусумма границ интервалов.
Xcp= 21,65
Мода (значение имеющее максимальную частоту, т.е. наиболее часто встречаемое значение случайной величины в выборке) определяется по формуле:
(мг/л) (6)
где X0 - начало модального интервала (мг/л);
ni — частота модального интервала;
n(i - 1) и n(i + 1) — соответственно частоты предыдущего и последующего за
модальным интервалов.
Модальным называется интервал с наибольшей частотой.
M0=19,57 мг/л
Медиана (определение серединного элемента выборки):
(мг/л) (7)
где X0- начало медианного интервала;
Т(i - 1) — сумма частот интервалов предшествовавших медианному;
ni — частота медианного интервала.
Медианный интервал определяется по серединному элементу вариационного ряда. Если в вариационном ряду четное количество значений, то нет серединного элемента. Необходимо определить два центральных элемента, найти среднее арифметическое, как полу сумма их. Полученное значение подставляется в границы интервалов.
Me=21,49 мг/л