
- •Моменты случайной величины, их связь со статистическими характеристиками
- •Содержание никеля в руде х
- •Расчет начальных моментов случайной величины
- •Расчет центральных моментов случайной величины
- •Расчет статистических характеристик по сгруппированным данным
- •Расчет статистических характеристик по сгруппированным данным
- •Геологические приложения одномерной статистической модели
- •1) Точечная оценка погрешности среднего значения
- •2) Интервальная оценка математического ожидания случайной величины
- •3) Выделение аномальных значений
- •Решение:
- •Пример выявления аномальных значений
- •Результат вычисления истинных характеристик
- •2. Двумерные статистические модели в геологии
- •Расчет коэффициента корреляции
- •Математическое моделирование пространственных геологических закономерностей
- •Результаты измерения мощности рудного тела
- •Данные по скважинам
Расчет статистических характеристик по сгруппированным данным
Моменты и статистические характеристики можно рассчитать по сгруппированным данным, что сокращает объем вычислений при большом числе исходных данных.
Пример 1. Известны частота значений случайной величины в классах ni, границы начального и конечного классов и размер (шаг) классов h. Требуется рассчитать статистические характеристики.
Расчет начинается с присвоения каждому классу условного порядкового номера х. Одному из классов присваивают нулевой номер, остальным – отрицательные и положительные номера (табл.2.5). Все классы располагают в порядке возрастания без пропусков. Нулевой класс выбирают произвольно, по возможности ближе к среднему значению, что уменьшает объем вычислений. Чаще всего за нулевой принимают класс с максимальной частотой. В табл.2.5 нулевой класс имеет пределы 40-42, его середина х0 = 41, а шаг h = 2.
Вначале
расчеты выполним в табл.2.5. С помощью
условных номеров вычислим начальные
моменты, но в условном масштабе, так как
размер классов h = 2.
Для этого найдем произведения nixi,
суммируем
их и определим среднее в каждой графе
путем деления на общее число данных
n = 147.
Последняя строка таблицы содержит
начальные моменты в условном масштабе
m1 = 0,56;
m2 = 6,80;
m3 = 14,33;
m4 = 132,30.
От начальных моментов можно перейти к
центральным моментам и далее к
статистическим характеристикам.
Поскольку нулевой класс выбран произвольно и необходимо учесть размер классов, формулы вычисления среднего значения и центральных моментов выглядят следующим образом:
среднее значение
= x0 + m1h; (2.16)
центральные моменты:
1 = 0;
;
;
(2.17)
Таблица 2.5
Расчет статистических характеристик по сгруппированным данным
Класс x, % |
Частота ni |
Номер класса xi |
Произведения |
Сумма частот ni |
||||
|
|
|
|
|||||
30-32 |
2 |
-5 |
-10 |
50 |
-250 |
1250 |
2 |
|
32-34 |
6 |
-4 |
-24 |
96 |
-376 |
1504 |
8 |
|
34-36 |
9 |
-3 |
-27 |
81 |
-243 |
729 |
17 |
|
36-38 |
14 |
-2 |
-28 |
56 |
-112 |
224 |
31 |
|
38-40 |
20 |
-1 |
-20 |
20 |
-20 |
20 |
51 |
|
40-42 |
25 |
0 |
0 |
0 |
0 |
0 |
76 |
|
42-44 |
21 |
1 |
21 |
21 |
21 |
21 |
97 |
|
44-46 |
17 |
2 |
34 |
68 |
136 |
272 |
114 |
|
46-48 |
13 |
3 |
39 |
117 |
351 |
1053 |
127 |
|
48-50 |
10 |
4 |
40 |
160 |
640 |
2560 |
137 |
|
50-52 |
5 |
5 |
25 |
125 |
625 |
3125 |
142 |
|
52-54 |
3 |
6 |
18 |
108 |
648 |
3888 |
145 |
|
54-56 |
2 |
7 |
14 |
98 |
686 |
4802 |
147 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Cумма |
147 |
– |
82 |
1000 |
2106 |
19448 |
– |
|
Среднее |
– |
– |
0,56 |
6,80 |
14,33 |
132,30 |
– |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Моменты |
– |
– |
m1 |
m2 |
m3 |
m4 |
– |
Между формулами (2.14) и (2.17) имеются различия. Так, в формулах (2.17) появляется размер классов h, играющий роль масштабного множителя, и поправки Шеппарда, которые возник ли из-за того, что внутри классов нивелированы различия между отдельными значениями.
Поправка
Шеппарда ко второму центральному моменту
–h/12,
к третьему –m1h2,
к четвертому
.
По данным табл.2.5 вычисляем статистические характеристики:
= 41 + 0,562 = 42,12; 2 = (6,80 – 0,562 – 1/12)22 = 25,6;
3 = (14,33 – 36,800,56 + 20,563)23 – 0,5622 = 23,82;
4 = (132,3 – 414,330,56 +
+ 66,800,562 – 30,564)24 – (6,80 – 0,56)/222 +
+ 7/24024 = 1790,7;
2 = 25,6; = 5,06; 3 = 129,5; 4 = 655,36;
V = 5,06/42,12 = 0,120 = 12,0 %; A = 23,82/129,5 = 0,184;
E = 1790,7/655,36 – 3 = –0,268.
Медиану в сгруппированных данных находят линейной интерполяцией в том классе, где нарастающая сумма частот (последняя графа табл.2.5) переходит через половину общего числа значений n. В рассматриваемом примере из 147 значений средний член имеет порядковый номер (147 + 1)/2 = 74. Следовательно, медиана заключена в классе 40-42, где находятся порядковые номера с 52 по 76. Обозначим начало класса xн = 40, число значений в классе ni = 25. Порядковый номер медианы в классе найдем как разность nт = 74 – 51 = 23.
Тогда медиана
(2.18)
Подставляя данные, получим xmed = 40 + 23/252 = 41,84.
Один из приемов нахождения моды основан на параболической интерполяции частот по трем соседним классам, включая класс с максимальной частотой.
В рассматриваемом примере это будут классы 38-40, 40-42, 42-44 с частотами соответственно 20, 25, 21.
Обозначим частоты этих классов n1, n2, n3.
Тогда мода
,
(2.19)
где x0 – середина класса с максимальной частотой.
Подставляя численные значения, найдем
.
Подведем итог расчета статистических характеристик: среднее значение = 42,12; медиана xmed = 41,84; мода xmod = 41,11; дисперсия 2 = 25,6; среднеквадратичное отклонение = 5,06; коэффициент вариации V = 12,0 %; асимметрия A = 0,184; эксцесс E = –0,268.