
- •Моменты случайной величины, их связь со статистическими характеристиками
- •Содержание никеля в руде х
- •Расчет начальных моментов случайной величины
- •Расчет центральных моментов случайной величины
- •Расчет статистических характеристик по сгруппированным данным
- •Расчет статистических характеристик по сгруппированным данным
- •Геологические приложения одномерной статистической модели
- •1) Точечная оценка погрешности среднего значения
- •2) Интервальная оценка математического ожидания случайной величины
- •3) Выделение аномальных значений
- •Решение:
- •Пример выявления аномальных значений
- •Результат вычисления истинных характеристик
- •2. Двумерные статистические модели в геологии
- •Расчет коэффициента корреляции
- •Математическое моделирование пространственных геологических закономерностей
- •Результаты измерения мощности рудного тела
- •Данные по скважинам
Результат вычисления истинных характеристик
Параметр |
Исходная совокупность с учетом аномальных значений |
Смещенные характеристики после исключения аномальных значений |
Несмещенные «истинные» характеристики |
Среднее значение |
0,502 |
0,451 |
0,485 |
Дисперсия |
0,06478 |
0,03577 |
0,4752 |
Среднеквадратичное отклонение |
0,2545 |
0,1891 |
0,2180 |
По формуле (2.26) найдем смещенный критерий:
tсмещ = (3 + 0,1563)/
.
Отсюда следует, что, вместо t = 3 для проверки аномальности значений нужно пользоваться tсмещ = 3,638, что довольно существенно. Но и с учетом смещенного критерия исключенные значения являются аномальными.
Лекция№10.
2. Двумерные статистические модели в геологии
Статистические характеристики системы двух случайных величин. Коэффициент корреляции
Система двух случайных величин имеет пять основных статистических характеристик: средние значения, их дисперсии и их корреляционный момент (или ковариацию) Kху, которые вычисляют по формулам:
(3.1)
(3.2)
.
(3.3)
Первые четыре формулы встречались ранее. Особый интерес представляет пятая формула, которая отражает взаимосвязь между случайными величинами х и у. Поскольку корреляционный момент имеет размерность, его преобразуют в безразмерную величину по формуле
.
(3.4)
Величина r играет чрезвычайно большую роль в статистических исследованиях и называется коэффициентом корреляции. Его значения заключены в интервале между +1 и –1. Если коэффициент корреляции равен нулю, то линейная связь между случайными величинами отсутствует (рис.3.1, в). При r = 1 связь функциональная положительная (см. рис.3.1, а). При r = –1 связь функциональная отрицательная (см. рис.3.1, б). В реальных условиях коэффициент корреляции не бывает равен единице (или минус единице) и характеризует степень статистической связи между свойствами х и у. Чем ближе по абсолютной величине r к единице, тем сильнее связь между свойствами свойствами; она может быть положительной (r > 0) и отрицательной (r < 0). Таким образом, коэффициент корреляции является мерой линейной зависимости между двумя величинами. Для оценки нелинейных зависимостей он непригоден.
На вычисленную величину rв заметно влияет случайная погрешность измерений исходных данных, уменьшая истинное значение коэффициента корреляции r:
(3.5)
где
и
– дисперсии случайной погрешности
измерений величин х
и у
соответственно.
Влияние погрешности может оказаться настолько значительным, что зависимость между случайными величинами не будет выявлена.
Статистическая линейная связь между характеристиками двух свойств считается доказанной, если критерий t будет больше предельного tдоп. Коэффициент корреляции, при котором связь считается доказанной, называется значимым коэффициентом корреляции. Для установления значимости используется критерий t, основанный на распределении Стьюдента с числом степеней свободы k = n – 2:
при
,
(3.6)
где Sr – оценка среднеквадратичного отклонения коэффициента корреляции.
Если критерий t будет больше допустимого tдоп при заданной вероятности , то связь считается доказанной. Имеет смысл принять вероятность = 0,0027, что соответствует правилу «трех сигм».
При большом значении n можно пользоваться более простым критерием, основанным на нормальном законе распределения:
при
.
(3.7)
Если t > 3 (что соответствует вероятности = 0,0027), то связь считается доказанной.
Еще один критерий предложен Фишером:
при
,
(3.8)
где z – новая переменная, полученная преобразованием коэффициента корреляции через гиперболический арктангенс,
.
(3.9)
И здесь для доказательства связи необходимо выполнение условия t > 3.
Из соотношения (3.6) выводится формула значимого коэффициента корреляции
.
(3.10)
Так как tдоп зависит от числа наблюдений (точнее, от числа степеней свободы k = n – 2), то и значимый коэффициент корреляции зависит от числа наблюдений. При увеличении числа наблюдений, как следует из соотношения (3.7), формула (3.10) упрощается:
.
(3.11)
Обычно принимается значение tдоп = 3.
Пример 1. Известны содержания общего и магнетитового железа в руде. Требуется рассчитать коэффициент корреляции между этими величинами (табл.3.1).
Решение:
Таблица 3.1