Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii_8-11.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
982.53 Кб
Скачать

Результат вычисления истинных характеристик

Параметр

Исходная

совокупность

с учетом аномальных значений

Смещенные

характеристики после исключения аномальных значений

Несмещенные «истинные»

характеристики

Среднее значение

0,502

0,451

0,485

Дисперсия

0,06478

0,03577

0,4752

Среднеквадратичное отклонение

0,2545

0,1891

0,2180

По формуле (2.26) найдем смещенный критерий:

tсмещ = (3 + 0,1563)/ .

Отсюда следует, что, вместо t = 3 для проверки аномальности значений нужно пользоваться tсмещ = 3,638, что довольно существенно. Но и с учетом смещенного критерия исключенные значения являются аномальными.

Лекция№10.

2. Двумерные статистические модели в геологии

Статистические характеристики системы двух случайных величин. Коэффициент корреляции

Система двух случайных величин имеет пять основных статистических характеристик: средние значения, их дисперсии и их корреляционный момент (или ковариацию) Kху, которые вычисляют по формулам:

(3.1)

(3.2)

. (3.3)

Первые четыре формулы встречались ранее. Особый интерес представляет пятая формула, которая отражает взаимосвязь между случайными величинами х и у. Поскольку корреляционный момент имеет размерность, его преобразуют в безразмерную величину по формуле

. (3.4)

Группа 92

Величина r играет чрезвычайно большую роль в статистических исследованиях и называется коэффициентом корреляции. Его значения заключены в интервале между +1 и –1. Если коэффициент корреляции равен нулю, то линейная связь между случайными величинами отсутствует (рис.3.1, в). При r = 1 связь функциональная положительная (см. рис.3.1, а). При r = –1 связь функциональная отрицательная (см. рис.3.1, б). В реальных условиях коэффициент корреляции не бывает равен единице (или минус единице) и характеризует степень статистической связи между свойствами х и у. Чем ближе по абсолютной величине r к единице, тем сильнее связь между свойствами свойствами; она может быть положительной (r > 0) и отрицательной (r < 0). Таким образом, коэффициент корреляции является мерой линейной зависимости между двумя величинами. Для оценки нелинейных зависимостей он непригоден.

На вычисленную величину rв заметно влияет случайная погрешность измерений исходных данных, уменьшая истинное значение коэффициента корреляции r:

(3.5)

где и – дисперсии случайной погрешности измерений величин х и у соответственно.

Влияние погрешности может оказаться настолько значительным, что зависимость между случайными величинами не будет выявлена.

Статистическая линейная связь между характеристиками двух свойств считается доказанной, если критерий t будет больше предельного tдоп. Коэффициент корреляции, при котором связь считается доказанной, называется значимым коэффициентом корреляции. Для установления значимости используется критерий t, основанный на распределении Стьюдента с числом степеней свободы k = n – 2:

при , (3.6)

где Sr – оценка среднеквадратичного отклонения коэффициента корреляции.

Если критерий t будет больше допустимого tдоп при заданной вероятности , то связь считается доказанной. Имеет смысл принять вероятность  = 0,0027, что соответствует правилу «трех сигм».

При большом значении n можно пользоваться более простым критерием, основанным на нормальном законе распределения:

при . (3.7)

Если t > 3 (что соответствует вероятности  = 0,0027), то связь считается доказанной.

Еще один критерий предложен Фишером:

при , (3.8)

где z – новая переменная, полученная преобразованием коэффициента корреляции через гиперболический арктангенс,

. (3.9)

И здесь для доказательства связи необходимо выполнение условия t > 3.

Из соотношения (3.6) выводится формула значимого коэффициента корреляции

. (3.10)

Так как tдоп зависит от числа наблюдений (точнее, от числа степеней свободы k = n – 2), то и значимый коэффициент корреляции зависит от числа наблюдений. При увеличении числа наблюдений, как следует из соотношения (3.7), формула (3.10) упрощается:

. (3.11)

Обычно принимается значение tдоп = 3.

Пример 1. Известны содержания общего и магнетитового железа в руде. Требуется рассчитать коэффициент корреляции между этими величинами (табл.3.1).

Решение:

Таблица 3.1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]