
- •Специфика геологических образований и процессов как объектов изучения
- •Случайная величина. Общее понятие, примеры
- •Генеральная и выборочная совокупности. Примеры выборок
- •Плотность распределения случайной величины – общее понятие, графическое выражение
- •Основные статистические законы распределения, используемые в геологии
- •Точечные оценки свойств геологических объектов
- •Понятия о критериях согласия, используемых в геологии
- •Проверка гипотез о равенстве средних значений
- •Проверка гипотез о равенстве дисперсий
- •Одномерные статистические модели в геологии. Примеры
- •Точечные оценки свойств геологических объектов
- •Анализ однородности выборочных геологических совокупностей
- •Сущность и условия применения двумерных статистических моделей
- •Простейшие графические преобразования двумерных случайных величин (корреляционные поля точек)
- •Сущность корреляционного анализа, формы выражения его результатов
- •Линейная регрессия. Примеры уравнений
Простейшие графические преобразования двумерных случайных величин (корреляционные поля точек)
. Между двумя случайными величинами, как правило, проявляются вероятностные связи, когда заданному значению случайной величины Х=х соответствует не какое – либо значение Y , а набор ее значений y1, y2, …yn,,каждому из которых свойственна вероятность р, р2,…рn. Функция распределения величины Y , соответствующая значению X=x , характеризуется математическим ожиданием и дисперсией. Двумерную случайную величину X, Y можно наглядно изобразить в виде облака точек, так называемого корреляционного поля точек, когда каждая пара значений изображается в виде точки с координатами xi и yi (рис. 13).
Форма и ориентировка корреляционного поля точек позволяет судить о наличии корреляционной (статистической связи) связи, о ее характере (прямая или обратная) и виде (линейная или нелинейная). Если связь между изучаемыми свойствами существует, то корреляционное поле точек имеет форму эллипса, длинная ось которого вытянута относительно осей координат. Рис 13 а) – связь положительная (прямая), рис. 2 б) – связь отрицательная (обратная). Когда связь отсутствует, корреляционное поле точек имеет изометрическую форму (рис.14).
Возьмем на оси х произвольные точки х1,х2,х3. Каждой из них будут соответствовать свои наборы значений у со своими средними значениями (рис. 16), которые называются условными центрами распределения
Сущность корреляционного анализа, формы выражения его результатов
Ковариация – это математическое ожидание произведения отклонения двух случайных величин от их математических ожиданий
(30)
Ковариация обладает размерностью, поэтому в практике обычно пользуются коэффициентом корреляции, который является безразмерной величиной.
(31)
При определении коэффициента корреляции по выборочным данным можно использовать несколько модификаций расчетных формул:
(32)
где
- выборочные оценки средних значений
случайных величин
и
,
- выборочные оценки их стандартов,
- количество сравниваемых пар значений
(33)
(34)
Формула
(34) удобна для расчетов, если нет
необходимости вычислять
для других целей.
Коэффициент
корреляции определяет тесноту линейной
связи между двумя величинами. Его
значения изменяются между –1 и +1. Знак
показывает, прямой или обратной является
взаимосвязь. При
связь
между величинами отсутствует. При
связь
функциональная.
Проверка
гипотезы о наличии корреляционной связи
заключается в оценке значимости отличия
от нуля вычисленных по выборке значений
Когда
математическое ожидание выборочного
коэффициента корреляции равно нулю,
величина
имеет
распределение Стьюдента с
степенями свободы. Если рассчитанное
по этой формуле значение величины
превышает табличное значение критерия
Стьюдента, то отличие
от 0 признается значимым (гипотеза об
отсутствии корреляционной связи
отвергается).
При нелинейной регрессии коэффициенты уравнения подбираются таким образом, чтобы сумма квадратов отклонений всех точек от линии зависимости была минимальной (метод наименьших квадратов). Уравнения нелинейной регрессии зависят от вида кривой, который задается либо, исходя из теоретических соображений, либо путем эмпирического подбора. Это могут быть уравнения параболы, синусоиды, показательной функции и т.д. Например, для параболической регрессии:
Если корреляционная связь имеет нелинейный характер она может существовать и при . В этой ситуации необходимо вычисление корреляционного отношения, которое показывает, какую долю от общей дисперсии составляет дисперсия, учтенная уравнением регрессии (закономерная составляющая дисперсии).
где
- дисперсия центров условных распределений,
-общая дисперсия
Незакономерная, случайная составляющая дисперсии характеризует разброс значений вокруг линии регрессии.
Чем меньше случайная составляющая, т.е. чем меньше разброс значений от линии регрессии, тем выше значение корреляционного отношения. Закономерная составляющая дисперсии рассчитывается по формуле:
При
этом выборочные данные разбиваются на
группы, для каждой из которых подсчитываются
или
N – общее число наблюдений, m – число групп, ni – число наблюдений в i – ой группе
Общая дисперсия рассчитывается по формуле (20).
изменяется
от 0 (связь отсутствует) до 1 (связь
функциональная). В случае линейного
характера связи
.
Примеры геологических моделей, построенных с помощью корреляционного анализа
Примеры геологических задач, решаемых регрессионным методом
Уравнение линии регрессии называется функцией или уравнением регрессии. Системе из двух случайных величин всегда будут соответствовать две линии регрессии, т.к. каждому значению случайной величины соответствует некоторая функция распределения величины Х со своим математическим ожиданием и дисперсией (регрессия Х на У). Если регрессия линейна, то линии регрессии – это прямые линии и уравнения регрессии имеют вид:
(регрессия
Y на Х )
(регрессия
Х на Y)
В системе двух уравнений линейной регрессии коэффициенты и характеризуют положения начальных точек линий регрессии (рис. 19). При линии проходят через начало координат. Степень зависимости случайных величин определяется коэффициентами и , которые называются коэффициентами линейной регрессии. Они представляют собой тангенсы углов наклона прямой регрессии к оси абсцисс (угол 1) и прямой регрессии к оси ординат (угол 2).
В общем случае прямые регрессии пересекаются в точке, координаты которой равны математическим ожиданиям величин Х и Н , а угол 3 между ними изменяется от 0 до 90. Чем меньше этот угол, тем сильнее связь между величинами. Если угол 3 =0, то прямые сливаются в одну линию, и связь между величинами становится функциональной. Основными числовыми характеристиками двумерного распределения случайных величин являются показатели их связи: ковариация (корреляционный момент), коэффициент корреляции и корреляционное отношение.
Ковариация – это математическое ожидание произведения отклонения двух случайных величин от их математических ожиданий