Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Матмоделирование.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
716.92 Кб
Скачать

2)Оценка силы корреляционных связей между 2-мя случайными величинами.

Ковариация - это математическое ожидание произведения отклонений двух случайных величин от их математического ожидания. Для выборочных данных формула расчета ковариации имеет вид:

Ковариация обладает размерностью, поэтому в практике обычно пользуются коэффициентом корреляции, который представляет собой ковариацию, нормированную по стандартам x и y :

Коэффициент корреляции определяет тесноту линейной связи между двумя величинами. Его значения изменяются от -1 до +1. При r = 0 связь между величинами отсутствует. При \r\ = 1 связь функциональная. Знак ± показывает, прямой, или обратной пропорциональной является взаимосвязь.

Коэффициент корреляция подсчитывается по формуле:

где N - общее количество точек, n1,3 - количество точек в квадрантах 1 и III, n2,4 - то же, в квадрантах II и IV.

Следовательно, проверка гипотезы о наличии корреляционной связи заключается в оценке значимости отличия от нуля вычисленных по выборке значений r:

Критерий для оценки значимости отличия r от 0 предложен Фишером:

Если вычисленное значение t больше, чем

взятое из таблицы распределения Стьюдента, то отличие r от 0 признается значимым. В геологической практике иногда пользуются упрощенным критерием:

Во многих руководствах по математической статистике и задачниках по геохимии есть специальные таблицы критических значений коэффициента корреляции в зависимости от числа наблюдений N.

Коэффициент корреляции очень чувствителен к виду функции распределения величин, входящих в двумерную систему. Поэтому, если эти распределения отличаются от нормальных и не поддаются нормализации, для проверки гипотезы о наличии корреляционной связи следует использовать ранговый коэффициент корреляции Спирмена. При этом каждому значению х и уприсваивается ранг в порядке возрастания их значений. Если значения повторяются, им присваивается средний между повторяющимися значениями ранг. Выражение для r имеет вид:

где n - количество пар значений в выборке, d - разность рангов сопряженных значений х и у.

Для оценки значимости отличия рангового коэффициента корреляции от 0 существует специальная таблица критических значений (1, 16). Можно также воспользоваться выражением:

где φ(р) - значение обратной функции нормального распределения при доверительной вероятности р(берется из таблицы).

Если вычисленное значение r окажется больше r крит., отличие его от нуля считается значимым. В противном случае считаем, что линейная связь между величинами не установлена.

В случае, если корреляционная связь имеет нелинейный характер, она может существовать и при r=0. В этой ситуации необходимо вычисление корреляционного отношения (η). Корреляционное отношение показывает, какую долю от общей дисперсии составляет дисперсия, учтенная уравнением регрессии (закономерная составляющая дисперсии):

Незакономерная, случайная составляющая дисперсии характеризует разброс значений вокруг линии регрессии. Таким образом:

Отсюда ясно, что, чем меньше случайная составляющая, т. е., чем меньше разброс значений от линии регрессии, тем выше значение корреляционного отношения. Закономерная составляющая дисперсии рассчитывается по формулам:

Выборочные данные при этом разбиваются на группы, для каждой из которых подсчитываются (или ). В формуле N - общее число наблюдений, т - число групп, ni- число наблюдений в i группе. Для расчета и S уследует воспользоваться формулой (23). ixiy

Значения η изменяются от 0 (связь отсутствует) до 1 (связь функциональная). В случае линейного характера взаимосвязи:

Таким образом, коэффициент корреляции можно рассматривать как частный случай корреляционного отношения. Закономерная составляющая дисперсии в этом случае связана с коэффициентом корреляции соотношением:

Значимость отличия η от нуля проверяется по критерию:

Условные обозначения те жe, что в формуле. Если η = 0, то Θ у распределена по нормальному закону с параметрами (0,1). Следовательно, если вычисленное значение Θ yпревысит 3 (при доверительной вероятности 0,99) или 2 (при доверительной вероятности 0,95), считаем, что корреляционная связь существует.

Критерий Фишера он основан на сравнении значений η и r , которые в случае линейного характера связи должны быть равны.

Обозначения те же, что в формуле (54). Если вычисленное значение превысит Fq, т-2 , N - т, взятое из таблиц распределения Фишера, то связь признается нелинейной.