Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Компьютерные технологии статистической обработки данных.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
3.92 Mб
Скачать

4.3. Выборочный коэффициент корреляции.

Входные и выходные переменные можно рассматривать как компоненты двухмерной случайной величины. Пусть исследуется парная корреляционная зависимость между случайными компонентами X и Y двумерной двухмерной случайной величины и предположим, что в результате эксперимента получена выборка из двумерной нормальной генеральной совокупности. Степень тесноты статистической связи между двумя исследуемыми компонентами может быть измерена с помощью выборочного коэффициента корреляции [8, 9]:

(4.1.1),

где – оценка второго смешанного центрального момента случайной величины (X,Y), называемый ковариация величин X,Y.

Необходимо отметить, что коэффициент корреляции имеет четкий смысл как характеристика степени тесноты связи только в случае совместного нормального распределения исследуемых случайных величин X и Y.

Свойства коэффициента корреляции. В общем случае коэффициент корреляции может принимать значения |r| ≤ 1. В частности, если |r| = 1 между исследуемыми признаками существует функциональная линейная зависимость. При r = -1 имеет место отрицательная линейная зависимость, при r = 1 – положительная. Если r = 0, то параметры X и Y некоррелированы. Однако это вовсе не означает, что X и Y независимы, если априори допускается отклонение этой зависимости от линейной. Следовательно, некоррелированность не означает независимости исследуемой пары признаков. В то же время независимость всегда означает и некоррелированность X и Y. При r = 0 необходимо дополнительное статистическое исследование степени отклонения распределения рассматриваемых величин от нормального. Коэффициент корреляции обладает свойством симметрии, т.е. rxy = ryx.

Для случая многомерной случайной величины где р – размерность статистический анализ всех парных связей может быть представлен корреляционной матрицей.

 

x(1)

x(2)

. . .

x(p)

x(1)

1

. . .

x(2)

1

. . .

. . .

. . .

. . .

1

. . .

x(p)

. . .

1

Коэффициент корреляции как показатель степени тесноты парной статистической связи имеет четкий смысл при линейной связи и совместной нормальной распределенности исследуемых пар параметров многомерного параметра. Парный коэффициент корреляции не учитывает опосредованного или совместного влияния других факторов.

Надежность оценки степени тесноты корреляционной связи ослабевает с уменьшением объема выборки n, поэтому важно уметь определять минимальное значение rxy, отклонение которого от нуля можно считать значимым. Это задача проверки статистической гипотезы о значимости линейной связи [1,8]. Рассмотрим процедуру формирования и проверки такой гипотезы.

1-й шаг. Формирование гипотезы об отсутствии статистической связи

H0: rxy = 0,

H1: rxy ≠0.

2-й шаг. Задание уровня значимости α .

3-й шаг. В качестве критической статистики для проверки нулевой гипотезы выберем величину

Распределение статистики Yкр имеет t-распределение Стьюдента с (n - 2) числом степеней свободы.

4-й шаг. Определение расчетного значения критерия Tрасч=Yкр и критической точки tкр(α,n-2) по таблице распределения Стьюдента (приложение таблица ).

5-й шаг. Если выполняется условие |Tрасч|< tкр, то гипотеза Н0 верна с ошибкой первого рода α, в противном случае, Н0 отвергается.