Скачиваний:
30
Добавлен:
26.01.2019
Размер:
102.91 Кб
Скачать
    1. Корреляционный анализ.

Корреляционный анализ применим в тех случаях, когда данные наблюдений или эксперимента можно считать случайными и выбранными из совокупности, распределенной по нормальному многомерному закону.

Основная задача корреляционного анализа состоит в выявлении связи между случайными переменными путем точечной и интервальной оценок различных коэффициентов корреляции.

Коэффициент корреляции является важнейшим показателем, оценивающим те или иные стороны стохастической связи, представляющей собой связь между случайными величинами, когда с изменением одной величины меняется распределение математического ожидания другой.

Коэффициент корреляции  независимых величин равен 0. Если  отличен от нуля, то своей величиной характеризует силу стохастической связи между случайными величинами. Чем больше абсолютная величина , тем сильнее корреляция между  и . Максимальная корреляция соответствует значениям =1. , то случайные величины  и  с точностью до случайных погрешностей одновременно возрастают или убывают, если <, то с возрастанием одной величины другая убывает.

Коэффициент корреляции является достаточно полным показателем зависимости между величинами, между которыми заранее можно предсказать из общих соображений линейную зависимость. Сильное отличие коэффициента корреляции от единицы свидетельствует о недостатках измерительного прибора или о наличии переменного сопротивления в цепи.

Если берутся выборочные математические ожидания и дисперсии, то вычисляется выборочный коэффициент корреляции r. Если r>0, то корреляционная связь между переменными называется прямой, если r<0 – обратной.

Оценка зависимостей случайных величин по выборочному коэффициенту корреляции называется корреляционным анализом.

Выборочный коэффициент корреляции r значимо отличается от нуля.

Для значимого коэффициента корреляции r находят доверительный интервал (интервальную оценку), который с заданной надежностью  содержит неизвестный генеральный коэффициент корреляции . При этом необходимо знать выборочное распределение коэффициента корреляции r, которое при  не равное 0 несимметрично и очень медленно сходится к нормальному распределению.

Вначале строят доверительный интервал для математического ожидания приблизительно нормального распределения z

;

,

где t1- – нормированное отношение z, опрелделяемое с помощью функции Лапласса

Ф(t1-)=

Для перехода от z к  используют специальные таблицы

При любой форме связи между переменными достоверным показателем ее интенсивности является эмпирическое корреляционное отношение Y по Х YX

,

где 2iy – межгрупповая дисперсия;

S2y – общая дисперсия переменной.

Величина 2YX называемая эмпирическим коэффициентом детерминации, показывает, какая часть общей вариации Y обусловлена вариацией Х.

Наряду с эмпирическим корреляционным отношением YX рассматривают показатель точности связи Ryx, характеризующий рассеяние точек корреляционного поля относительно линии регрессии Yx, или индекс корреляции Y по Х.

.

Связь корреляционного отношения  и R с коэффициентом корреляции r

0rR

При линейной зависимости между переменными индекс корреляции Ryx равен коэффициенту корреляции r по абсолютной величине.

Коэффициент детерминации R2, равный квадрату индекса корреляции (а для линейной модели – r2), показывает долю общей вариации зависимой переменной обусловленной изменчивостью объясняющей переменной. Чем ближе R2 к единице, тем менее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает зависимость переменных.

Расхождение между 2 и R2 (или r) может быть использовано для проверки линейности корреляционной зависимости.

Корреляционное отношение  значимо отличается от нуля, если статистика, имеющая F распределения Фишера – Снедекора, больше табличного значения F критерия на уровне значимости при числе степеней свободы k1=m-1 и k2=n-m, где n – объем выборки, m – число интервалов по группировочному признаку. Индекс корреляции R двух переменных значителен если значение статистики F=

=R2(n-2)/(1-R2) больше табличного F, k1, k2.

Соседние файлы в папке Математическая обработка результатов экспериментальных данных ГЭПП