Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
связи, корреляционный анализ - лекция 11.doc
Скачиваний:
14
Добавлен:
01.04.2025
Размер:
810.5 Кб
Скачать

1.7. Эмпирическое и теоретическое корреляционные отношения

Степень тесноты связи между переменными в случае не только линейной, но и нелинейной зависимости можно оценить с помощью теоретического корреляционного отношения теор. Поэтому теор часто называют «индексом корреляции». Теоретическое корреляционное отношение рассчитывается по формуле

где SR — сумма квадратов вследствие регрессии; ST общая сумма квадратов.

Ниже будут приведены формулы расчета SR и ST.

Для характеристики тесноты корреляционной связи между признаками в аналитических группировках межгрупповую дисперсию сопоставляют с общей дисперсией. Это сопоставление называется эмпирическое корреляционное отношениеэмп

2- межгрупповая дисперсия (по сгруппированным данным); σ2-общая дисперсия

Корреляционное отношение  определяется как

( 7 )

где - сумма квадратов отклонений индивидуальных значений yi от общей средней арифметической ; - сумма квадратов отклонений вариант от групповых средних , соответствующих определенным, фиксированным значениям независимой переменной x.

Корреляционное отношение можно рассчитать и по такой формуле

( 8 )

где - сумма квадратов отклонений групповых средних от общей средней .

Значения  распределены на отрезке [0; 1]: 0    1. Чем ближе  к 1, тем теснее связь между переменными Х и Y, тем больше колеблемость Y объясняется колеблемостью X.

В случае линейной зависимости r = . Если связь — нелинейная, то r < . Это позволяет использовать  в качестве меры линейности связи между переменными Х и Y. Если коэффициент корреляции r мало отличается от корреляционного отношения , то зависимость между переменными близка к линейной. В противном случае имеет место нелинейная зависимость между Х и Y.

Проверка значимости корреляционного отношения осуществляется с помощью критерия Фишера (F). Его значение рассчитывается по формуле:

, ( 9 )

где п — объем выборки; т — число групп.

Число групп, по которым осуществляется группировка исходных данных, можно определить по формуле Стерджесса:

m =1+3,322· lgN. (10 )

Критическое значение F определяется по таблицам распределения Фишера (приложение ) по уровню значимости а и числу степеней свободы: Fтеор.(;1;2), где 1 = m - 1; 2 = n - m;

Уровень значимости — это достаточно малое значение вероятности, отвечающее событиям, которые в данных условиях исследования будут считаться практически невозможными. Появление такого события считается указанием на неправильность начального предположения. Чаще всего пользуются уровнями = 0,05 или  = 0,01.

Расчетное значение Fнабл необходимо сравнить с теоретическим Fтеор. По общему правилу проверки статистических гипотез:

- если Fнабл < Fкр, нулевую гипотезу о том, что  незначим, нельзя отклонить;

- если Fнабл Fкр, нулевая гипотеза отклоняется в пользу альтернативной. Коэффициент  значимо отличается от нуля.

Квадрат эмпирического корреляционного отношения (2) называют коэффициентом детерминации. Он показывает, какая часть колеблемости Y объясняется колеблемостью X.

.

Он характеризует роль факторной вариации в общей вариации и может быть исчислен как с помощью дисперсионного анализа (разложением дисперсий методом аналитических группировок), так и с помощью регрессионных уравнений.