
- •Методы статистического изучения корреляционной связи
- •Измерение степени тесноты связи
- •3)Корреляционное отношение - ; 4)Коэффициент ранговой корреляции Спирмэна – s и Кендела; 5) Коэффициент корреляции разностей- ; 6) Коэффициент ассоциации- .
- •Линейный коэффициент корреляции
- •Пример расчета линейного коэффициента корреляции.
- •Корреляционное отношение
- •Коэффициент корреляции рангов
- •Коэффициент корреляции Кендела
- •Регрессионный анализ
- •1) 2) , Такой подход к решению данной проблемы называется методом наименьших квадратов, т.Е.Если мы выдвинули гипотезу о линейном характере связи, то должно соблюдаться следующее требование:
- •Выбор формы уравнения (регрессии)
- •Множественная корреляция
- •Характеристика тесноты связи в многофакторном корреляционном анализе
Выбор формы уравнения (регрессии)
По эмпирической линии регрессии и по исходным данным трудно решить вопрос о том, какая функция наилучшим образом может описать имеемую зависимость. Для решения этой проблемы существует ряд методов:
1)Выбор функции
методом нахождения минимальной
среднеквадратической ошибки уравнения.
На основе логического анализа выбирается
ряд функций. С помощью систем нормальных
уравнений определяются их параметры и
находят теоретическое значение
результативного признака (
).
Далее определяется среднеквадратическая
ошибка для каждого уравнения (функции)
по формуле:
,
где
-
ошибка уравнения;
-
эмпирическое значение результативного
признака в исходной совокупности;
теоретическое
значение результативного признака,
рассчитанное по уравнению корреляционной
связи и полученное подстановкой значений
факторного признака ;
объем
совокупности; m-
число параметров в выбранном уравнении.
Функция, которой соответствует минимальная
ошибка уравнения, является наиболее
подходящей.
Кроме того, решить
вопрос об адекватности выбранного
уравнения можно с помощью неравенства:
.
2)Следующий метод для проверки степени близости выбранной теоретической линии регрессии к фактическим данным- это расчет индекса корреляции, который одновременно служит и показателем степени тесноты связи:
. Этот показатель
изменяется в пределах от 0до 1. Если он
равен 0, то это означает, что между
переменными нет связи, или если она и
существует, то не может быть охарактеризована
избранной функцией. В случае, когда
незначительно отличается от линейного
коэффициента корреляции, это свидетельствует
об обоснованности выбора прямой, как
линии связи.
Для проверки правильности выбранного уравнения связи используют также F- распределение. Рассчитывается выражение:
,
где n-
общее число наблюдений; к- число групп,
на которые разбит факторный признак;
число
наблюдений в j-той
группе; m-
число параметров в уравнении регрессии;
-
среднее значение результативного
признака в j-группе;
-
индивидуальное значение результативного
признака;
-
значения результативного признака,
рассчитанные по уравнению регрессии,
и полученные подстановкой средних
значений
факторного признака в j-той
группе.
По таблице находим
F
c
числом степеней свободы k-m
для числителя и n-k
для знаменателя. Сопоставив F
и F
делаем вывод: если
F < F - гипотеза о правильности выбранной формы уравнения не отвергается, если F > F гипотеза отвергается.
В приведенном выше F-распределении, первое отношение характеризует меру рассеивания групповых средних вокруг линии регрессии, а второе отношение – меру рассеивания эмпирических данных вокруг групповых средних, т.е. если в первом случае рассеивание зависит от выбранного вида линии регрессии, то во втором случае мы имеем меру независимую от выбранного вида уравнения.
Так как основное применение метода корреляционно- регрессионного анализа используется при решении задач обоснованного прогноза, то целесообразно проверить, какое среднее квадратическое отклонение больше:
или
,
т.е. сравнивают среднюю квадратическую
ошибку уравнения и среднюю квадратическую
ошибку результативного показателя,
рассчитанную по эмпирическим данным.
Таким образом, за
основу прогноза берут или теоретическое
значение результативного показателя
(
), или эмпирическое значение
Средняя квадратическая ошибка уравнения дает возможность в каждом отдельном случае с определенной вероятностью указать, что величина результативного признака ( ) окажется в определенном интервале относительно значения, вычисленного по уравнению связи.
Зная дисперсию
показателя
и
задаваясь уровнем доверительной
вероятности, определяем доверительные
границы результативного признака при
значении факторного признака -
(условное
обозначение любого значения факторного
признака). Доверительный интервал
(границы) результативного признака
определяются по формуле:
,
где
-определяется
в соответствии с уровнем значимости
,
по распределению Стьюдента и с
степенями свободы. Величина множителя
будет вычисляться
для каждого значения