- •Лабораторная работа №5. Корреляционно-регрессионный анализ
- •1. Общие понятия и определения
- •2. Оценка силы корреляционной связи
- •3.Оценка коэффициента корреляции по данным выборки
- •4. Оценка значимости коэффициента корреляции
- •Примеры решения задач
- •Варианты заданий
- •5. Парная линейная регрессия.
- •6. Расчет теоретической линии прямой регрессии
- •7. Обратная регрессия
- •Алгоритм расчета оптимальной формы связи
- •Примеры решения задач
- •Варианты заданий
3.Оценка коэффициента корреляции по данным выборки
Коэффициент корреляции XY для генеральной совокупности, как правило, неизвестен, поэтому он оценивается по экспериментальным данным, представляющим собой выборку объема n пар значений (хi, yi). Коэффициент корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции.
В качестве оценки
коэффициента корреляции в генеральной
совокупности XY
используется выборочный коэффициент
корреляции Браве
- Пирсона
.
Для его вычисления принимается
предположение о двумерном нормальном
распределении признаков Х и
Y
в генеральной совокупности, из которой
получены экспериментальные данные.
Это предположение может быть проверено
с помощью соответствующих критериев
согласия.
Нормированный
коэффициент корреляции Браве
– Пирсона
вычисляется по формуле
,
(3)
Где
,
.
4. Оценка значимости коэффициента корреляции
Если выборочный
коэффициент корреляции
отличен от нуля, то, учитывая случайность
выборки, еще нельзя сделать вывод о том,
что и коэффициент корреляции
для генеральной совокупности тоже
отличен от нуля. Для проверки существенности
(значимости) корреляционной связи двух
признаков в генеральной совокупности
используют t-критерий
Стьюдента.
Условия применения t – критерия: предположение о двумерном нормальном распределении признаков Х и Y в генеральной совокупности, из которой получены выборочные данные.
Гипотеза Но: =0 – в генеральной совокупности отсутствует корреляция, а отличие от нуля выборочного коэффициента корреляции объясняется только случайностью выборки.
Альтернатива Н1: 0.Уровень значимости: .
Порядок применения t – критерия Стьюдента:
1. Получают выборку объемом n пар значений (хi,уi).
2.
Определяют выборочный коэффициент
корреляции
.
Вычисляют практическое значение t – критерия
. (4)
По таблице распределения Стьюдента по заданному уровню значимости и числу степеней свободы k = n - 2 находят значение критической точки
tкр=t(/2, k).
5. Сравнивают |tпр| и tкр. Если |tпр| tкр, то гипотеза Но: XY = 0 принимается и делается вывод об отсутствии значимой корреляции признаков Х и Y в генеральной совокупности. Если |tпр| > tкр, то Но отклоняется, т.е. XY значимо отличается от нуля и признаки Х и Y коррелированны, а, значит, и зависимы.
Примечание. Чтобы
упростить применение t-критерия,
составлена таблица критических значений
коэффициента корреляции. При наличии
этой таблицы отпадает необходимость в
вычислениях по формуле
(4). Достаточно
просто сравнить выборочный коэффициент
корреляции
с критическим значением
при уровне значимости
и объеме выборки n.
Если окажется, что |
|<,
то гипотеза Но
принимается и делается вывод об отсутствии
значимой корреляции признаков Х
и Y
в генеральной совокупности. Если |
|>,
то гипотеза Но
отклоняется.
Для
двустороннего критерия это означает,
что коэффициент корреляции статистически
значимо отличается от нуля на уровне
значимости ,
для одностороннего критерия делается
вывод о наличии значимой положительной
или отрицательной корреляции признаков
Х
и Y
в генеральной совокупности. Заметим,
что таблица Приложения содержит
критические значения для двустороннего
t-критерия.
