- •Корреляционный и регрессионный анализ (лекции с анимированными фрагментами)
- •Введение
- •1.1. Виды взаимосвязей между признаками
- •1.2. Корреляционные поля и цель их построения
- •1.3. Коэффициенты корреляции и их свойства.
- •1.4. Нормированный коэффициент корреляции Браве-Пирсона
- •Задания на тему лекции
- •1.5. Коэффициент ранговой корреляции Спирмена
- •Задания по теме лекции
- •2.1. Понятие регрессии
- •2.2. Уравнение линейной регрессии
- •2.3. Коэффициенты уравнения парной линейной регрессии
- •2.4. Связь между коэффициентами регрессии и корреляции
- •2.5. Определение параметров парной линейной регрессии
- •2.6. Графическое представление уравнения парной линейной регрессии
- •Задания по теме лекции
- •Литература
- •Приложения
- •Задача 1 – связь прямая, отрицательная. Задача 2 – связь прямая, положительная. Задача 3 – связь практически отсутствует.
2.6. Графическое представление уравнения парной линейной регрессии
Эмпирические ряды регрессии Y по Х
и Х по Y изображаются в виде
линейного графика, при построении
которого наиболее точным является
использование способа наименьших
квадратов, предложенного в 1806 г. К.
Гауссом и независимо от него А. Лежандром.
В основу этого способа положена теорема,
согласно которой сумма квадратов
отклонений вариант (xi) от
средней арифметической (
)
есть величина наименьшая, т. е.
.
Отсюда и название метода, который нашел
широкое применение не только в биологии,
но и в технике. Мы уже говорили об этом
методе и применяли его, когда находили
параметры а и b линейной регрессии,
отыскивая эмпирическое уравнение.
При графическом изображении эмпирического уравнения регрессии (например, показатели роста и веса 10 исследуемых), представленного на рисунке 2.2 используется следующая последовательность:
Определив форму и направление взаимосвязи между эмпирическими данными на основе данных расчета нормированного коэффициента корреляции, производят расчет уравнений регресиии (прямого и обратного) по формуле (2.13).
Подставляя в конечный вид уравнений, выражающих зависимость между переменными величинами Y и X, эмпирические данные xi и yi находят координаты точек линий регрессии для усредненных значений yx и xy.
На графике, выполненном в прямоугольной системе координат, на оси x откладывают значения переменных xi, на оси у – значения yi и отмечают точками рассчитанные координаты линий регрессии для усредненных значений yx и xy (рис.2.2).
Две линии регрессии на графике пересекаются в точке М с координатами средних значений показателей xi и yi.
Рис.2.2. Графическое изображение эмпирического уравнения регрессии.
График линий регрессии отражает ряды теоретически ожидаемых значений функции по известным значениям аргумента. При этом, чем сильнее взаимосвязь между величинами xi и yi, тем меньше угол между линиями регрессии. При r = линии уравнения регресии либо совпадают, либо расположены параллельно, так как корреляционная зависимость между признаками в этом случае переходит в функциональную. И, наоборот, чем слабее зависимость между признаками, тем больше угол между линиями на графике. При r = 0 линии регрессии расположены перпендикулярно.
Просмотрите примеры решения задач.
Пример 2.2. Рассчитать и построить график уравнения прямолинейной регрессии для относительных значений PWC170 и времени челночного бега 3х10 м у 13 исследуемых и сделать вывод о точности расчета уравнений, если данные выборок таковы:
xi, кГ м/мин/кг ~ 15,6; 13,4; 17,9; 12,8; 10,7; 15,7; 11,7; 12,3; 12,3; 11,1; 14,3; 12,7; 14,4
yi, с ~ 6,9; 7,2; 7,1; 6,7; 7,6; 7,0; 6,4; 6,9; 7,7; 7,6; 7,9; 8,2; 6,8
Решение
1. Занести данные тестирования в рабочую таблицу и сделать соответствующие расчеты.
xi |
xi - |
(xi - )2 |
yi |
yi – |
(yi – )2 |
(xi - )(yi – ) |
15.6 |
2.1 |
4.41 |
6.9 |
-0.3 |
0.09 |
-0.63 |
13.4 |
-0.1 |
0.01 |
7.2 |
0 |
0 |
0 |
17.9 |
4.4 |
19.36 |
7.1 |
-0.1 |
0.01 |
-0.44 |
12.8 |
-0.7 |
0.49 |
6.7 |
-0.5 |
0.25 |
0.35 |
10.7 |
-2.8 |
7.84 |
7.6 |
0.4 |
0.16 |
-1.12 |
15.7 |
2.2 |
4.84 |
7.0 |
-0.2 |
0.04 |
-0.44 |
11.7 |
-1.8 |
3.24 |
6.4 |
-0.8 |
0.64 |
1.44 |
12.3 |
-1.2 |
1.44 |
6.9 |
-0.3 |
0.09 |
0.36 |
12.3 |
-1.2 |
1.44 |
7.7 |
0.5 |
0.25 |
-0.60 |
11.1 |
-2.4 |
5.76 |
7.6 |
0.4 |
0.16 |
-0.96 |
14.3 |
0.8 |
0.64 |
7.9 |
0.7 |
0.49 |
0.56 |
12.7 |
-0.8 |
0.64 |
8.2 |
1 |
1 |
-0.80 |
14.4 |
0.9 |
0.81 |
6.8 |
-0.4 |
0.16 |
-0.36 |
= 13.5 |
|
=50,92 |
= 7,2 |
|
=3,34 |
= -2,64 |
1. Рассчитать значение нормированного коэффициента корреляции по формуле:
2. Рассчитать конечный вид уравнений прямолинейной регрессии по формулам (2) и (3):
(2)
(3)
Т.е.
4. Рассчитать абсолютные погрешности уравнений регрессии по формулам (4) и (5):
5. Рассчитать относительные погрешности уравнений регрессии по формулам (6) и (7):
6. Для графического представления корреляционной зависимости между признаками рассчитать координаты линий регрессии, подставив в конечный вид уравнений (1) и (2) данные любого исследуемого (например, четвертого из списка).
Тогда:
при х = 12,8 кГм/мин/кг у =7,235 с » 7,2 с;
при у = 6,7 с х = 13,895 с » 13,9 кГм/мин/кг.
7. Представить графически данное уравнение регрессии.
8. На основании произведенных расчетов и графического изображения уравнения регрессии сделать вывод.
Вывод:
1) в исследуемой группе наблюдается недостоверная обратная взаимосвязь между данными относительных значений PWC170 и времени челночного бега 3х10 м, т.к. rху = -0,20 < rst = 0,55 для К= 11 при = 95%;
2) относительная погрешность функции ух = 7,875 – 0,05х меньше (7,22%), а, следовательно, прогноз результата в челночном беге по данным относительных значений пробы PWC170 более точен;
3) на графике линии уравнения регрессии расположены почти под прямым углом, так как значения коэффициента корреляции близки к нулю.
