4. Вычисляем коэффициенты уравнения линейной регрессии.
Уравнение линейной регрессии представляет собой уравнение прямой, аппроксимирующей (приблизительно описывающей) зависимость между случайными величинами X и Y. Если считать, что величина X свободная, а Y зависимая от Х, то уравнение регрессии запишется следующим образом
Y = a + b•X ( 4.1 ), где:
b = |
Rx,y |
|
= |
Rx,y |
|
( 4.2 ), |
a = My - b•Mx ( 4.3 )
Рассчитанный по формуле ( 4.2 ) коэффициент b называют коэффициентом линейной регрессии. В некоторых источниках a называют постоянным коэффициентом регрессии и b соответственно переменным. Погрешности предсказания Y по заданному значению X вычисляются по формулам :
σy/x= σy |
|
= Sy |
|
( 4.4 ) |
- абсолютная погрешность, |
δy/x= |
|
100% ( 4.5 ) - относительная погрешность |
Величину σy/x (формула 4.4 ) еще называют остаточным средним квадратическим отклонением, оно характеризует уход величины Y от линии регрессии, описываемой уравнением ( 4.1 ), при фиксированном (заданном) значении X.
4.1. Вычислим отношение |
|
. |
σy2 / σx2 = 5.42149 / 14.72727 = 0.36813
4.2. Вычислим отношение |
|
. |
Извлечем из последнего числа квадратный корень - получим: σy / σx = 0.60673 4.3 Вычислим коэффициент b по формуле ( 4.2 ) b = -0.34591 • 0.60673 = -0.20988 4.4 Вычислим коэффициент a по формуле ( 4.3 ) a = 13.18182 - ( -0.20988 • 51.00000) = 23.88552 4.5 Оценим погрешности уравнения регрессии. 4.5.1 Извлечем из σy2 квадратный корень получим:
σy= |
|
= 2.32841 ; |
4.5.2 Возведем в квадрат Rx,y получим: R2x,y = -0.345912 = 0.11966 4.5.3 Вычислим абсолютную погрешность (остаточное среднее квадратическое отклонение) по формуле ( 4.4 )
σy/x= 2.32841 |
|
= 2.18467 |
4.5.4 Вычислим относительную погрешность по формуле ( 4.5 ) δy/x = ( 2.18467 / 13.18182)100% = 16.57335%
ОТВЕТ: |
Уравнение линейной регрессии имеет вид: Y = 23.88552 -0.20988 X( 4.6 ) |
|
Погрешности уравнения: σy/x= 2.18467 ; δy/x= 16.57335% |
5. Строим диаграмму рассеяния (корреляционное поле) и график линии регрессии.
Диаграмма рассеяния — это графическое изображение соответствующих пар (xk , yk ) в виде точек плоскости, в прямоугольных координатах с осями X и Y. Корреляционное поле является одним из графических представлений связанной (парной) выборки. В той же системе координат строится и график линии регрессии. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы диаграмма была максимально наглядной. 5.1. Находим минимальный и максимальный элемент выборки X это 5-й и 8-й элементы соответственно, xmin = 46.00000 и xmax = 60.00000. 5.2. Находим минимальный и максимальный элемент выборки Y это 8-й и 9-й элементы соответственно, ymin = 10.00000 и ymax = 18.00000. 5.3. На оси абсцисс выбираем начальную точку чуть левее точки x5 = 46.00000, и такой масштаб, чтобы на оси поместилась точка x8 = 60.00000 и отчетливо различались остальные точки. 5.4. На оси ординат выбираем начальную точку чуть левее точки y8 = 10.00000, и такой масштаб, чтобы на оси поместилась точка y9 = 18.00000 и отчетливо различались остальные точки. 5.5. На оси абсцисс размещаем значения xk, а на оси ординат значения yk. 5.6. Наносим точки (x1, y1 ), (x2, y2 ),…,(x11, y11 ) на координатную плоскость. Получаем диаграмму рассеяния (корреляционное поле), изображенное на рисунке ниже. 5.7. Начертим линию регрессии. Для этого найдем две различные точки с координатами (xr1 , yr1) и (xr2 , yr2) удовлетворяющие уравнению (4.6), нанесем их на координатную плоскость и проведем через них прямую. В качестве абсциссы первой точки возьмем значение xmin = 46.00000. Подставим значение xmin в уравнение (4.6), получим ординату первой точки. Таким образом имеем точку с координатами ( 46.00000, 14.23120 ). Аналогичным образом получим координаты второй точки, положив в качестве абсциссы значение xmax = 60.00000. Вторая точка будет: ( 60.00000, 11.29293 ). Линия регрессии показана на рисунке ниже красным цветом
Обратите внимание, что линия регрессии всегда проходит через точку средних значений величин Х и Y, т.е. с координатами (Mx , My).