
- •Цель работы
- •Этапы и требования к выполнению разделов работы
- •Основные задачи
- •Исходные данные
- •Представить
- •Список рекомендуемой литературы
- •Введение
- •Расчет параметров уравнений линейной и нелинейной парной регрессии.
- •Расчет параметров линейной парной регрессии
- •Расчет параметров степенной парной регрессии
- •Расчет параметров показательной парной регрессии
- •Дисперсионный анализ линейной и степенной регрессии
- •Оценка тесноты связи расходов на железнодорожные перевозки и длины дороги с помощью показателей корреляции и детерминации
- •Оценка ошибки аппроксимации уравнений регрессии
- •Сравнительная оценка силы связи длины дороги с расходом с помощью среднего коэффициента эластичности
- •Оценка статистической надежности результатов линейного регрессионного моделирования
- •3.7.Расчет прогнозного значения расходов на железнодорожные перевозки по линейной модели при увеличении длины дороги
- •Реализация решенных задач на компьютере
Оценка тесноты связи расходов на железнодорожные перевозки и длины дороги с помощью показателей корреляции и детерминации
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существуют различные формы записи линейного коэффициента корреляции. Наиболее часто встречаются следующие:
rxy = b(Sx/Sy) = Mxy/( Sx \ Sy) = ( - )/ SxSy.
Как известно, линейный коэффициент корреляции находится в пределах: -1 ≤ rxy ≤ 1. Если коэффициент регрессии b > 0, то 0 ≤ rxy ≤ 1, и, наоборот, при b<0, -1 ≤ rxy ≤ 0.
Используя первое выражение для rxy, рассчитаем линейный коэффициент парной корреляции:
rxy = b(Sx/Sy) = 3,2110 (2191,1976/8792,3929) = 0,8002.
Значение коэффициента корреляции показывает, что связь прямая, то есть с увеличением длины дороги пассажирооборот железнодорожных перевозок увеличивается.
Для оценки качества подбора линейной функции необходимо определить квадрат линейного коэффициента rxy2, который называется коэффициентом детерминации. Он характеризует долю дисперсии (разброса) пассажирооборота железнодорожных перевозок y, объясняемую зависимостью от длины дороги x, в общей дисперсии, возникающей за счет влияния множества факторов не учтенных функцией регрессии.
Соответственно величина 1 - rxy2 характеризует долю дисперсии пассажирооборота железнодорожных перевозок y, вызванную влиянием остальных не учтенных в математической модели факторов.
Определим коэффициент детерминации:
ryx2 = (0,8002)2 = 0,6403.
Следовательно, изменение результата (пассажирооборот железнодорожных перевозок) на 64,0% объясняется изменением фактора (длины дороги).
В отличие от линейной регрессии нелинейная регрессия характеризуется не коэффициентом корреляции, а индексом корреляции Rxy и индексом детерминации Rxy2:
Rxy = ( 1 – (Sост2/Sy2 )1/2,
где
Sост2 = ( (y1 - ŷx1)2 + (y2 - ŷx2)2 + ....+ (y7 - ŷx16)2 )/ n;
Sy2 = ( (y1 - )2 + (y2 - )2 + ....+ (y7 - )2 )/ n.
Величина данного показателя находится в пределах
0 ≤ Rxy ≤ 1, причем чем она ближе к единице, тем теснее связь между пассажирооборотом железнодорожных перевозок и длиной дороги, тем более надежное уравнение регрессии.
Расчеты показателей степени связи между пассажирооборотом железнодорожных перевозок и длиной дороги при степенной модели показывают, что она несколько лучше линейной модели.
Аналогичная оценка для показательной функции регрессии находится на уровне линейной, несколько хуже степенной.
Оценка ошибки аппроксимации уравнений регрессии
Из приведенных в таблицах расчетных данных следует, что фактическое значение пассажирооборота железнодорожных перевозок y (результативный признак) отличается от теоретических ŷx, рассчитанных по одному из уравнений регрессии. Очевидно, чем меньше это отличие, тем ближе опытные данные к теоретическим значениям и тем лучше качество модели.
Величина, представляющая собой разность опытного и теоретического результативного признака, (y - ŷx ) для каждого опыта представляет собою ошибку аппроксимации функции, связывающей пассажирооборот и длину дороги. В данном случае число таких опытов равно шестнадцати. Для оценки каждого опыта используются не сами разности, а их абсолютные значения разности опытного и теоретического результативного признака отнесенные к опытному, выраженные в процентах, то есть:
Аi =│(yi-ŷxi)/yi|100% .
Оценка качества всей функции регрессии может быть осуществлена как средняя ошибка аппроксимации – средняя арифметическая Аi :
А = (А1 + А2 + …..+ А16 ) / 16 .
Найдем величину средней ошибки аппроксимации линейной функцией связи между пассажирооборотом железнодорожных перевозок и длиной дороги:
А = 545,51/ 16 = 34,09 %.
Аналогично получим среднюю ошибку аппроксимации для степенной А = 35,29 % и для показательной функций А = 63,36 %.
Их анализ говорит, что ошибка аппроксимации находится в допустимых для практического использования пределах, однако с теоретической точки зрения может быть продолжен поиск более качественной функции регрессии.