
- •1.Виды регрессии. Спецификация модели.
- •Присутствие случайных ошибок в модели порождено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.
- •2.1.Линейная регрессия и корреляция: смысл и оценка параметров.
- •2.2. Оценка существенности параметров
- •Оценка значимости уравнения регрессии
- •Оценка значимости параметров уравнения регрессии
- •2.3 Интервалы прогноза
- •3. Средняя ошибка аппроксимации
- •4.1. Нелинейная регрессия: классы и виды.
- •I. Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам.
- •II. Регрессии, нелинейные по оцениваемым параметрам.
- •Оценка параметров моделей.
- •4.2. Корреляция для нелинейной регрессии
Оценка параметров моделей.
Для
оценки параметров в
моделях, нелинейных по оцениваемым
параметрам, но приводимых
к линейному виду, применяется
МНК к преобразованным
уравнениям.
Если в линейной модели и моделях,
нелинейных
по переменным, при оценке параметров
исходят из критерия
,
то в моделях, нелинейных по оцениваемым
параметрам,
требование МНК применяется не к исходным
данным
результативного признака, а к их
преобразованным величинам,
т. е. lny,
1/y.
Например, для оценки параметров степенной функции у=ахbE применяется МНК к линеаризованному уравнению lny=lna+blnx+lnE, т.е. решается система нормальных уравнений:
(Параметр b определяется непосредственно из системы, а параметр а - косвенным путем после потенцирования величины lna.)
Итак, оценка параметров основывается на минимизации суммы квадратов отклонений в логарифмах:
Соответственно
если в линейных моделях (включая
нелинейные
по переменным)
,
то в моделях, нелинейных по оцениваемым
параметрам,
Вследствие этого оценка параметров для линеаризуемых функций МНК оказываются несколько смещенной.
Проиллюстрируем
это на примере экспоненциальной
функции y=ea+bx
. .Прологарифмировав,
имеем:
lny=lna+xlnb.
Применяя
МНК, минимизируем
.
Система нормальных
уравнений составит:
Из
первого уравнения видно, что
Предположим,
что фактические данные сложились так,
что
.
Тогда
,
т
е параметр а представляет собой среднюю
геометрическую из значений переменной
у.
Между тем в линейной зависимости yxT=a+bx
при
параметр
,
т.
е. средней арифметической. Поскольку
средняя геометрическая
всегда меньше средней арифметической,
до и оценки параметров,
полученные из минимизации
,
будут несколько
смещены (занижены).
Практическое применение экспоненты возможно, если результативный признак не имеет отрицательных значений. Поэтому если исследуется, например, финансовый результат деятельности предприятий, среди которых наряду с прибыльными есть и убыточные, то данная функция не может быть использована. Если экспонента строится как функция выравнивания по динамическому ряду для характеристики тенденции с постоянным темпом, то у = аbt, где у — уровни динамического ряда; t — хронологические даты, параметр b означает средний за период коэффициент роста. В уравнении у = еа+bх этот смысл приобретает величина антилогарифма параметра b.
4.2. Корреляция для нелинейной регрессии
Уравнение линейной регрессии дополняется показателем корреляции – индексом корреляции.
-
общая дисперсия результативного признака
y;
-
остаточная дисперсия, определяемая из
уравнения дисперсии
Величина R находится в границах: 0≤ R ≤ 1, чем ближе к единице, тем связь рассмотренных признаков теснее – тем более надёжно найденное уравнение регрессии.
1)если преобразования уравнения в линейную форму связаны с независимой переменной (х), то для оценки тесноты связи может быть использован линейный коэффициент корреляции, так как его величина совпадает с индексом корреляции.
Ryx=ryz, где z может быть z=lg x, ln x, 1/x
Данное утверждение справедливо для равносторонней гиперболы, полулогарифмической кривой.
2)если преобразования в линейную форму связаны с зависимой переменной (у), то используемый коэффициент корреляции по преобразованным значениям признаков даёт приближённую оценку тесноты связи и численно не совпадает с индексом корреляции.
Ryx ≠rxz, где z – преобразованная переменная y
Оценка существенности R проводится аналогично оценке надёжности коэффициента корреляции (см. предыдущий материал, а именно п.2.2).
Индекс детерминации используется для проверки качества уравнения нелинейной регрессии .
Для оценки статистической значимости уравнения нелинейной регрессии рассчитывают F- критерий Фишера, и сравнивают его с табличным значением.
,
где R2 – коэффициент детерминации, n – число наблюдений, m – число параметров при переменной х.