Регрессионный анализ. Этапы моделирования

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный университет информатики и радиоэлектроники

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Шпоры 15-21.docx

Скачиваний:

Добавлен:

07.08.2019

Размер:

823.96 Кб

Скачать

☆

<<< < Предыдущая 12 / 32 3 > Следующая >>>

Регрессионный анализ. Этапы моделирования

Регрессионные модели применяются для исследования зависимости среднего значения анализируемой зависимой переменной от ряда независимых переменных (факторов). Модель множественной регрессии описывается соотношением

или

, (5.1)

где – значение зависимой (эндогенной) переменной в наблюдении , – значение фактора в наблюдении , , (экзогенная переменная), – случайная ошибка (отклонение). Коэффициенты модели называются параметрами модели (5.1), считаются неизвестными и подлежат оцениванию на основе методов статистического анализа. Уравнение (1.1) удобнее представлять в матричном виде. Пусть обозначает ( )-матрицу (вектор-столбец) ; – ( )-вектор коэффициентов; – ( )-вектор ошибок;

– ( )-матрицу объясняющих переменных.

Тогда модель (1.1) можно представить в виде

Для нахождения оценок неизвестных параметров модели можно использовать метод наименьших квадратов (МНК). МНК-оценка вектора параметров находится из условия минимума суммы квадратов отклонений наблюдаемых значений эндогенной переменной от модельных (теоретических) значений , определяемых функцией регрессии (1.1):

где – остатки модели, и имеет вид

. (5.2)

Для оценки точности и надежности модели используется несколько критериев (называемых статистиками или статистическими характеристиками).

1. Значимость (надежность) коэффициентов регрессии определяется с помощью t-критерия Стьюдента. По наблюдаемым значениям вычисляется t- статистика:

(5.3)

Если t_набл> t_кр ( , n-m-1) то полученное значение считается значимым и принимается гипотеза о наличии статистической связи между показателями, иначе принимается гипотеза об отсутствии связи между показателями.

При уровне значимости определяются доверительные интервалы коэффициентов регрессии по формулам:

( – , + ) (5.4)

2. Коэффициент корреляции r_xy– используется для оценки тесноты связи между показателями X и Y:

(5.5)

Известно, что . При этом, чем ближе к 1, тем сильнее статистическая связь между X и Y, если r_xy=0, то связь между Х и Y отсутствует. Если , то имеется положительная корреляция, т.е. при возрастании X статистически возрастает Y; если , то имеется отрицательная – при возрастании Х показатель Y статистически убывает.

Считается, что если то связь между показателями X и Y высокая и можно строить простую регрессию, если то связь между показателями слабая и вместо Х необходимо выбрать другой фактор для построения простой регрессии показателя Y, или увеличить количество наблюдений.

3. Коэффициент детерминации R² (R-квадрат) служит для оценки степени соответствия модели фактическим данным.

(5.6)

Здесь имеет место неравенство 0< R²<1. Коэффициент детерминации R²показывает, какую часть фактической вариации переменной Y составляет вариация регрессии. Если R²= 0,85, то модель объясняет наблюдаемые значения переменных на 85%.

Чем ближе R²к 1, тем точнее модель линейной регрессии; если R²>0,8 то модель линейной регрессии считается точной; если R²<0,5, то модель является неудовлетворительной, надо строить нелинейную регрессию или выбирать другой фактор Х.

4. Cтандартная ошибка регрессии:

(5.7)

5. Проверка значимости простой линейной регрессии осуществляется по F-критерию Фишера. По наблюдаемым значениям вычисляется F-статистика:

(5.8)

Если вычисленное значение F_набл больше табличного F_таб при заданном уровне значимости 0,05 и числе степеней свободы (n,n-m-1), то принимается гипотеза о наличии линейной регрессии между показателями X и Y. В противном случае эта гипотеза отвергается и следует признать модель неадекватной, т.е. ни одна из объясняющих переменных не оказывает существенного влияния на объясняемую переменную.

В случае, если корреляционное поле показывает явно нелинейную связь между показателями, или когда (согласно F-критерия) отвергнута гипотеза о линейной связи между X и Y, надо строить нелинейную регрессию.

Обычно рассматривают следующие уравнения нелинейной регрессии:

Y=β₀+β₁X+β₂X²+β₃X³+…+β_nXⁿ– полиномиальная регрессия,

Y=β₀+β₁Ln X – логарифмическая регрессия,

Y= β₀Exp(β₁X) – экспоненциальная регрессия,

Y= aX^β1 – степенная регрессия.

В этих случаях нелинейную регрессию сводят к линейной с помощью замены переменных. Пусть, исходя из экономических соображений или из вида корреляционного поля, выбрана степенная регрессионная модель:

Y= aX^β1

Логарифмируя, получим соотношение Ln(Y)=Ln(a)+ β₁Ln(X)

Делается замена переменных: V= Ln(Y), Z=Ln(X), β₀=Ln(a) и строится линейная регрессия:

V= β₀+ β₁Z

Откуда нелинейная регрессия будет иметь вид:

Y=Exp(β₀)X^β1.

Этот же метод используется при построении других видов нелинейной регрессии.

Построение регрессии в Excel выполняется следующим образом:

Строится корреляционное поле.
Наблюдаемые значения показателей вводятся в таблицу Excel.
Вычисляется коэффициент корреляции между показателями. Если он по абсолютной величине меньше 0.3, то связь между показателями слабая и для построения модели надо взять другие показатели или увеличить период наблюдения.
В пункте меню Сервис выбирается функция Анализ данных, где выбирается пункт Регрессия.
Для построения лучшей модели строится линейная и несколько нелинейных моделей регрессии, и по максимальному коэффициенту детерминации R² выбирается лучшая.
Оценивается значимость и надежность модели.
Вычисляются прогнозные значения показателей и их доверительные интервалы.

Пример. Наблюдения за 11 месяцев для объемов реализованной продукции и балансовой прибылью предприятия, представлены в табл. 1.2. Необходимо построить модель линейной регрессии и определить ее значимость, коэффициент детерминации и другие статистики, дать прогноз балансовой прибыли при объемах реализации, равных 82; 86 и 92.

Таблица 5.1

Y	1,2	1,8	2,0	2,5	3,0	3,2	3,5	4,9	5,0	6,2	7,3
Х	20	25	34	30	36	37	40	46	58	69	80

<<< < Предыдущая 12 / 32 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.2025289.79 Кб1ШПОРКИ.doc
#
01.03.2025599.55 Кб2Шпорки_эпр.docx
#
01.05.20252.35 Mб1шпорочки.docx
#
14.04.2019901.63 Кб6шпоры (1).doc
#
01.04.2025215.04 Кб1шпоры 1 контр(v1).doc
#
07.08.2019823.96 Кб8Шпоры 15-21.docx
#
22.04.201977.17 Кб5шпоры 16-45.docx
#
17.12.2018269.64 Кб4шпоры 43 вопроса.docx
#
01.03.20252.69 Mб3шпоры 501.doc
#
01.05.2025719.87 Кб3шпоры афитов ЭиОП 2012.doc
#
29.10.20184.33 Mб13Шпоры ВМ 2-й семестр.docx