Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский политехнический университет Петра Великого (бывш. СПбГПУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Бурлов_матем1.doc

Скачиваний:

110

Добавлен:

05.12.2018

Размер:

4.01 Mб

Скачать

☆

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2627 / 3427 28 29 30 31 32 33 34 > Следующая >>>

6.3. Этапы построения многофакторной корреляционно-регрессионной модели

Разработка модели и исследование экономических процессов должны выполняться по следующим этапам.

Априорное исследование экономической проблемы.
Формирование перечня факторов и их логический анализ.
Сбор исходных данных и их первичная обработка.

Спецификация функции регрессии.
Оценка функции регрессии.
Отбор главных факторов.
Проверка адекватности модели.

8. . Экономическая интерпретация.

9. Прогнозирование неизвестных значений зависимой переменной.

Рассмотрим подробнее содержание этапов.

1. Априорное исследование экономической проблемы.

В соответствии с целью работы на основе знаний макро-и микроэкономики конкретизируются явления, процессы, зависимость между которыми подлежит оценке. При этом подразумевается прежде всего четкое определение экономических явлений, установление объектов и периода исследования.

На этом этапе исследования должны быть сформулированы экономически осмысленные и приемлемые гипотезы о зависимости экономических явлений.

2. Формирование перечня факторов и их логический анализ.

Для определения наиболее разумного числа переменных в регрессионной модели прежде всего ориентируются на соображения профессионально-теоретического характера. Исходя из физического смысла явления, производят классификацию переменных на зависимую и объясняющую.

3. Сбор исходных данных и их первичная обработка.

При построении модели исходная информация может быть собрана в трех видах:

динамические (временные) ряды;
пространственная информация — информация о работе нескольких объектов в одном разрезе времени;
сменная - табличная форма. Информация о работе нескольких объектов за разные периоды.

Объем выборки зависит от числа факторов, включаемых в модель с учетом свободного члена. Для получения статистически значимой модели требуется на один фактор объем выборки, равный 1=5 8 наблюдений. Например, если в модель включаются три. фактора, то минимальный объем выборки

где т — число факторов, включаемых в модель;

п - число свободных членов в уравнении.

Если в квартальном разрезе собирать данные, то надо их собирать за 5 лет [20/4].

4. Спецификация функции регрессии.

На данном этапе исследования дается конкретная формулировка гипотезы о форме связи (линейная или нелинейная, простая или множественная и т. д.). Для этого используются различные критерии для проверки состоятельности гипотетического вида зависимости. На этом этапе проверяются предпосылки корреляционно-регрессионного анализа.

5. Оценка функции регрессии.

Здесь определяются числовые значения параметров регрессии и вычисление ряда показателей, характеризующих точность регрессионного анализа.

6. Отбор главных факторов.

Выбор факторов — основа для построения многофакторной корреляционно-регрессионной модели.

На этапе «Формирование перечня факторов и их логический анализ» собираются все возможные факторы, обычно более 20-30 факторов. Но это неудобно для анализа, и модель, включающая 20-30 факторов, будет неустойчива. Неустойчивость модели находит выражение в том, что в ней изменение некоторых факторов ведет к увеличению/ вместо снижения у.

Мало факторов — тоже плохо. Это может привести к ошибкам при принятии решении в ходе анализа модели. Поэтому необходимо выбирать более рациональный перечень факторов. При этом проводят анализ факторов на мультиколлинеарность.

Анализ и способы снижения влияния мультиколлинеарности на значимость модели

Мультиколлинеарность — попарная корреляционная зависимость между факторами.

Мультиколлинеарная зависимость присутствует, если коэффициент парной корреляции .

Отрицательное воздействие мультиколлинеарности состоит в следующем:

Усложняется процедура выбора главных факторов.
Искажается смысл коэффициента множественной корреляции (он предполагает независимость факторов).
Усложняются вычисления при построении самой модели.
Снижается точность оценки параметров регрессии, искажается оценка дисперсии.

Следствием снижения точности является ненадежность коэффициентов регрессии и отчасти неприемлемость их использования для интерпретации как меры воздействия соответствующей объясняющей переменной на зависимую переменную.

Оценки коэффициента становятся очень чувствительными к выборочным наблюдениям. Небольшое увеличение объема выборки может привести к очень сильным сдвигам в значениях оценок. Кроме того, стандартные ошибки оценок входят в формулы критерия значимости, поэтому применение самих критериев становится также ненадежным. Из сказанного ясно, что исследователь должен пытаться установить стохастическую мультиколлинеарность и по возможности устранить ее.

Для измерения мультиколлинеарности можно использовать коэффициент множественной детерминации

Д= R², (6.23)

где R — коэффициент множественной корреляции.

При отсутствии мультиколлинеарности факторов

(6.24)

где — коэффициент парной детерминации, вычисляемый по формуле

(6.25)

где — коэффициент парной корреляции между j-м фактором и зависимой переменной у.

При наличии мультиколлинеарности соотношение (6.24) не соблюдается. Поэтому в качестве меры мультиколлинеарности используется следующая разность: •

(6.26)

Чем меньше эта разность, тем меньше мультиколлинеарность. Для устранения мультиколлинеарности используется метод исключения переменных. Этот метод заключается в том, что высоко коррелированные объясняющие переменные (факторы) устраняются из регрессии и она заново оценивается. Отбор переменных, подлежащих исключению, производится с помощью коэффициентов парной корреляции. Опыт показывает, что если , то одну из переменных можно исключить, но какую переменную исключить из анализа, решают исходя из управляемости факторов на уровне предприятия.

Обычно в модели оставляют тот фактор, на который можно разработать мероприятие, обеспечивающее улучшение значения этого фактора в планируемом году. Возможна ситуация, когда оба мультиколлинеарных фактора управляемы на уровне предприятия.

Решить вопрос об исключении того или иного фактора можно только в соответствии с процедурой отбора главных факторов.

Отбор факторов не самостоятельный процесс, он сопровождается построением модели. Принятие решения об исключении факторов производится на основе анализа значений специальных статистических характеристик и с учетом управляемости факторов на уровне предприятия.

Процедура отбора главных факторов обязательно включает следующие этапы:

1. Анализ факторов на мультиколлинеарность и ее исключение. Здесь производится анализ значений коэффициентов парной корреляции между факторами х_i и х_у.

2. Анализ тесноты взаимосвязи факторов (х) с зависимой переменной (у).

Для анализа тесноты взаимосвязи х и у используются значения коэффициента парной корреляции между фактором и функцией (). Величина определяется на ЭВМ и представлена в корреляционной матрице вида:

№ переменной	x₁	x₂	x₃	…	x_m	y
X₁	1			…
x₂		1		…
x₃			1	…
…	…	…	…	…	…	…
x_m				…	1
y				…		1

Факторы, для которых = 0, т. е. не связанные с y, подлежат исключению в первую очередь. Факторы, имеющие наименьшее значение могут быть потенциально исключены из модели. Вопрос об их окончательном исключении решается в ходе анализа других статистических характеристик.

3. Анализ коэффициентов факторов, которые потенциально могут быть исключены.

Коэффициент учитывает влияние анализируемых факторов на у с учетом различий в уровне их колеблемости. Коэффициент показывает, насколько сигм (средних квадратических отклонений) изменяется функция с изменением соответствующего аргумента на одну сигму при фиксированном значении остальных аргументов:

(6.27)

где — коэффициент k-гo фактора;

—среднее квадратическое отклонение k-го фактора;

—среднее квадратическое отклонение функции;

— коэффициент регрессии при k-м факторе.

Из двух факторов х_i и х_j может быть исключен тот фактор, который имеет меньшее значение .

Допустим, исключению подлежит один из мультиколлинеарных факторов х_i или х_j. Оба фактора управляемы на уровне предприятия, коэффициенты регрессии а_i и а_j статистически значимы. Фактор х_i более тесно связан с у, т. е. , но при этом . В этом случае обычно исключению подлежит фактор x_j.

4. Проверка коэффициентов регрессии на статистическую значимость.

Проверка может быть произведена двумя способами:

• проверка статистической значимости а_к по критерию Стьюдента проводится по следующей формуле:

(6.28)

где а_k - коэффициент регрессии при k-м факторе;

— стандартное отклонение оценки параметра а_k.

Число степеней свободы статистики t_k равно f= п - т - 1, где т — количество факторов, включенных в модель. Значение t, вычисляемое по (6.28), сравнивают с критическим значением t_f_,_a , найденным по табл. П.1.1 приложения I при заданном уровне значимости и числе степеней свободы f(двухсторонняя критическая область).

Если , то а_k существенно больше 0, а фактор х_k оказывает существенное влияние на у. При этом фактор х_k оставляем в модели. Если , то фактор исключаем из модели;

• проверка статистической значимости а_k по критерию Фишера:

(6.29)

где — многомерный аналог критерия Стьюдента.

Число степеней свободы статистики F_k следующее: f₁=1, f₂ = п - т - 1. Значение F_k, вычисляемое по формуле (6.29), сравнивают с критическим значением , найденным по табл. П.2.1 приложения 2, при заданных уровне значимости и числе степеней свободы f₁,f₂.

Если , то — существенно больше 0, а фактор х_k оказывает существенное влияние на у. При этом фактор х_k оставляем в модели. Если , то фактор исключаем из модели.

5. Анализ факторов на управляемость.

В ходе логического анализа на основе экономических знаний исследователь должен сделать вывод: можно ли разработать организационно-технические мероприятия, направленные на улучшение (изменение) выбранных факторов на уровне предприятия. Если это возможно, то данные факторы управляемы. Неуправляемые факторы на уровне предприятия могут быть исключены из модели. Например, из двух факторов х₁ — средняя техническая скорость автомобилей и x₂- время погрузки-разгрузки на одну поездку при равенстве или близких по значению таких характеристик, как , исключению подлежит х₁. На уровне АТП практически невозможно повлиять на значение технической скорости, которая зависит в основном от климатических условий и величины транспортного потока.

Строится новая регрессионная модель без исключенных факторов. Для этой модели определяется коэффициент множественной детерминации Д.
Исследование целесообразности исключения факторов из модели с помощью коэффициента детерминации.

Прежде чем вынести решение об исключении переменных из анализа в силу их незначимого влияния на зависимую переменную, производят исследования с помощью коэффициента детерминации.

В первой регрессии содержится т объясняющих переменных, во второй — только часть из них, а именно m₁ объясняющих переменных. При этом т = т₁ + т₂, т.е. во вторую регрессию мы не включили т₂ объясняющих переменных. Теперь следует проверить, вносят ли совместно эти т₂ переменных существенную долю в объяснение вариации переменной у. Для этого используется статистика

(5.30)

которая имеет F-распределение с f₁ = т и f₂= n-m-1 степенями свободы. Здесь Д_т означает коэффициент детерминации регрессии с т объясняющими переменными, а — коэффициент детерминации регрессии с m₁-факторами.

Разность (Д_т — ) в числителе формулы является мерой дополнительного объяснения вариации переменной у за счет включения т₂ переменных.

Критическое значение находят по таблице F-распределения при заданном уровне значимости и f₁ и f₂ степенях свободы. Если то включение дополнительно объясняющих переменных совместно не оказывает значимого влияния на переменную у. Если ,то т₂ объясняющих переменных совместно оказывают существенное влияние на вариацию переменной у, и, следовательно, в этом случае все т₂ переменные нельзя исключать из модели.

При реализации первой ситуации () факторы окончательно исключаются из модели.

8 Проверка адекватности модели. Данный этап анализа включает:

• оценку значимости коэффициента детерминации. Данная оценка необходима для решения вопроса: оказывают ли выбранные факторы влияние на зависимую переменную? Оценку значимости Д следует проводить, так как может сложиться такая ситуация, когда величина коэффициента детерминации будет целиком обусловлена случайными колебаниями в выборке, на основании которой он, вычислен. Это объясняется тем, что величина Д существенно зависит от объема выборки.

Для оценки значимости коэффициента множественной детерминации используется следующая статистика:

(6.31)

которая имеет F-распределение с f₁= т и f₂ = п — т — 1 степенями свободы. Здесь Д= R², a m — количество учитываемых объясняющих переменных (факторов).

Значение статистики F вычисленное по эмпирическим данным, сравнивается с табличным значением . Критическое значение определяется по табл. П.2.1 приложения 2 по заданному и степеням свободы f₁ и f₂. Если , то вычисленный коэффициент детерминаций значимо отличается от 0 и, следовательно, включенные в регрессию переменные достаточно объясняют зависимую переменную, что позволяет говорить о значимости самой. регрессии (модели);

проверку качества подбора теоретического уравнения. Она проводится с использованием средней ошибки аппроксимации. Средняя ошибка аппроксимации регрессии определяется по формуле:

(6.32)

вычисление специальных показателей, которые применяются для характеристики воздействия отдельных факторов на результирующий показатель. Это коэффициент эластичности, который показывает, на сколько процентов в среднем изменяется функция с изменением аргумента на 1% при фиксированных значениях других аргументов:

(6.33)

доля влияния каждого факторах, в отдельности на вариацию у:

(6.34)

где - коэффициент бетта фактора х_j

Показатель g_i является мерой вариации результативного признака за счет изолированного влияния фактора x_j. Следует отметить, что система факторов, входящая в модель регрессии, - это не простая их сумма, так как система предполагает внутренние связи, взаимодействие составляющих ее элементов. Действие системы не равно арифметической сумме воздействий составляющих ее элементов. Поэтому необходимо определить показатель системного эффекта факторов :

(6.34)

На основе анализа специальных показателей и значений парной корреляции х с у делают вывод, какие из главных факторов оказывают наибольшее влияние на у. После этого переходят к разработке организационно-технических мероприятий, направленных на улучшение значений этих факторов, с целью повышения (снижения) результативного показателя у.

9. Экономическая интерпретация.

Результаты регрессионного анализа сравниваются с гипотезами, сформулированными на первом этапе исследования, и оценивается их правдоподобие с экономической точки зрения.

10. Прогнозирование неизвестных значений зависимой переменной.

Полученное уравнение регрессии находит практическое применение в прогностическом анализе. Прогноз получают путем подстановки в регрессию с численно оцененными параметрами значений факторов. Следует подчеркнуть, что прогнозирование результатов по регрессии лучше поддается содержательной интерпретации, чем простая экстраполяция тенденций, так как полнее учитывается природа исследуемого явления. Более подробно вопросы прогнозирования рассмотрены в следующем разделе.

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2627 / 3427 28 29 30 31 32 33 34 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.09.2019768.51 Кб3БУ Менеджмент.doc
#
21.03.2016453.63 Кб34БУ. Практическая задача.doc
#
17.11.201918.33 Кб3Бугалтерский учет.docx
#
09.11.2019573.44 Кб6Бузин - Этнография восточных славян (уч. пос.).doc
#
16.08.2019202.83 Кб5Бурлов.docx
#
05.12.20184.01 Mб110Бурлов_матем1.doc
#
05.12.20185.6 Mб53Бурлов_матем2.doc
#
11.11.20191.63 Mб43Бухгалтерский учет Практикум.doc
#
24.04.2019231.42 Кб2бфо.doc
#
30.11.2018172.44 Кб7БФУ.docx
#
16.04.201581.41 Кб34БХ экзамен.doc