
- •Часть 1
- •Рецензенты: Наговицина л.П. – д-р экон. Наук, проф. СибУпк Джурабаев к.Т. – д-р экон. Наук, проф. Нгту Гилева н.Г., канд. Экон. Наук, доц. СибУпк
- •Оглавление
- •Глава 2. Прогнозирование социально-экономического развития на основе трендов 43
- •Введение
- •Глава 1. Методологические основы социально-экономического прогнозирования
- •Основные понятия и сущность социально-экономического прогнозирования
- •Вопросы для самопроверки
- •1.2. Принципы социально-экономического
- •Прогнозирования
- •Среди основных принципов социально-экономического прогнозирования следует выделить в первую очередь объективность, адресность, научную и (или) прикладную значимость, доказательность прогнозов.
- •Вопросы для самопроверки
- •Задание для самостоятельной работы
- •1.3. Оценка точности прогнозирования и основные этапы разработки прогноза
- •Вопросы для самопроверки
- •1.4. Классификация методов прогнозирования
- •Вопросы для самопроверки
- •1.5. Типы, виды и содержание прогнозов
- •Вопросы для самопроверки
- •Глава 2. Прогнозирование социально-экономического развития на основе трендов
- •Техника выполнения расчетов при прогнозировании по уравнениям трендов
- •А. Прогнозирование с помощью программы excel
- •Б. Прогнозирование с помощью программы stadia
- •Вопросы для самопроверки
- •Практические задания
- •Глава 3. Прогнозирование по факторным регрессионным моделям
- •3.1. Прогнозирование по однофакторным динамическим
- •Моделям
- •Вопросы для самопроверки
- •Техника выполнения расчетов при прогнозировании по однофакторным динамическим моделям
- •Практические задания
- •3.2. Прогнозирование по многофакторным динамическим моделям
- •Вопросы для самопроверки
- •Техника выполнения расчетов при прогнозировании по многофакторным регрессионным моделям
- •Практические задания
- •3.3 . Прогнозирование по пространственным регрессионным моделям
- •Вопросы для самопроверки
- •Техника выполнения расчетов при прогнозировании по многофакторным регрессионным моделям
- •Глава 4. Применение машинных методов обнаружения закономерностей в анализе, планировании и прогнозировании
- •4.1. Сущность машинных методов обнаружения закономерностей
- •4.2. Многомерная классификация объектов
- •4.3. Выбор наиболее информативных признаков
- •4.4. Заполнение пробелов в эмпирических таблицах
- •Вопросы для самопроверки
- •Государственная система прогнозирования
- •5.2. Методика разработки и содержание прогноза
- •Прогноз содержит следующие разделы:
- •5.3. Планирование социально-экономического развития региона
- •Заключение
- •Библиографический список
- •Часть 1
- •630087, Новосибирск, пр.К.Маркса,26.
Вопросы для самопроверки
1. Что такое многофакторная динамическая модель?
2. Назовите особенности исходной информации при прогнозировании по многофакторным динамическим моделям.
3. Какое экономическое содержание имеют коэффициенты регрессии bi в многофакторных динамических моделях?
4. Что такое мультиколлениарность и как можно избежать ее?
5. Расскажите о правилах отбора факторов, включаемых в модель.
6. Что такое пошаговый регрессионный анализ?
7. Назовите этапы прогнозирования с помощью многофакторных динамических моделей.
Техника выполнения расчетов при прогнозировании по многофакторным регрессионным моделям
Все вычисления по определению параметров многофакторных уравнений целесообразно выполнять в программе STADIA (можно также использовать программы STATGRAPHICS и SGWIN).
В программе STADIA используется раздел “Статистического анализа” - “Множественная линейная”.
Для выполнения расчетов необходимо в программе STADIA ввести в электронную таблицу данные, на основании которых будет выполнен прогноз, затем вызвать в меню ”Статист=F9”, из открывшегося окна выбрать “М=множественная регрессия”. Ввести соответствующие переменные: Y - зависимая переменная ( например, объем товарооборота), X1, X2, X3,... Xi - независимые переменные (например, X1 - объем промышленного производства, X2 - индекс потребительских цен, X3 - средняя заработная плата).
На следующем шаге в открывшемся окне “Интерполяция” необходимо ввести значения X1, X2, X3, ... Xi в прогнозном периоде, причем будут спрогнозированы значения моделируемого показателя Y только для тех вариантов, по которым будут введены значения Xi .
После выполнения расчетов можно изучить полученные результаты, обращая внимание на параметры модели (значения а0, а1, а2, а3, ... аi). Далее в файле Rez приведены коэффициент множественной корреляции и коэффициент множественной детерминации, которые измеряют совместное влияние всех факторов, включенных в модель, на прогнозируемый показатель.
В следующей таблице приведены результаты прогнозных расчетов значений Y при данных значениях Xi .
Результаты расчетов можно скопировать в файл в программе EXCEL и определить ошибки прогноза по использованной ранее формуле, что позволит оценить точность прогнозирования.
Практические задания
На основе данных, приведенных в таблице 3.4, сделать прогноз объемов оборота розничной торговли по многофакторной динамической модели. Значения xi в предстоящем году спрогнозировать с помощью уравнения тренда. Проанализировать полученные результаты.
3.3 . Прогнозирование по пространственным регрессионным моделям
Прогнозирование по динамическим регрессионным моделям требует чрезвычайно тщательного анализа причинно-следственных зависимостей, так как нередко между явлениями существует ложная корреляция, когда изменения прогнозируемого показателя вызываются не тем фактором, который включен в модель, а другими причинами, вызывающими соразмерные изменения и моделируемого показателя, и фактора, который ошибочно считают независимым.
Кроме динамических, для прогнозирования используются и пространственные, статические модели, в которых исходными данными являются показатели, характеризующие изменчивость, вариацию различных характеристик объектов в пространстве. Эти модели менее подвержены искажениям взаимосвязей, вызванных автокорреляцией.
В этом случае исходные данные могут быть представлены в виде таблицы 3.5.
Таблица 3.5
Оборот розничной торговли (млрд руб.), объем промышленного производства (млрд руб.) и реальные денежные доходы (в процентах к соответствующему периоду прошлого года)
Территории |
Оборот розничной торговли |
Объем промышленного производства |
Реальные денежные доходы |
Башкортостан |
9964 |
25451 |
115 |
Удмуртия |
4220 |
7865 |
97 |
Курганская обл. |
1590 |
2671 |
103 |
Оренбургская обл. |
4244 |
11923 |
120 |
Пермская обл. |
10512 |
19777 |
113 |
Свердловская обл. |
13675 |
33769 |
99 |
Челябинская обл. |
7874 |
27694 |
105 |
Алтайский край |
4442 |
7050 |
96 |
Кемеровская обл. |
9513 |
22520 |
99 |
Новосибирская обл. |
7269 |
7438 |
101 |
Омская обл. |
6784 |
10082 |
98 |
Томская обл. |
2939 |
5340 |
93 |
Тюменская обл. |
14857 |
65311 |
111 |
Бурятия |
2111 |
3186 |
87 |
Красноярский край |
9843 |
24922 |
96 |
Иркутская обл. |
10505 |
15644 |
98 |
Читинская обл. |
2063 |
2336 |
81 |
Якутия |
3817 |
7994 |
84 |
Приморский край |
5893 |
9601 |
105 |
Хабаровский край |
4154 |
6733 |
90 |
Амурская обл. |
3619 |
2466 |
85 |
Как видно из таблицы 3.5, если при построении динамических моделей используется статистика, характеризующая изменения показателей по одному объекту за несколько лет, то при использовании пространственных (статических) моделей обрабатывается информация за один временной интервал (год, месяц) по множеству объектов. В этом случае отсутствуют взаимосвязи, вызываемые совместным изменением во времени прогнозируемого показателя и факторов - причин.
Модель может быть однофакторной и многофакторной, линейной и нелинейной. Однофакторная пространственная (статическая) модель выглядит так же, как и динамическая:
Y = a + bx.
Прогнозирование на основе пространственных (статических) моделей начинается, как и во всех предшествующих случаях, с определения целей прогнозирования, факторов, влияние которых будет учитываться при прогнозировании, затем необходимо изучить силу влияния факторов, отобранных для включения в модель. Теснота зависимости, сила влияния, как и при моделировании по динамическим выборкам, оцениваются с помощью коэффициентов корреляции и детерминации (парных - в случае однофакторной модели, множественных, если используется многофакторная модель).
Коэффициенты корреляции и регрессии рассчитываются точно так же, как и при прогнозировании по динамическим моделям.
Для примера приведем коэффициенты корреляции, полученные при обработке таблицы 3.5. Связь между объемами оборота розничной торговли и промышленного производства достаточно тесная - коэффициент корреляции при использовании уравнения линейной зависимости равен 0,87, то есть 76 % изменений оборота розничной торговли зависит от изменений объемов промышленного производства, а параметры уравнения следующие:
Y = 3193 + 0,228x.
Коэффициент регрессии b, равный 0,228 млрд руб., показывает, что при увеличении объема промышленного производства на 1 млрд руб. оборот розничной торговли увеличивается на 0,287 млрд руб. при начальном значении в 3193 млрд руб. Следует подчеркнуть, что данный статистический норматив действителен только для той совокупности объектов, по которым определялись параметры модели, и только для данного года. Переносить результаты расчетов на другие объекты или в другие временные интервалы можно лишь после многократных испытаний.
При использовании функции вида Y = 2,71x0,64 коэффициент корреляции равен 0,92, а его квадрат - 0,85. То есть данный тип модели является более адекватным, 85% изменений оборота розничной торговли объясняются изменениями объемов промышленного производства.
Как и во всех предшествующих случаях, прогнозирование начинается с определения целей прогноза, затем следуют этапы: выбор прогнозируемых показателей, факторов - причин, которые возможно будут включены в модель, сбор исходной информации, проверка ее достоверности, надежности, сопоставимости, экспериментальная проверка моделей и непосредственно прогнозные расчеты на заданную перспективу.
Как и при использовании динамических моделей, необходимо после испытаний выбрать тип модели, который обеспечит наилучшие результаты. Сложным остается вопрос о значениях независимых переменных в прогнозируемом периоде, для определения которых потребуется самостоятельно сделать прогноз любым из доступных методов.
Но существуют проблемы, которые характерны только для пространственных (статических) моделей.
Одной из них является отбор объектов, на основании информации о которых будут определяться параметры модели. Формальное требование заключается в том, что в исходной совокупности не должно быть резко выделяющихся объектов, представляющих другие типы или классы исследуемой совокупности. Например, если проводится прогноз показателей, характеризующих развитие крупных предприятий торговли, то нельзя включать в исходную информацию показатели по киоскам и лоткам. Для выявления резко отклоняющихся наблюдений используются и статистические процедуры, в том числе так называемое правило «трех сигм»: не следует включать объекты, показатели которых отклоняются от средних на плюс - минус 3 среднеквадратических значения.
Но в действительности подобная процедура не решает проблемы качества исходной информации. Даже если в исходной совокупности нет объектов, характеристики которых отклоняются на слишком большую величину, то вариант, когда коэффициенты регрессионного уравнения рассчитываются по всей совокупности объектов, может давать плохие результаты при прогнозировании по конкретному объекту. То есть регрессионная модель, которая дает хорошие результаты при аппроксимации моделируемого показателя для всей совокупности, не обязательно будет давать надежные прогнозы по конкретному объекту, особенно, если значения независимых переменных выходят за пределы тех, которые участвовали в расчетах параметров модели.
Поясним сказанное на конкретных примерах. Если для прогнозирования оборота розничной торговли по конкретным территориям (областям, краям, республикам) Сибири и Дальнего Востока взять исходную информацию по всем объектам, то коэффициент регрессии b, как это уже было сказано, будет статистическим нормативом, выражающим соотношение между моделируемым показателем (товарооборотом) и данным фактором (объемом промышленного производства). При этом учитываются реальные соотношения между данными показателями и в Новосибирской, и в Омской областях, и в Хакасии, и в Республике Алтай, в Якутии, на Камчатке и т.д.
Но сопоставлять затраты ресурсов и результаты по Якутии, Новосибирской области и Хакасии недопустимо по вполне объективным причинам: разные ценовые условия, объемы и т.д. Абсурдно на основе анализа состояния торговли в Якутии определять, используя традиционные, не математические методы, возможное развитие торговли в Новосибирской области. Но почему-то при применении корреляционно-регрессионных моделей допускается возможность переносить закономерности и экономические соотношения, сложившиеся в Якутии, на Новосибирскую или другую область.
Прогноз по пространственным (статическим) моделям будет надежным в том случае, если исходная совокупность представлена аналогичными, похожими объектами. К сожалению, в экономике подобное случается редко.
Однако выход из положения есть: надо рассчитывать уравнения регрессии индивидуальные для каждого объекта, а не единственные – для всех разнородных объектов. Трудно подобрать однородные объекты, но можно выбрать подмножество других объектов, относительно похожих на данный объект, которые будут его аналогами.
Поясним сказанное на конкретном примере. Если необходимо спрогнозировать объем товарооборота по Новосибирской области, то из исходной совокупности (все территории России) необходимо выбрать заданное число областей, краев, республик, которые по объективным характеристикам похожи на Новосибирскую область. Возможно, что в группу аналогов для Новосибирской области будут отобраны Омская, Иркутская, Кемеровская области. По этой выборке объектов - аналогов определяются коэффициенты регрессионной модели и проводится прогноз по Новосибирской области (после соответствующих экспериментальных испытаний).
Затем может возникнуть необходимость в прогнозировании этого показателя по Омской области. Опять же на первом этапе подбираются объекты - аналоги, причем в число аналогов для Омской области Новосибирская область может не войти, если у первой имеются более похожие аналоги. Эта же процедура должна использоваться при прогнозировании по всем другим объектам, то есть для каждого объекта, имеющегося в исходной совокупности, рекомендуется подбирать группу объектов - аналогов, по ней определяются параметры модели, которая и будет использоваться для прогнозирования.
Объект, для которого подбирается группа аналогов, должен иметь характеристики, близкие к средним характеристикам по группе аналогов. Поэтому рекомендуется для каждого объекта подбирать группу аналогов, а не использовать сформированную группу для прогнозирования по всем объектам, которые вошли в данную группу.
Будем иметь в виду, что группа аналогов, сформированная для прогнозирования объема оборота розничной торговли, может оказаться непригодной для расчета другого показателя, например, дохода населения.
Выбрать группы аналогов можно вручную, если число признаков не слишком большое. Выбор объектов можно провести путем ранжирования.
Вторым способом формирования группы аналогов является использование методов многомерной классификации - таксономии (кластерного анализа).
Третий метод заключается в подборе наиболее похожих объектов на основе коэффициентов корреляции между ними: чем больше величина коэффициента корреляции, тем более похожими друг на друга являются объекты. Для расчета коэффициентов корреляции между объектами матрица исходной информации трансформируется, чтобы признаки и объекты поменялись местами. Таким образом, определяется корреляция не между признаками, а между объектами.
Следующий шаг в прогнозировании - отбор наиболее значимых факторов. Первоначально на уровне гипотезы в модель включается максимально возможное количество факторов. Затем на основе экономического, логического анализов, изучения причинно-следствен-ных зависимостей, надежности информации из модели исключают факторы, которые слабо связаны с прогнозируемым показателем, а также из-за их неполной, ненадежной, несопоставимой информации. Некоторые факторы могут включаться в модель с временным лагом.
После первого отсеивания факторов по вышеуказанным причинам отыскивается модель, которая достаточно полно описывает зависимости и при этом не содержит лишних, дублирующих, мультиколлениарно связанных факторов. Оптимальной является модель, которая хорошо описывает зависимости и содержит при этом минимально возможный набор факторов. Подобная модель выбирается с помощью метода пошагового регрессионного анализа с проверкой качества модели и точности прогнозирования на каждом шаге.
При использовании пространственных регрессионных моделей необходимо изучать устойчивость корреляционно-регрессионных взаимосвязей, для чего проводится моделирование по одним и тем же объектам за несколько лет. В этом случае система моделей будет представлена следующими уравнениями:
за 1991 год - Yi = ai + bi1 xi1 + bi2 xi2 ...+ binxin.
за 1992 год - Yk = ak+ bk1xk1 + bk2xk2 ...+ bknxkn.
за 1993 год - Yl = al + bl1xl1 + bl2xl2 ...+ blnxln.
.......
за 1998 год - Ym= am + bm1xm1 + bm2xm2 ...+ bmnxmn.
Для анализа данной системы уравнений исходная информация должна быть представлена в виде информационного куба, который включает статистику об изменении некоторого множества показателей по данному количеству объектов наблюдения за несколько лет.
При анализе необходимо установить:
а) изменяются ли коэффициенты уравнений регресии а и b в течение ряда лет (месяцев) и если изменяются, то можно ли выявить устойчивую тенденцию и на ее основе спрогнозировать коэффициенты регрессии на предстоящий период;
б) как изменяются показатели, характеризующие независимые переменные (факторы - Xi), и если имеется устойчивая закономерность в их изменениях, то необходимо спрогнозировать их уровни на предстоящий период.
Если изменения коэффициентов регрессии а и b не существенны, то для прогнозирования используется модель, построенная по данным на момент времени, предшествующий прогнозируемому.
Для определения уровней факторов (Xi) может использоваться и другая методика: определяются параметры основного уравнения регрессии, которое назовем уравнением регрессии первого уровня:
Y = a + b1x1 + b2x2 ...+ bnxn.
Затем определяются все параметры уравнения регрессии второго уровня для каждого независимого переменного (фактора - Xi ):
X1 = a1 + b11x11 + b12x12 ...+ b1nx1n+;
X2 = a2 + b21x21 + b22x22 ...+ b2nx2n;
X3 = a3 + b31x31 + b32x32 ...+ b3nx3n; ...
Если в расчетах прогнозного показателя в уравнении регрессии первого уровня не участвует каждый фактор моделей второго уровня, то никаких дополнительных проблем с определением коэффициентов регрессии не возникает, их находят с помощью традиционного метода наименьших квадратов.
Однако могут быть ситуации, когда независимые переменные из уравнения первого уровня участвуют в расчетах параметров уравнений регрессии второго уровня, то есть, например, X1 зависит от X2 и от X3, X2 - от X3 и от X1 и т.д. Подобные модели называются функциями совмещенных переменных и для их решения используется особый метод - двухшаговый метод наименьших квадратов.
Таким образом, пространственные (статические) регрессионные модели являются более сложным методом прогнозирования, правильное использование которого может дать надежный прогноз. Естественно, что при этом возрастают требования к прогнозисту. Он должен не только выбрать тип модели, определить длину динамического ряда в период истории, выбрать наилучшие факторы, причинно и статистически связанные с моделируемым показателем, определить значения независимых переменных Xi, найти наилучшее сочетание факторов - независимых переменных, как это требовалось при прогнозировании по динамическим моделям, но и исследовать взаимосвязи на устойчивость и выбрать подсистему объектов, обеспечивающих выявление закономерностей, присущих данному классу (типу) объектов.