Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭММ / ЭМММ часть 1.doc
Скачиваний:
48
Добавлен:
29.02.2016
Размер:
1.46 Mб
Скачать

3.2 Задание

Имеется зависимость объема выпуска сельскохозяйственной продукции (млн р.) у от четырех факторов: количества минеральных удобрений на 1 га посевов (х1, кг), качества почвы (х2, баллов), количества осадков в период вегетации (х3, г) и среднего количества работников на 1 га (х4, чел.). Необходимо построить модель множественной регрессии, отражающую зависимость количества покупок от указанных факторов. Данные об этих показателях за последние 20 месяцев представлены в таблице 3.1.

Необходимо выполнить следующее.

1 Построить регрессионное уравнение с использованием «Пакета анализа» MS Excel.

2 Обосновать вывод о мультиколлинеарности полученной регрессии.

3 Устранить явление мультиколлинеарности с помощью какого-либо метода.

4 Проанализировать статистические характеристики нового регресс-

сионного уравнения с использованием «Пакета анализа» MS Excel и сделать вывод об устранении явления мультиколлинеарности.

Отчет о лабораторной работе должен содержать описание задания, описание выполнения лабораторной работы и анализ результатов.

Таблица 3.1 – Исходные данные

n

y

x1

x2

x3

x4

1

535+N

8,39

30,31

785

2,137

2

515-N

6,83

24,68

802

2,186

3

382+N

5,54

20

650

1,994

4

721-N

8,47

30,59

994

2,191

5

276+N

6,13

22,13

719

2,126

6

513-N

5,77

20,85

677

1,906

7

664+N

7,8

28,18

915

2,765

8

409-N

4,8

17,35

563

3,686

9

537+N

5,42

19,57

636

1,532

10

794-N

9,31

33,62

792

2,983

11

561+N

6,58

23,78

772

2,147

12

388-N

4,48

16,17

525

2,368

13

630+N

7,41

26,76

869

2,675

14

769-N

8,55

30,88

803

2,148

15

470+N

5,52

19,95

648

1,554

16

511-N

6,01

21,7

705

1,598

17

549+N

6,19

22,36

726

1,818

18

531-N

8,85

31,96

938

1,862

19

499+N

7,21

26,05

846

2,895

20

503-N

5,99

21,65

703

1,818

Контрольные вопросы

1 Что такое мультиколлинеарность? Каковы причины возникновения мультиколлинеарности и ее основные последствия?

2 Как можно обнаружить мультиколлинеарность?

3 Каковы основные методы устранения мультиколлинеарности?

4 Методы и модели анализа временных рядов

Цель: выявление структуры временного ряда и построение аддитивной и мультипликативной моделей временных рядов.

4.1 Теоретические положения

Временной ряд – это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов. Каждый уровень временного ряда формируется из трендового (Т), сезонного (S) и случайного (Е) компонентов [1–5].

Тренд – это некоторое устойчивое, систематическое изменение, наблюдаемое в течение длительного времени и описывающее долговременную тенденцию развития изучаемого показателя. В качестве математической модели тренда выбирают кривую, наилучшим образом отражающую характер излучаемого ряда. В простейшем случае это может быть прямая , в более сложном случае – полином порядка m.

Модели, построенные по данным, характеризующим один объект за ряд последовательных моментов (периодов), называются моделями временных рядов.

При наличии трендовой и сезонной составляющих значения каждого последующего уровня ряда зависят от предыдущих значений. Автокорреляция уровней рядаэто корреляционная зависимость между последовательными уровнями временного ряда. Ее можно измерить с помощью коэффициента автокорреляции уровней ряда, т. е. между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени. Число периодов, по которым рассчитывают коэффициент автокорреляции, называется лагом.

С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается.

Последовательность коэффициентов автокорреляции уровней первого, второго и т. д. порядков называют автокорреляционной функцией временного ряда, а график зависимости ее значений от величины лага (число периодов, по которым рассчитывается коэффициент автокорреляции) – коррелограммой. При помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.

Если наиболее высоким оказался коэффициент автокорреляции первого порядка, то исследуемый временной ряд содержит только трендовую составляющую.

Если наиболее высоким оказался коэффициент автокорреляции порядка t, то ряд содержит сезонные циклические колебания с периодичностью t моментов времени.

Если ни один из коэффициентов автокорреляции не оказался значимым, можно сделать предположение относительно структуры этого ряда: либо ряд не содержит трендовую и сезонную составляющие и имеет случайную составляющую Е, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ.

Модели, в которых временной ряд представлен как сумма трех перечисленных компонентов – аддитивные модели вида:

Y = T + S + E.

Модели, в которых временной ряд пред­ставлен как произведение, – мультипликативные модели вида:

Y = T S E.

Выбор одной из двух моделей производят на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонного компонента предполагаются постоянными для различных циклов.

Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонного компонента.

Построение аддитивной и мультипликативной моделей сводится к расчету значений трендовой Т, сезонной S и случайной Е составляющих для каждого уровня ряда. Построение модели включает следующие шаги [5]:

1) выравнивание исходного ряда методом скользящей средней;

2) расчет значений сезонного компонента S;

3) устранение сезонного компонента из исходных уровней ряда и получение выровненных данных в аддитивной (Т Е) или в мульти­пликативной (Т · Е) модели.

4) аналитическое выравнивание уровней (Т + Е) или (Т · Е) и расчет значений Т с использованием полученного уравнения тренда;

5) расчет полученных по модели значений (Т + S) или (T·S);

6) расчет абсолютных или относительных ошибок.

Пример Для заданного временного ряда необходимо следующее.

  1.  Построить график временного ряда.

  2.  Определить вид модели и период сезонных колебаний.

  3.  Произвести выравнивание исходного ряда методом скользящей средней.

  4.  Найти значения сезонного компонента S.

  5.  Устранить сезонный компонент из исходных уровней ряда и получить выровненные данные в аддитивной (Т + Е) или в мультипликативной (Т ∙ Е) модели.

  6.  Произвести аналитическое выравнивание уровней (Т + Е) или (Т ∙ Е) и рассчитать значения Т с использованием полученного уравнения тренда.

  7.  Получить расчетные значения: (Т + S) или (Т ∙ S).

  8.  Определить абсолютные ошибки.

  9.  Найти прогноз двух последующих уровней временного ряда.

Решение

1 График временного ряда представлен на рисунке 4.1.

Рисунок 4.1 – График временного ряда Рисунок 4.2 – Коррелограмма

2 Поскольку ряд изменяется приблизительно в постоянном диапазоне, данный временной ряд представлен аддитивной моделью. Период сезонных колебаний можно определить с помощью коэффициентов автокорреляции. Расчет коэффициентов автокорреляции представлен на рисунке 4.3. Коррелограмма этого ряда представлена на рисунке 4.2. Наибольшее значение имеет коэффициент автокорреляции 4-го порядка. Следовательно, временной ряд имеет трендовый и сезонный компоненты с периодом, равным четырем кварталам.

Рисунок 4.3 – Расчет коэффициентов автокорреляции

3 Выравнивание исходных уровней ряда проводится мето­дом скользящей средней. Для этого:

а) суммируются уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и путем деления полученных сумм на 4 находятся скользящие сред­ние. При этом в ячейку С9 введена формула =СРЗНАЧ(B8:B11), скопированная в диапазон С10:С21. Полученные таким образом выровненные значения уже не со­держат сезонного компонента и представлены в столбце «скользящая средняя за 4 квартала» (рисунок 4.4).

б) полученные значения приводятся в соответствие с фактичес­кими моментами времени, для чего находятся средние значения из двух последовательных скользящих средних – центрированные скользящие средние. Для этого в столбце «центрированная скользящая средняя» представлены средние значения для двух последовательных скользящих средних. С этой целью в ячейку D10 введена формула: =СРЗНАЧ(C9:C10), скопированная в диапазон D11: D21.

Рисунок 4.4 – Расчет аддитивной модели временного ряда

4 Находятся оценки сезонного компонента S как разность между фактическими уровнями ряда и центрированными скользящими средними. Для этого в ячейку Е10 введена формула =B10–D10, которая скопирована в диапазон Е11:Е21.

Эти оценки используются для расчета значений сезонного компонента S. Для этого находятся средние за каждый квартал (по всем годам) оценки сезонного компонента S.

Для определения средних значений оценок сезонного компонента по каждому кварталу в ячейку С35 вводится формула =СРЗНАЧ(C29:C32), которая копируется до столбца F.

В моделях с сезонным компонентом обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонного компонента по всем кварталам должна быть равна нулю.

Скорректированные значения сезонного компонента рассчитываются как разность между ее средней оценкой и корректирующим коэффициентом k. Для определения коэффициента k необходимо найти среднее значение суммы средних оценок сезонного компонента за 4 года. Для данной модели k = G33 = СРЗНАЧ(С34:F34).

В диапазоне С35:F35 рассчитаны скорректированные значения сезонного компонента как разности между соответствующими средними оценками и корректирующим коэффициентом. Для этого в ячейку С35 введена формула =C34–$G$34, которая скопирована в диапазон D35:F35.

Для проверки условия равенства нулю суммы значений сезонного компонента в ячейку G35 введена формула =СУММ(C35:F35). Скорректированные значения сезонной компоненты переносятся в столбец F.

5 Исключается влияние сезонного компонента путем вычи­тания его значения из каждого уровня исходного временного ряда. Для этого в ячейке G8 записана формула =B8–F8, которая скопирована вниз до строки 23 (рисунок 4.4). Получаются величины Т + Е = YS. Эти значения рассчитываются за каждый момент времени и содержат только трендовый и случайный компоненты.

6 Для определения компонента Т данной модели проводится аналитическое выравнивание ряда (Т + Е) с помощью линейного тренда. Определить коэффициенты а и b линейного тренда можно с помощью формул:

– коэффициент а: =ОТРЕЗОК(G8:G23;A8:A23);

– коэффициент b: =НАКЛОН(G8:G23;A8:A23).

Уравнение тренда будет иметь вид Т = 5,977+0,055 t.

Подставляя в это уравнение значения t = 1, 2, ..., 16, можно найти уровни Т для каждого момента времени (столбец H) .

7 Расчетные значения (Т + S) получены в столбце I.

8 Абсолютные ошибки определяются по формуле E = y – (T + S), записанной в столбце J.

Прогнозное значение в аддитивной модели есть сумма скорректированной сезонной и трендовой составляющих. Для кварталов под номерами 17 и 18 прогнозные значения составят 7,018 и 4,323 ед.