Скачиваний:
114
Добавлен:
08.04.2015
Размер:
3.32 Mб
Скачать

Рис. 5.7.

Рис. 5.8.

111

В Excel-2007 для построения точечных диаграмм необходимо также зайти в пункт меню «Вставка» и выбрать тип диаграммы «Точечная» – рис. 5.9. Выбор типа тренда и его параметров проводится в одном окне «Формат линии тренда» – рис. 5.10.

Рис. 5.9.

Рис. 5.10.

112

Пример 5.1.

 

 

Установлено, что наибольшее влия-

 

 

Y

X

ние на величину стоимости рекламных

 

 

Стоимость

Удаленность

щитов оказывает его местоположение, а

рекламного

от центра

именно – удаленность от центра города.

щита (тыс. $)

(км)

Соответствующая статистика по анало-

10

1,3

гам приведена в таблице.

6

2

 

 

5

1,7

Требуется

12

1,5

10

1,6

Построить и выбрать наилуч-

15

1,2

шую модель, отражающую зависимость

5

1,6

стоимости рекламного щита от удален-

12

1,4

ности.

 

17

1

Оценить качество построенной

20

1,1

 

 

 

 

модели.

Найти стоимость рекламного щита, расположенного на

расстоянии 2,2 км от центра города.

Решение

Используя статистические данные из таблицы, строим то-

чечную диаграмму в Excel: Вставка ¾ Диаграмма ¾ Точечная

рис. 5.6. После пошагового ввода статистических данных y и x с

помощью «Мастера диаграмм», на рабочий лист будет выведена точечная диаграмма – рис. 5.11.

Стоимость

Зависимость стоимости рекламных щитов в

зависимости от удаленности

25

20

15

10

5

0

0,8

1,3

1,8

2,3

Удаленность от центра (км)

Рис. 5.11.

113

Для подбора аппроксимирующей кривой необходимо выделить точки диаграммы левой кнопкой мыши, затем вызвать контекстное меню правой кнопкой мыши и выбрать в контекстном меню пункт «Добавить линию тренда». В появившемся диалоговом окне «Линия тренда» – рис. 5.12 на вкладке «Тип» выбираем два типа трендов – линейный и полиномиальный (второго порядка), как наиболее соответствующие характеру изменения y в зависи-

мости от изменения x .

Рис. 5.12.

На вкладке «Параметры» диалогового окна «Линия тренда» – рис. 5.13 необходимо поставить галочки у пунктов «показывать уравнение на диаграмме» и «поместить на диаграмму величину достоверности аппроксимации R^2».

После нажатия клавиши «ОК» на диаграмме появится подобранная аппроксимирующая линия (по терминологии, используемой

в Excel – тренд), ее уравнение и значение критерия R 2 .

114

Рис. 5.13.

На рисунках 5.14, 5.15 показаны два типа трендов – линейный и полиномиальный, аппроксимирующие набор статистических данных задачи. По критерию R2 несколько лучше аппроксимирует данные полиномиальный тренд, так как для полиномиальной модели

y =11,333x2 48,009x +55,899

величина R2 = 0,7931 – рис. 5.15. Для линейной модели

y = −14,539x +32,136

коэффициент достоверности аппроксимации R2 = 0,7456 – рис. 5.14. Для оценки стоимости щита, удаленного от центра на 2,2 км

воспользуемся полиномиальной моделью, тогда

yрасч. =11,333 2,22 48,009 2,2 +55,899 = 5,131 тысяч долларов.

115

 

 

Линейная модель (линейный тренд)

 

 

25

 

 

 

 

 

 

y = -14,539x + 32,136

 

 

20

 

R2 = 0,7456

 

Стоимость

15

 

 

 

10

 

 

 

 

 

 

 

 

5

 

 

 

 

0

 

 

 

 

0,8

1,3

1,8

2,3

 

 

Удаленность от центра (км)

 

 

 

Рис. 5.14.

 

 

 

Полиномиальная модель

 

 

25

y = 11,333x2 - 48,009x + 55,899

 

 

 

20

 

R2 = 0,7931

 

Стоимость

15

 

 

 

10

 

 

 

 

 

 

 

 

5

 

 

 

 

0

 

 

 

 

0,8

1,3

1,8

2,3

 

 

Удаленность от центра (км)

 

Рис. 5.15.

Замечания

При выборе типа модели (типа линии тренда) следует иметь в виду следующее.

Даже если на интервале изменения статистических наблюдений удается подобрать модель с высоким значением коэффициента

множественной детерминации R 2 и хорошим качеством аппроксимации, то это не гарантирует от ошибок при использовании модели для прогнозирования. Особенно это «опасно» для значений факторов, существенно выходящих за область статистических наблюдений, т.е. тех наблюдений, которые послужили основой для построения модели. Объясняется это тем, что набор функций, которые можно использовать в качестве аналитических моделей, ограничен –

116

это линейная, квадратичная, полиномиальная, логарифмическая, степенная функции и некоторые другие. С точки зрения их графического представления (тренда) это либо прямая, либо парабола, либо линии, соответствующие полиномам более высоких степеней, а также линии, задаваемые степенной и логарифмической функциями. Каждая из них обладает вполне определенными свойствами.

Пусть, например, наилучшей моделью по критерию R 2 оказалась квадратичная функция

y = ax2 +bx +c ,

где a,b,c – числовые коэффициенты, вычисляемые на основе статистических данных по методу наименьших квадратов. В силу свойств квадратичной функции, ее график это парабола – линия с одной вершиной и двумя ветвями, направленными в зависимости от числовых значений коэффициентов a,b,c либо вверх, либо вниз, с различной крутизной. Подобные модели позволяют довольно успешно отражать нелинейный характер зависимости y от x. Однако, при их применении для прогнозирования значений y для x, выходящих за об-

ласть исходной статистки (экстраполяции), модель сохранит свой «параболический характер» и может привести к неверным выводам.

Пример 5.2.

Изменение объемов продаж некоторого товара в зависимости от его цены (в условных единицах), зафиксировано и приведено в таблице. Графическое представление данных таблицы – точечная диаграмма показана на рис. 5.16.

Требуется получить математическую модель, позволяющую прогнозировать объемы продаж в зависимости от цены, назначаемой на товар.

Решение

В качестве математических моделей, позволяющих описать закономерность изменения объемов продаж (y) в зависимости от цены товара (x) рассмотрим следующие четыре типа:

yлинейную – y = ax +b ,

yстепенную – y = axb ,

yэкспоненциальную – y = aebx .

yполиномиальную (полином второго порядка) – y = ax2 +bx +c .

117

Y

X

 

100

 

 

 

 

 

 

85

0,2

 

 

 

 

 

 

 

 

80

 

 

 

 

 

 

64

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

40

2

 

60

 

 

 

 

 

 

34

3

 

40

 

 

 

 

 

 

25

4

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

18

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14

6

 

0

 

 

 

 

 

 

13

7

 

0

 

2

4

6

8

 

 

 

 

 

 

Рис. 5.16.

 

 

 

100

 

 

y = -9,9625x + 71,743

100

 

 

y = 47,548x-0,5443

 

80

 

 

R2 = 0,8655

 

80

 

 

R2 = 0,8723

 

 

 

 

 

 

 

 

 

60

 

 

 

 

60

 

 

 

 

40

 

 

 

 

40

 

 

 

 

20

 

 

 

 

20

 

 

 

 

0

 

 

 

 

0

 

 

 

 

0

2

4

6

8

0

2

4

6

8

 

а) Линейный тренд

 

 

б) Степенной тренд

 

100

 

 

y = 80,637e-0,283x

100

 

y = 1,925x2 - 23,718x + 86,534

80

 

 

R2 = 0,979

 

80

 

R2 = 0,9845

 

 

 

 

 

 

 

 

 

60

 

 

 

 

60

 

 

 

 

40

 

 

 

 

40

 

 

 

 

20

 

 

 

 

20

 

 

 

 

0

 

 

 

 

0

 

 

 

 

0

2

4

6

8

0

2

4

6

8

в) Экспоненциальный тренд

г) Полиномиальный тренд

 

Рис. 5.17.

118

 

Задача состоит в оценке по методу наименьших квадратов ко-

эффициентов этих моделей – a, b, c, так, чтобы наиболее адекватно

и с наилучшей точностью описать закономерности, отраженные в

реальной статистике.

 

 

 

 

 

 

 

 

 

Полученные результаты – рис. 5.17, показывают, что по кри-

терию R 2

наиболее «качественной» для получения оценок внутри

диапазона изменения реальной статистики является полиномиаль-

ная модель ( R 2 = 0,985).

 

 

 

 

 

 

 

 

 

При использовании полученных моделей для прогнозирова-

ния – получения оценок за пределами диапазона использовавшихся

статистических данных, (для этого на вкладке «Параметры» в раз-

деле «Прогноз» необходимо указать на какое количество «единиц»

«вперед» производится прогнозирование – рис. 5.13), получаем

следующее – рис. 5.18.

 

 

 

 

 

 

 

 

100

 

 

y = -9,962x + 71,743

100

 

 

y = 47,548x-0,5443

80

 

 

R2 = 0,865

 

80

 

 

 

R2 = 0,8723

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

60

 

 

 

 

 

60

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

20

 

 

 

 

 

-20 0

2

4

6

8

10

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-40

 

 

 

 

 

0

2

4

6

8

10

 

а) Линейный тренд

 

 

б) Степенной тренд

 

100

 

 

y = 80,64e-0,283x

 

100

 

 

y = 1,93x2 - 23,72x + 86,53

 

 

 

 

 

 

 

R2 = 0,985

 

80

 

 

R2 = 0,979

 

80

 

 

 

 

 

 

 

 

 

 

 

60

 

 

 

 

 

60

 

 

 

 

 

40

 

 

 

 

 

40

 

 

 

 

 

20

 

 

 

 

 

20

 

 

 

 

 

0

 

 

 

 

 

0

 

 

 

 

 

0

2

4

6

8

10

0

2

4

6

8

10

в) Экспоненциальный тренд

г) Полиномиальный тренд

 

 

 

 

 

 

Рис. 5.18.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

119

Как видно – рис. 5.18 наилучшими, с точки зрения «адекватного» прогнозирования – получения достоверных оценок за пределами диапазона исходных наблюдений, оказались степенная

( R2 =0,872) и экспоненциальная ( R2 =0,979) модели – рис. 5.18 б), в). Во-первых, они не искажают очевидные закономерности экономического процесса – падения объема продаж с ростом стоимости товара, а во-вторых, обладают приемлемой точностью.

В то же время, если для целей прогнозирования применять линейную – рис. 5.18 а) или полиномиальную модель – рис. 5.18 г) – наилучшую из всех по критерию R 2 , то это приведет к принципиально неверным выводам и расчетным ошибкам.

Поэтому, выбор наилучшей модели для прогнозирования (получения оценок вне диапазона имевшихся наблюдений) на основе

только формальных критериев, например на основе R2 , может приводить к принципиальным ошибкам и недостоверным выводам. При этом может оказаться, как это показано в примере 5.2, что при выходе за границы наблюдений, наилучшая по критерию R 2 модель, может искажать и неадекватно отражать тенденции и особенности конкретного бизнес процесса. Поэтому при выборе наилучшей модели, полностью доверять формальным математическим критериям нельзя. Наряду с ними всегда целесообразно использовать экспертные оценки, знания и опыт аналитика, а также учитывать конкретные особенности анализируемого процесса.

5.3. Анализ взаимосвязей между зависимой переменной и влияющими на нее факторами на основе коэффициентов парной корреляции

Основной числовой характеристикой, применяемой в статистике для оценки наличия или отсутствия связи между двумя переменными y и x (Приложение 4) является коэффициент парной

корреляции, который характеризует тесноту линейной связи между y и x .

120