Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

В. Давнис Прогнозные модели экспертных предпочтений

.pdf
Скачиваний:
217
Добавлен:
14.08.2013
Размер:
3.39 Mб
Скачать

 

 

 

 

 

 

О к о н ч а н и е

т а б л .

3.15

№ п/п

У

х,

*?

*,

Х 4

№ п/п

У

*|

xi

х,

*4

7

0

2

2

3

50

18

1

2

3

1

25

8

1

1

2

3

15

19

0

2

2

1

60

9

0

3

3

1

50

20

2

3

2

2

20

10

1

2

2

1

30

21

2

1

1

3

10

11

1

2

1

2

10

 

 

 

 

 

 

Т а б л и ц а 3.16

Оценки коэффициентов модели и характеристики их надежности

Var 1 - Parameter estimates (Spreadshee 1)

Distribution: MULTINOMIAL

Link function: LOGIT

Level of

Level of

Column

Estimate

Standard

Wald Stat.

P

Effect Effect

Response

Error

Interc l

0

1

17,17 493

6,932 343

6,13804

0,013

230

"Var2"

0

2

-6,12 757

1,816 164

11,38 325

0,000 741

"Var3"

0

3

-1,70 320

0,751 912

5,13096

0,023503

"Var4"

0

4

-5,91 578

1,715851

11,88

680

0,000 565

'Var6"

0

5

0,38 431

0,074 424

26,66

555

0,000

000

Interc 2

 

6

20,82 143

6,824078

9,30 965

0,002 280

"Var2"

 

7

-4,72 550

1,778

669

7,05 840

0,007 889

"Var3"

 

8

-2,40 530

0,685082

12,32

685

0,000

446

"Var4"

 

9

-5,15872

1,689

180

9,32 680

0,002 258

'Var6"

 

10

0,22 872

0,070

576

10,50 218 0,001

192

Scale

 

 

1,00 000

0,000 000

 

 

 

 

Анализ табл. 3.16 позволяет:

1) сделать вывод о том, что полученные оценки коэффици­ ентов являются статистически значимыми (все стандартные ошибки меньше полученных оценок, значения статистики Вальда превосходят критический уровень и все вероятности ошибки меньше 0,05);

2) записать аналитическое выражение для построенной муль­ тиномиальной логит-модели:

 

 

е-

17,17-6,12х, -1,70ft -5,93 +0,38х4

Р(У=О)=

-—:—-—

^

' 1

17,17-6,12г1-1,70.г2-5,91хз+0,3&с4 , 2Q82-4,71X!-2,40A:2 -5,15^3+0,22X4 '

ПО

20,82-4,71х, -2,40х2 -5,13 +0,22х4

P(y=i)=

j + e17,17-6,12x,-l,7ac2-5,9h-3+0,38x4 + 20,82-4,71лг1-2,4аг2-5,15гз+0,22х4

Анализ табл. 3.17 позволяет сделать вывод, что построенная модель обеспечивает достаточно точное предсказание наиболее предпочтительных типов предприятий общественного питания, которые будут успешны в соответствующих условиях. Полужир­ ным шрифтом в этой таблице выделены те случаи, в которых предсказания были недостаточно точны.

Т а б л и ц а 3.17

Предсказанные значения вероятностей

У

Предсказанные вероятности

У

Предсказанные вероятности

п/п

Р О = 0)

Р(У=1)

Р(У = 2)

п/п

Р(у = 0)

Р ( у = 1 )

Р(У=2)

1

0

0,9929

0,0071

0,0000

12

0

0,7541

0,2459

0,0000

2

0

0,8699

0,1300

0,0000

13

0

0,4490

0,5504

0,0005

3

1

0,0601

0,9395

0,0003

14

1

0,0785

0,9207

0,0008

4

2

0,0000

0,0000

1,0000

15

2

0,0000

0,0013

0,9987

5

1

0,2395

0,6896

0,0709

16

0

0,7287

0,2709

0,0004

6

1

0,9413

0,0587

0,0000

17

2

0,0517

0,3703

0,5779

7

0

0,5951

0,3748

0,0302

18

1

0,2279

0,7653

0,0069

8

1

0,0088

0,3158

0,6754

19

0

0,9716

0,0284

0,0000

9

0

0,7813

0,2180

0,0007

20

2

0,0002

0,0197

0,9802

10

1

0,2431

0,7567

0,0002

21

2

0,0039

0,6204

0,3757

11

1

0,0024

0,7163

0,2813

 

 

 

 

 

Данные табл. 3.18 позволили оценить пригодность модели в целом с помощью индекса отношения правдоподобия Макфаддена:

LRI = l - ^

= l - - 9 2 ' 7 4 2 = 0 , 5 9

lnL(Z>0)

-226,167

Рассчитанное таким образом значение индекса свидетельству­ ет об адекватности построенной логит-модели, хотя может пока­ заться и не очень высоким. Однако нужно помнить, что нас интересует не точность аппроксимации распределения, а предска­ зание возможности появления самого события (возможность появ-

111

ления события считается предсказанной, если расчетная вероят­ ность данного события выше остальных).

 

 

 

Т а б л и ц а

3.18

 

Тест правдоподобия J-го типа

 

 

 

Varl - Likelihood Type

1 Test (Spreadsheet 1)

 

 

 

Distribution: MULTINOMIAL

 

 

 

 

Linkfunction: LOGIT

 

 

 

 

Effect

Degr. of Freedom Log-Likelihd

Chi-Square

P

 

Intercept

2

-226,167

 

 

 

"Var2"

2

-218,781

14,7729

0,000

620

"Var3"

2

-211,811

13,9401

0,000

940

"Var4"

2

-162,237

99,1481

0,000 000

"Var6"

2

-92,742

138,9898

0,000

000

Используя построенную модель, рассчитаем вероятности успеха в случае выбора инвестиционного проекта, связанного с рестора­ ном, кафе и бистро, при условии:

¥(у = 0) = 0,0002; Р(у =1) = 0,0056; P(j = 2) = 0,9942;

?{у = 0) = 0,9322; Р(у = 1) = 0,0678; ?{у = 2) = 0,0000.

В первом случае наиболее вероятен успех при выборе проек­ та, связанного с бистро, а во втором — ресторана.

Предельный эффект имеет смысл рассчитывать только для фактора х4:

1) для первого случая:

bl4 = 0,0002 • 0,3843 + 0,0056 • 0,2287 = 0,0014; 510 = 0,0002 • (0,3843 - 0,0014) = 0,0001; <5И =0,0056- (0,2287 -0,0014)=0,0013;

Sn = 0,9942 • (0 - 0,0014)= -0,0014; 2) для второго случая:

Ь24 = 0,9322 • 0,3843 + 0,0678 • 0,2287 = 0,3738; 520 = 0,9322 • (0,3843 - 0,3738)=0,0098; <521 = 0,0678 • (0,2287 - 0,3738)= -0,0098;

522 =0,0000 (0 -0,3738)= 0,0000.

112

Анализ предельных эффектов показывает, что в первом случае рост числа обслуживаемых одновременно клиентов увеличивает вероятность выбора среди рассматриваемых вариантов в первую очередь кафе, а затем — ресторана. Во втором случае увеличива­ ется вероятность выбора только ресторана. Причем увеличение вероятностей выбора одних вариантов происходит за счет умень­ шения вероятности выбора других.

Для остальных факторов в силу их дискретного характера сле­ дует рассчитывать непосредственно вероятности. Например,

для х, = 2 при х2 = 3; х3 = 2; х4 = 25; Р(у = 0) = 0,0517; Р(у =1) = 0,3703; Р(у = 2) = 0,5780;

для JC, = 1 при х2 = 3; х3 = 2; х4 = 25;

Р(у = 0) = 0,3589; ?(у =1) = 0,6323; ?{у = 2) = 0,0088; Получаемые распределения сравниваются с исходным и дела­

ются соответствующие выводы. В случае х, = 2 предпочтитель­ ность выбора не изменилась, а в случае х, = 1 предпочтительнее выбрать кафе.

3.5.3- Пробит- и логитмодели множественного выбора в ранговых шкалах

Среди задач, решаемых экспертами, наиболее попу­ лярна задача ранжирования. Прямые методы решения этой задачи детально были рассмотрены во второй главе. Здесь, продолжая развивать идею построения моделей по данным, представляющим результаты экспертного опроса, рассмотрим схему построения пробит- и логит-моделей множественного выбора для случая, когда моделируемая переменная измеряется в ранговой шкале.

Опишем несколько ситуаций, формализация которых приводит

кзадачам подобного рода:

1.Расчет рейтинговых оценок облигаций по независимому оп­ росу экспертов.

2.Определение рейтинга банков по их надежности.

3.Моделирование результатов дегустационных тестов.

4.Установление приоритетов по результатам обследования об­ щественного мнения.

5.Выяснение приоритетности социальных программ по резуль­ татам голосования.

Для моделирования подобных ситуаций будем считать, что есть переменная у", значения которой определяются некоторым набором объясняющих переменных в соответствии с зависимостью

113

/ = x b + e.

(3.111)

Переменная у* — ненаблюдаемая величина, но известны зна­ чения дискретной переменной, которые в нашем представлении связаны с ненаблюдаемой следующими соотношениями:

у - О, если у' < 0; у = 1, если 0 < у' < /I,;

у = 2, если Hi<y* ^ Ц2;

(3.112)

у = J, если \ij_i < у" .

Неравенства реализуют некую форму цензурирования. Причем уровни цензурирования ц. неизвестны и представляют собой пара­ метры, оцениваемые вместе с коэффициентами Ь.

Заменим в неравенствах ненаблюдаемую переменную ее модель­ ным представлением и вычтем xb из каждой части:

у = 0, если е < -xb;

у = 1, если -xb < £ < /Xj — xb;

у = 2, если fit - xb, < e < ]Х2 - xb;

(3.113)

y = J, если /*,_,—xb<£ .

Будем считать, что случайная величина е нормально распреде­ лена по наблюдениям и, кроме того, нормирована таким обра­ зом, что имеет нулевое математическое ожидание и единичную дисперсию. В случае построения логит-модели предполагается, что случайная величина е имеет логистическое распределение.

Для пробит-модели выписанные неравенства позволяют запи­ сать следующие вероятности:

Р(у = 0) = Ф(-хЬ); Р(у = 1) = ф( ^ - хЬ)-Ф(-хЬ);

Р(у = 2) = Ф(А12-А)-Ф(/х1-хЬ);

(3.114)

Р(у = У) = 1-Ф(/*,_,-*).

Чтобы все вероятности были положительными, оцениваемые параметры положения должны удовлетворять неравенствам

0 < ^ ! < ^ 2 < ••• <Д,Ч -

(3.115)

114

Смысл параметров положения хорошо иллюстрирует рис. 3.4.

xb ji3 - x b

Рис. 3.4. Вероятности в упорядоченной пробит-модели Если учесть, что

Ф ( ^ - х Ь ) - Ф ( / ^ _ , - х Ь ) =

1

dt

(3.116)

2п zи

 

 

 

где г, =/*£„[ ~~ xb, z2 = Hk ~~ xb, то становится понятным, как построить логарифмическую функцию правдоподобия. Любой из ранее рассмотренных методов позволяет оптимизировать функцию правдоподобия и получить искомые параметры положения и ко­ эффициенты модели. Поэтому не будем рассматривать детали этого процесса, а более подробно остановимся на анализе и ин­ терпретации результатов моделирования.

Для пояснений рассмотрим упрощенный пример, в котором с помощью нормального распределения моделируется ситуация из трех категорий с одним неизвестным параметром положения ц:

Р(у = 0) = 1-Ф(хЬ);

Р(у = 1) = ф( ju - хЬ) - Ф(-хЬ);

Р(у = 2) = 1-Ф(^-хЬ).

Модель нелинейная, и поэтому предельные эффекты факторов не равны коэффициентам. Дифференцирование уравнений по любому из факторов приводит к соотношениям

дР(у = 0)

Эх, = -ф(хЬ)Ьк;

115

^ '- = [ф(-хЪ)-ф(1и-хЪ)]Ьк; dxt

дхк

Таким образом, предельный эффект — это величина, перерас­ пределяемая между вероятностями полученного распределения. При­ чем сумма всех изменений рана нулю. Действительно, в рассматри­ ваемом примере при Ьк > О вероятность события у = О уменьшает­ ся на ф(хЬ)Ьк. Одновременно с этим вероятность Р(у = 1) увеличи­ вается на эту же величину и уменьшается на ф (/и — xb)bk, а веро­ ятность Р(у = 2) — увеличивается на ф (/и — xb)bk. Нетрудно заме­ тить, что при положительном Ьк смещение вероятности происходит вправо, а при отрицательном Ьк — влево. Из этого следует, что увеличение факторной переменной, когда коэффициент при ней положителен, приводит к увеличению вероятностей тех событий, которые получили более низкие ранги. Происходит как бы дефор­ мирование кривой плотности вероятностей с перемещением неко­ торой вероятностной массы (площади под кривой) слева направо. В случае отрицательного коэффициента все происходит наоборот. Весь этот механизм хорошо показан на рис. 3.5.

Рис. 3.5. Изменения распределения вероятностей под воздействием предельных эффектов

Для каждой /-й ситуации можно вычислить энтропию точно так же, как это делалось в модели множественного выбора. Энтропию удобно использовать для оценки информационного эффекта, яв­ ляющегося следствием предельного эффекта.

116

3.5.4. Преференция

условий ведения

бизнеса

на основе прогнозных

рейтинговых

решений

Рассмотренные выше основные аспекты построения моделей множественного выбора в ранговых шкалах свидетельству­ ют о возможности использования этих моделей для решения раз­ личных экономических задач, в том числе, задач практического маркетинга. Как известно, одной из ключевых проблем, перио­ дически возникающих перед любой компанией, является префе­ ренция условий ведения бизнеса, т.е. выбор наиболее предпоч­ тительных альтернатив реализации продукции, рыночных ниш, партнеров по бизнесу, экономических зон хозяйствования и т.д.

Изложим результаты исследования, проведенного с целью выбора наиболее благоприятных районов Воронежской области для реализации коммерческой деятельности ОАО "Спектр". Заметим, что эта компания имеет организационную структуру и целевые задачи такие же, как ОАО "Радуга", о котором уже шла речь в этой главе (см. 3.4).

Исходя из критерия "минимум затрат на проведение маркетин­ говых исследований", для реализации поставленной цели исполь­ зовалась информация, предоставленная Главным управлением экономического развития администрации Воронежской области.

Экспертным путем были отобраны семь показателей, играющих в совокупности ключевую роль в задачах обоснования решений, связанных с выбором наиболее привлекательных районов для ве­ дения торговой деятельности. Однако статистически значимыми показателями оказались только четыре: I) объем промышленной продукции (работ, услуг) в действующих ценах, млн р.; 2) сто­ имость валовой продукции агропромышленного комплекса в дей­ ствующих ценах, млн р.; 3) оборот розничной торговли (по всем каналам реализации) в действующих ценах, млн р.; 4) средняя заработная плата, р.

Кроме того, с помощью процедуры экспертного опроса были получены обобщенные оценки степени инвестиционной привлека­ тельности (для ведения торговли) каждого из районов, в котором ОАО "Спектр" осуществляло свою деятельность. Рейтинговое оценивание проводилось в соответствии со следующей шкалой:

0 — самая высокая степень привлекательности;

1 — высокая степень привлекательности;

2 — средняя степень привлекательности;

3 — низкая степень привлекательности;

4 — крайне низкая степень привлекательности.

117

Врезультате была сформирована табл. 3.19, данные которой

ибыли использованы для построения логит-модели множествен­ ного упорядоченного выбора.

Встратегические планы ОАО "Спектр" на 2005 г. входило расширение сети супермаркетов за счет освоения новых рынков сбыта в других районах Воронежской области. Показатели, харак­ теризующие уровень социально-экономического развития планиру­ емых для освоения районов, представлены в табл. 3.20.

По итогам выполнения необходимых действий в пакете STATISTICA 6.0 были получены расчетные характеристики модели, которые от­ ражены в табл. 3.21— 3.23.

Т а б л и ц а 3.19

Рейтинговые оценки районов Воронежской области в зависимости от уровня их социально-экономического развития

 

 

 

 

Факторы

 

 

 

Рейтин­

Объем про­

Стоимость

Оборот

 

Район

 

мышленной

валовой

розничной

Средняя

Год

говая

продукции

продукции

торговли (по

Воронеж­

оценка

(работ, услуг)

АПК в

всем каналам

заработ­

ской

 

района

в действую­

действую­

реализации) в

ная

области

 

 

плата, р.

 

 

 

щих ценах,

щих ценах,

действующих

 

 

 

 

млн р.

млн р.

ценах, млн р.

 

 

 

R

*,

X,

*4

1

2

3

4

5

6

7

 

2002

1

1688,4

157,3

1538,2

2318,3

Борисо­

2003

0

1955,2

166,0

1979,6

2877,0

глебский

2004

0

2314,8

161,3

2587,6

3100,0

 

2005*

0

2913,5

177,9

3197,4

3785,7

 

2002

3

278,7

455,4

279,9

1975,9

Бобровский

2003

3

344,5

595,7

323,9

2406,6

 

2004

1

442,5

655,3

356,4

2793,0

 

2005*

1

556,9

722,9

440,4

3410,8

 

2002

3

781,4

420,4

440,0

1715,7

Бутурли-

2003

3

1086,2

470,9

558,8

1973,0

новский

2004

2

1178,2

519,9

661,5

2421,0

 

2005*

2

1482,9

573,5

817,4

2956,5

 

2002

4

75,3

212,8

163,5

1678,2

Верхнема-

2003

3

120,4

247,3

218,7

2044,0

монский

2004

3

133,8

341,4

246,0

2610,0

 

2005*

3

168,4

376,6

303,9

3187,3

118

 

 

 

П р о д о л ж е н и е

т а б л . 3.19

1

2

3

4

5

 

6

7

 

2002

4

133,3

169,5

 

155,3

1760,5

Верхне-

2003

3

279,9

322,0

 

173,0

2220,0

хавский

2004

3

544,8

360,1

 

205,5

2580,0

 

2005*

3

685,7

397,2

 

253,9

3150,7

 

2002

4

32,9

231,3

 

230,8

1512,5

Гриба-

2003

3

66,3

398,8

 

373,4

1998,0

новский

2004

3

85,6

429,7

 

446,3

2414,0

 

2005*

3

107,7

474,0

 

551,5

2947,9

 

2002

3

1389,4

749,1

 

528,1

2041,7

Калаче-

2003

0

1461,7

824,0

 

686,5

2409,2

евский

2004

0

1853,1

898,0

 

858,0

2826,0

 

2005*

0

2332,4

990,6

 

1060,2

3451,1

 

2002

4

731,6

220,3

 

174,8

1921,2

Каменский

2003

3

765,3

282,9

 

143,2

2000,0

2004

3

1052,2

259,8

 

161,2

2469,4

 

2005*

3

1324,3

286,6

 

199,2

3015,6

 

2002

4

0,2

239,3

 

109,6

1612,8

Каширский

2003

3

21,8

359,0

 

140,3

2016,0

2004

3

15,3

346,0

 

168,9

2575,0

 

2005*

3

19,3

381,7

 

208,7

3144,6

 

2002

4

56,6

306,9

 

161,0

1752,1

Нижнеде-

2003

4

86,3

368,3

 

193,8

1668,0

вицкий

2004

3

95,6

310,2

 

270,9

2283,0

 

2005*

3

120,3

342,2

 

334,7

2787,9

 

2002

3

120,7

359,1

 

271,7

2499,2

Новоус-

2003

3

265,5

382,8

 

322,2

2979,0

манский

2004

0

326,2

465,5

 

415,3

3708,0

 

2005*

0

410,6

513,5

 

513,2

4528,2

 

2002

4

255,0

222,6

 

169,4

1726,3

Ольхо-

2003

3

482,0

236,0

 

208,0

2220,0

ватский

2004

2

567,8

277,0

 

247,0

2770,0

 

2005*

2

714,6

305,6

 

305,2

3382,7

 

2002

I

455,0

350,2

1078,7

2428,1

Остро­

2003

0

562,8

369,5

1340,8

3278,0

гожский

2004

0

586,2

315,7

1644,4

4065,0

 

2005*

0

737,8

348,2

2031,9

4964,1

119

Соседние файлы в предмете Анализ данных