
В. Давнис Прогнозные модели экспертных предпочтений
.pdf
|
|
|
|
|
|
О к о н ч а н и е |
т а б л . |
3.15 |
|||
№ п/п |
У |
х, |
*? |
*, |
Х 4 |
№ п/п |
У |
*| |
xi |
х, |
*4 |
7 |
0 |
2 |
2 |
3 |
50 |
18 |
1 |
2 |
3 |
1 |
25 |
8 |
1 |
1 |
2 |
3 |
15 |
19 |
0 |
2 |
2 |
1 |
60 |
9 |
0 |
3 |
3 |
1 |
50 |
20 |
2 |
3 |
2 |
2 |
20 |
10 |
1 |
2 |
2 |
1 |
30 |
21 |
2 |
1 |
1 |
3 |
10 |
11 |
1 |
2 |
1 |
2 |
10 |
|
|
|
|
|
|
Т а б л и ц а 3.16
Оценки коэффициентов модели и характеристики их надежности
Var 1 - Parameter estimates (Spreadshee 1)
Distribution: MULTINOMIAL
Link function: LOGIT
Level of |
Level of |
Column |
Estimate |
Standard |
Wald Stat. |
P |
|||
Effect Effect |
Response |
Error |
|||||||
Interc l |
0 |
1 |
17,17 493 |
6,932 343 |
6,13804 |
0,013 |
230 |
||
"Var2" |
0 |
2 |
-6,12 757 |
1,816 164 |
11,38 325 |
0,000 741 |
|||
"Var3" |
0 |
3 |
-1,70 320 |
0,751 912 |
5,13096 |
0,023503 |
|||
"Var4" |
0 |
4 |
-5,91 578 |
1,715851 |
11,88 |
680 |
0,000 565 |
||
'Var6" |
0 |
5 |
0,38 431 |
0,074 424 |
26,66 |
555 |
0,000 |
000 |
|
Interc 2 |
|
6 |
20,82 143 |
6,824078 |
9,30 965 |
0,002 280 |
|||
"Var2" |
|
7 |
-4,72 550 |
1,778 |
669 |
7,05 840 |
0,007 889 |
||
"Var3" |
|
8 |
-2,40 530 |
0,685082 |
12,32 |
685 |
0,000 |
446 |
|
"Var4" |
|
9 |
-5,15872 |
1,689 |
180 |
9,32 680 |
0,002 258 |
||
'Var6" |
|
10 |
0,22 872 |
0,070 |
576 |
10,50 218 0,001 |
192 |
||
Scale |
|
|
1,00 000 |
0,000 000 |
|
|
|
|
Анализ табл. 3.16 позволяет:
1) сделать вывод о том, что полученные оценки коэффици ентов являются статистически значимыми (все стандартные ошибки меньше полученных оценок, значения статистики Вальда превосходят критический уровень и все вероятности ошибки меньше 0,05);
2) записать аналитическое выражение для построенной муль тиномиальной логит-модели:
|
|
е- |
17,17-6,12х, -1,70ft -5,91х3 +0,38х4 |
Р(У=О)= |
-—:—-— |
||
^ |
' 1 |
17,17-6,12г1-1,70.г2-5,91хз+0,3&с4 , 2Q82-4,71X!-2,40A:2 -5,15^3+0,22X4 ' |
ПО
20,82-4,71х, -2,40х2 -5,15х3 +0,22х4
P(y=i)=
j + e17,17-6,12x,-l,7ac2-5,9h-3+0,38x4 + 20,82-4,71лг1-2,4аг2-5,15гз+0,22х4
Анализ табл. 3.17 позволяет сделать вывод, что построенная модель обеспечивает достаточно точное предсказание наиболее предпочтительных типов предприятий общественного питания, которые будут успешны в соответствующих условиях. Полужир ным шрифтом в этой таблице выделены те случаи, в которых предсказания были недостаточно точны.
Т а б л и ц а 3.17
Предсказанные значения вероятностей
№ |
У |
Предсказанные вероятности |
№ |
У |
Предсказанные вероятности |
||||
п/п |
Р О = 0) |
Р(У=1) |
Р(У = 2) |
п/п |
Р(у = 0) |
Р ( у = 1 ) |
Р(У=2) |
||
1 |
0 |
0,9929 |
0,0071 |
0,0000 |
12 |
0 |
0,7541 |
0,2459 |
0,0000 |
2 |
0 |
0,8699 |
0,1300 |
0,0000 |
13 |
0 |
0,4490 |
0,5504 |
0,0005 |
3 |
1 |
0,0601 |
0,9395 |
0,0003 |
14 |
1 |
0,0785 |
0,9207 |
0,0008 |
4 |
2 |
0,0000 |
0,0000 |
1,0000 |
15 |
2 |
0,0000 |
0,0013 |
0,9987 |
5 |
1 |
0,2395 |
0,6896 |
0,0709 |
16 |
0 |
0,7287 |
0,2709 |
0,0004 |
6 |
1 |
0,9413 |
0,0587 |
0,0000 |
17 |
2 |
0,0517 |
0,3703 |
0,5779 |
7 |
0 |
0,5951 |
0,3748 |
0,0302 |
18 |
1 |
0,2279 |
0,7653 |
0,0069 |
8 |
1 |
0,0088 |
0,3158 |
0,6754 |
19 |
0 |
0,9716 |
0,0284 |
0,0000 |
9 |
0 |
0,7813 |
0,2180 |
0,0007 |
20 |
2 |
0,0002 |
0,0197 |
0,9802 |
10 |
1 |
0,2431 |
0,7567 |
0,0002 |
21 |
2 |
0,0039 |
0,6204 |
0,3757 |
11 |
1 |
0,0024 |
0,7163 |
0,2813 |
|
|
|
|
|
Данные табл. 3.18 позволили оценить пригодность модели в целом с помощью индекса отношения правдоподобия Макфаддена:
LRI = l - ^ |
= l - - 9 2 ' 7 4 2 = 0 , 5 9 |
lnL(Z>0) |
-226,167 |
Рассчитанное таким образом значение индекса свидетельству ет об адекватности построенной логит-модели, хотя может пока заться и не очень высоким. Однако нужно помнить, что нас интересует не точность аппроксимации распределения, а предска зание возможности появления самого события (возможность появ-
111
ления события считается предсказанной, если расчетная вероят ность данного события выше остальных).
|
|
|
Т а б л и ц а |
3.18 |
|
|
Тест правдоподобия J-го типа |
|
|
||
|
Varl - Likelihood Type |
1 Test (Spreadsheet 1) |
|
|
|
|
Distribution: MULTINOMIAL |
|
|
|
|
|
Linkfunction: LOGIT |
|
|
|
|
Effect |
Degr. of Freedom Log-Likelihd |
Chi-Square |
P |
|
|
Intercept |
2 |
-226,167 |
|
|
|
"Var2" |
2 |
-218,781 |
14,7729 |
0,000 |
620 |
"Var3" |
2 |
-211,811 |
13,9401 |
0,000 |
940 |
"Var4" |
2 |
-162,237 |
99,1481 |
0,000 000 |
|
"Var6" |
2 |
-92,742 |
138,9898 |
0,000 |
000 |
Используя построенную модель, рассчитаем вероятности успеха в случае выбора инвестиционного проекта, связанного с рестора ном, кафе и бистро, при условии:
¥(у = 0) = 0,0002; Р(у =1) = 0,0056; P(j = 2) = 0,9942;
?{у = 0) = 0,9322; Р(у = 1) = 0,0678; ?{у = 2) = 0,0000.
В первом случае наиболее вероятен успех при выборе проек та, связанного с бистро, а во втором — ресторана.
Предельный эффект имеет смысл рассчитывать только для фактора х4:
1) для первого случая:
bl4 = 0,0002 • 0,3843 + 0,0056 • 0,2287 = 0,0014; 510 = 0,0002 • (0,3843 - 0,0014) = 0,0001; <5И =0,0056- (0,2287 -0,0014)=0,0013;
Sn = 0,9942 • (0 - 0,0014)= -0,0014; 2) для второго случая:
Ь24 = 0,9322 • 0,3843 + 0,0678 • 0,2287 = 0,3738; 520 = 0,9322 • (0,3843 - 0,3738)=0,0098; <521 = 0,0678 • (0,2287 - 0,3738)= -0,0098;
522 =0,0000 (0 -0,3738)= 0,0000.
112
Анализ предельных эффектов показывает, что в первом случае рост числа обслуживаемых одновременно клиентов увеличивает вероятность выбора среди рассматриваемых вариантов в первую очередь кафе, а затем — ресторана. Во втором случае увеличива ется вероятность выбора только ресторана. Причем увеличение вероятностей выбора одних вариантов происходит за счет умень шения вероятности выбора других.
Для остальных факторов в силу их дискретного характера сле дует рассчитывать непосредственно вероятности. Например,
для х, = 2 при х2 = 3; х3 = 2; х4 = 25; Р(у = 0) = 0,0517; Р(у =1) = 0,3703; Р(у = 2) = 0,5780;
для JC, = 1 при х2 = 3; х3 = 2; х4 = 25;
Р(у = 0) = 0,3589; ?(у =1) = 0,6323; ?{у = 2) = 0,0088; Получаемые распределения сравниваются с исходным и дела
ются соответствующие выводы. В случае х, = 2 предпочтитель ность выбора не изменилась, а в случае х, = 1 предпочтительнее выбрать кафе.
3.5.3- Пробит- и логитмодели множественного выбора в ранговых шкалах
Среди задач, решаемых экспертами, наиболее попу лярна задача ранжирования. Прямые методы решения этой задачи детально были рассмотрены во второй главе. Здесь, продолжая развивать идею построения моделей по данным, представляющим результаты экспертного опроса, рассмотрим схему построения пробит- и логит-моделей множественного выбора для случая, когда моделируемая переменная измеряется в ранговой шкале.
Опишем несколько ситуаций, формализация которых приводит
кзадачам подобного рода:
1.Расчет рейтинговых оценок облигаций по независимому оп росу экспертов.
2.Определение рейтинга банков по их надежности.
3.Моделирование результатов дегустационных тестов.
4.Установление приоритетов по результатам обследования об щественного мнения.
5.Выяснение приоритетности социальных программ по резуль татам голосования.
Для моделирования подобных ситуаций будем считать, что есть переменная у", значения которой определяются некоторым набором объясняющих переменных в соответствии с зависимостью
113
/ = x b + e. |
(3.111) |
Переменная у* — ненаблюдаемая величина, но известны зна чения дискретной переменной, которые в нашем представлении связаны с ненаблюдаемой следующими соотношениями:
у - О, если у' < 0; у = 1, если 0 < у' < /I,;
у = 2, если Hi<y* ^ Ц2;
(3.112)
у = J, если \ij_i < у" .
Неравенства реализуют некую форму цензурирования. Причем уровни цензурирования ц. неизвестны и представляют собой пара метры, оцениваемые вместе с коэффициентами Ь.
Заменим в неравенствах ненаблюдаемую переменную ее модель ным представлением и вычтем xb из каждой части:
у = 0, если е < -xb;
у = 1, если -xb < £ < /Xj — xb;
у = 2, если fit - xb, < e < ]Х2 - xb;
(3.113)
y = J, если /*,_,—xb<£ .
Будем считать, что случайная величина е нормально распреде лена по наблюдениям и, кроме того, нормирована таким обра зом, что имеет нулевое математическое ожидание и единичную дисперсию. В случае построения логит-модели предполагается, что случайная величина е имеет логистическое распределение.
Для пробит-модели выписанные неравенства позволяют запи сать следующие вероятности:
Р(у = 0) = Ф(-хЬ); Р(у = 1) = ф( ^ - хЬ)-Ф(-хЬ);
Р(у = 2) = Ф(А12-А)-Ф(/х1-хЬ);
(3.114)
Р(у = У) = 1-Ф(/*,_,-*).
Чтобы все вероятности были положительными, оцениваемые параметры положения должны удовлетворять неравенствам
0 < ^ ! < ^ 2 < ••• <Д,Ч - |
(3.115) |
114
Смысл параметров положения хорошо иллюстрирует рис. 3.4.
xb ji3 - x b
Рис. 3.4. Вероятности в упорядоченной пробит-модели Если учесть, что
Ф ( ^ - х Ь ) - Ф ( / ^ _ , - х Ь ) = |
1 |
dt |
(3.116) |
|
2п zи |
||||
|
|
|
где г, =/*£„[ ~~ xb, z2 = Hk ~~ xb, то становится понятным, как построить логарифмическую функцию правдоподобия. Любой из ранее рассмотренных методов позволяет оптимизировать функцию правдоподобия и получить искомые параметры положения и ко эффициенты модели. Поэтому не будем рассматривать детали этого процесса, а более подробно остановимся на анализе и ин терпретации результатов моделирования.
Для пояснений рассмотрим упрощенный пример, в котором с помощью нормального распределения моделируется ситуация из трех категорий с одним неизвестным параметром положения ц:
Р(у = 0) = 1-Ф(хЬ);
Р(у = 1) = ф( ju - хЬ) - Ф(-хЬ);
Р(у = 2) = 1-Ф(^-хЬ).
Модель нелинейная, и поэтому предельные эффекты факторов не равны коэффициентам. Дифференцирование уравнений по любому из факторов приводит к соотношениям
дР(у = 0)
Эх, = -ф(хЬ)Ьк;
115
—^ '- = [ф(-хЪ)-ф(1и-хЪ)]Ьк; dxt
дхк
Таким образом, предельный эффект — это величина, перерас пределяемая между вероятностями полученного распределения. При чем сумма всех изменений рана нулю. Действительно, в рассматри ваемом примере при Ьк > О вероятность события у = О уменьшает ся на ф(хЬ)Ьк. Одновременно с этим вероятность Р(у = 1) увеличи вается на эту же величину и уменьшается на ф (/и — xb)bk, а веро ятность Р(у = 2) — увеличивается на ф (/и — xb)bk. Нетрудно заме тить, что при положительном Ьк смещение вероятности происходит вправо, а при отрицательном Ьк — влево. Из этого следует, что увеличение факторной переменной, когда коэффициент при ней положителен, приводит к увеличению вероятностей тех событий, которые получили более низкие ранги. Происходит как бы дефор мирование кривой плотности вероятностей с перемещением неко торой вероятностной массы (площади под кривой) слева направо. В случае отрицательного коэффициента все происходит наоборот. Весь этот механизм хорошо показан на рис. 3.5.
Рис. 3.5. Изменения распределения вероятностей под воздействием предельных эффектов
Для каждой /-й ситуации можно вычислить энтропию точно так же, как это делалось в модели множественного выбора. Энтропию удобно использовать для оценки информационного эффекта, яв ляющегося следствием предельного эффекта.
116
3.5.4. Преференция |
условий ведения |
бизнеса |
на основе прогнозных |
рейтинговых |
решений |
Рассмотренные выше основные аспекты построения моделей множественного выбора в ранговых шкалах свидетельству ют о возможности использования этих моделей для решения раз личных экономических задач, в том числе, задач практического маркетинга. Как известно, одной из ключевых проблем, перио дически возникающих перед любой компанией, является префе ренция условий ведения бизнеса, т.е. выбор наиболее предпоч тительных альтернатив реализации продукции, рыночных ниш, партнеров по бизнесу, экономических зон хозяйствования и т.д.
Изложим результаты исследования, проведенного с целью выбора наиболее благоприятных районов Воронежской области для реализации коммерческой деятельности ОАО "Спектр". Заметим, что эта компания имеет организационную структуру и целевые задачи такие же, как ОАО "Радуга", о котором уже шла речь в этой главе (см. 3.4).
Исходя из критерия "минимум затрат на проведение маркетин говых исследований", для реализации поставленной цели исполь зовалась информация, предоставленная Главным управлением экономического развития администрации Воронежской области.
Экспертным путем были отобраны семь показателей, играющих в совокупности ключевую роль в задачах обоснования решений, связанных с выбором наиболее привлекательных районов для ве дения торговой деятельности. Однако статистически значимыми показателями оказались только четыре: I) объем промышленной продукции (работ, услуг) в действующих ценах, млн р.; 2) сто имость валовой продукции агропромышленного комплекса в дей ствующих ценах, млн р.; 3) оборот розничной торговли (по всем каналам реализации) в действующих ценах, млн р.; 4) средняя заработная плата, р.
Кроме того, с помощью процедуры экспертного опроса были получены обобщенные оценки степени инвестиционной привлека тельности (для ведения торговли) каждого из районов, в котором ОАО "Спектр" осуществляло свою деятельность. Рейтинговое оценивание проводилось в соответствии со следующей шкалой:
0 — самая высокая степень привлекательности;
1 — высокая степень привлекательности;
2 — средняя степень привлекательности;
3 — низкая степень привлекательности;
4 — крайне низкая степень привлекательности.
117
Врезультате была сформирована табл. 3.19, данные которой
ибыли использованы для построения логит-модели множествен ного упорядоченного выбора.
Встратегические планы ОАО "Спектр" на 2005 г. входило расширение сети супермаркетов за счет освоения новых рынков сбыта в других районах Воронежской области. Показатели, харак теризующие уровень социально-экономического развития планиру емых для освоения районов, представлены в табл. 3.20.
По итогам выполнения необходимых действий в пакете STATISTICA 6.0 были получены расчетные характеристики модели, которые от ражены в табл. 3.21— 3.23.
Т а б л и ц а 3.19
Рейтинговые оценки районов Воронежской области в зависимости от уровня их социально-экономического развития
|
|
|
|
Факторы |
|
|
|
|
Рейтин |
Объем про |
Стоимость |
Оборот |
|
Район |
|
мышленной |
валовой |
розничной |
Средняя |
|
Год |
говая |
продукции |
продукции |
торговли (по |
||
Воронеж |
оценка |
(работ, услуг) |
АПК в |
всем каналам |
заработ |
|
ской |
|
района |
в действую |
действую |
реализации) в |
ная |
области |
|
|
плата, р. |
|||
|
|
|
щих ценах, |
щих ценах, |
действующих |
|
|
|
|
млн р. |
млн р. |
ценах, млн р. |
|
|
|
R |
*, |
X, |
*з |
*4 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
2002 |
1 |
1688,4 |
157,3 |
1538,2 |
2318,3 |
Борисо |
2003 |
0 |
1955,2 |
166,0 |
1979,6 |
2877,0 |
глебский |
2004 |
0 |
2314,8 |
161,3 |
2587,6 |
3100,0 |
|
2005* |
0 |
2913,5 |
177,9 |
3197,4 |
3785,7 |
|
2002 |
3 |
278,7 |
455,4 |
279,9 |
1975,9 |
Бобровский |
2003 |
3 |
344,5 |
595,7 |
323,9 |
2406,6 |
|
2004 |
1 |
442,5 |
655,3 |
356,4 |
2793,0 |
|
2005* |
1 |
556,9 |
722,9 |
440,4 |
3410,8 |
|
2002 |
3 |
781,4 |
420,4 |
440,0 |
1715,7 |
Бутурли- |
2003 |
3 |
1086,2 |
470,9 |
558,8 |
1973,0 |
новский |
2004 |
2 |
1178,2 |
519,9 |
661,5 |
2421,0 |
|
2005* |
2 |
1482,9 |
573,5 |
817,4 |
2956,5 |
|
2002 |
4 |
75,3 |
212,8 |
163,5 |
1678,2 |
Верхнема- |
2003 |
3 |
120,4 |
247,3 |
218,7 |
2044,0 |
монский |
2004 |
3 |
133,8 |
341,4 |
246,0 |
2610,0 |
|
2005* |
3 |
168,4 |
376,6 |
303,9 |
3187,3 |
118
|
|
|
П р о д о л ж е н и е |
т а б л . 3.19 |
|||
1 |
2 |
3 |
4 |
5 |
|
6 |
7 |
|
2002 |
4 |
133,3 |
169,5 |
|
155,3 |
1760,5 |
Верхне- |
2003 |
3 |
279,9 |
322,0 |
|
173,0 |
2220,0 |
хавский |
2004 |
3 |
544,8 |
360,1 |
|
205,5 |
2580,0 |
|
2005* |
3 |
685,7 |
397,2 |
|
253,9 |
3150,7 |
|
2002 |
4 |
32,9 |
231,3 |
|
230,8 |
1512,5 |
Гриба- |
2003 |
3 |
66,3 |
398,8 |
|
373,4 |
1998,0 |
новский |
2004 |
3 |
85,6 |
429,7 |
|
446,3 |
2414,0 |
|
2005* |
3 |
107,7 |
474,0 |
|
551,5 |
2947,9 |
|
2002 |
3 |
1389,4 |
749,1 |
|
528,1 |
2041,7 |
Калаче- |
2003 |
0 |
1461,7 |
824,0 |
|
686,5 |
2409,2 |
евский |
2004 |
0 |
1853,1 |
898,0 |
|
858,0 |
2826,0 |
|
2005* |
0 |
2332,4 |
990,6 |
|
1060,2 |
3451,1 |
|
2002 |
4 |
731,6 |
220,3 |
|
174,8 |
1921,2 |
Каменский |
2003 |
3 |
765,3 |
282,9 |
|
143,2 |
2000,0 |
2004 |
3 |
1052,2 |
259,8 |
|
161,2 |
2469,4 |
|
|
2005* |
3 |
1324,3 |
286,6 |
|
199,2 |
3015,6 |
|
2002 |
4 |
0,2 |
239,3 |
|
109,6 |
1612,8 |
Каширский |
2003 |
3 |
21,8 |
359,0 |
|
140,3 |
2016,0 |
2004 |
3 |
15,3 |
346,0 |
|
168,9 |
2575,0 |
|
|
2005* |
3 |
19,3 |
381,7 |
|
208,7 |
3144,6 |
|
2002 |
4 |
56,6 |
306,9 |
|
161,0 |
1752,1 |
Нижнеде- |
2003 |
4 |
86,3 |
368,3 |
|
193,8 |
1668,0 |
вицкий |
2004 |
3 |
95,6 |
310,2 |
|
270,9 |
2283,0 |
|
2005* |
3 |
120,3 |
342,2 |
|
334,7 |
2787,9 |
|
2002 |
3 |
120,7 |
359,1 |
|
271,7 |
2499,2 |
Новоус- |
2003 |
3 |
265,5 |
382,8 |
|
322,2 |
2979,0 |
манский |
2004 |
0 |
326,2 |
465,5 |
|
415,3 |
3708,0 |
|
2005* |
0 |
410,6 |
513,5 |
|
513,2 |
4528,2 |
|
2002 |
4 |
255,0 |
222,6 |
|
169,4 |
1726,3 |
Ольхо- |
2003 |
3 |
482,0 |
236,0 |
|
208,0 |
2220,0 |
ватский |
2004 |
2 |
567,8 |
277,0 |
|
247,0 |
2770,0 |
|
2005* |
2 |
714,6 |
305,6 |
|
305,2 |
3382,7 |
|
2002 |
I |
455,0 |
350,2 |
1078,7 |
2428,1 |
|
Остро |
2003 |
0 |
562,8 |
369,5 |
1340,8 |
3278,0 |
|
гожский |
2004 |
0 |
586,2 |
315,7 |
1644,4 |
4065,0 |
|
|
2005* |
0 |
737,8 |
348,2 |
2031,9 |
4964,1 |
119