В. Давнис Прогнозные модели экспертных предпочтений
.pdfДля вычисления максимально возможного значения дисперсии проведем, используя очевидное равенство
|
|
2£р,=пр> |
(2.40) |
||
преобразование |
формулы (2.37): |
|
|
|
|
D = |
I й |
-, 1 |
|
|
•2P11P,J+»P2 |
|
-L:^{pi-P)2=-L- |
|
|
||
л -1 /=i |
п -1 |
|
|
i=\j=i |
|
|
|
п-\ |
IPIJ |
-пр |
(2.41) |
|
|
|
|
|
|
Преобразованная формула позволяет понять, что максимальное значение дисперсии достигается при наибольшем значении перво го члена в квадратных скобках. В свою очередь, наибольшего зна чения этот член достигает в том случае, когда у всех экспертов оценки оказались одинаковыми, т.е. все ранжировки одинаковые. В случае одинаковых ранжировок каждая строка в табл. 2.2 будет содержать одинаковые целые числа (ранги) /, и, следовательно, величину, возводимую в квадрат, можно представить в виде
Х/Л = г т > |
(2.42) |
7=1 |
|
где / — величина среднего ранга, которая для данного случая целая.
Теперь величина первого члена в квадратных скобках может быть выражена через пит:
1 |
1 |
" •> |
т2(п + 1)(2и + \)п |
(2.43) |
|
IPO |
/=1 |
6 |
|||
|
|||||
7 = 1 |
|
Это максимально возможное значение для случая, когда оцени валось п объектов группой из т экспертов и их точки зрения пол ностью совпали. Если изменится хотя бы одна из ранжировок, то сумма уменьшится. Действительно, перестановка рангов в одной из ранжировок приведет к изменению некоторых / под знаком суммиро вания. Причем если /, < /2, то /, возрастет на величину (/2 — /,)//я, а /2 — уменьшится на эту же величину. Тогда с помощью простых
40
вычислении можно показать, как изменится в целом вся сумма в зависимости от тех изменений, которые произошли с двумя сла гаемыми:
/ |
л л ,-» л |
-I, |
|
(2.44) |
и +• |
с +1; + 2 |
т |
т |
|
|
|
|
||
|
|
|
|
Из полученного выражения следует, что сумма уменьшается на величину дополнительного слагаемого, которое всегда отрицатель ное. Следовательно, дисперсия имеет максимальное значение только в случае полного совпадения мнений экспертов.
Окончательно, подставляя (2.40) в (2.38) и подробно распи
сывая р, получаем |
формулу для вычисления |
значения максималь |
||
ной дисперсии |
|
|
|
|
m'(n |
+ l)(2n + Y)n |
п(п-\) т~ |
т'(п'-п) |
(2.45) |
£> |
6 |
4 |
Щп-1) |
|
|
|
|||
Когда дисперсия равна нулю, имеет смысл рассматривать слу чай т - п. Именно в этом случае возникает ситуация, когда один и тот же объект оценивается экспертами по-разному, т.е. все п ранжировок разные. А для разных ранжировок первый член в выражении (2.41) равен
у |
г т(т +1) ^ |
т2(т + \)2п |
(2.46) |
£ YJPH |
=Е |
|
|
|
|
При т = п полученное выражение полностью совпадает с вы ражением для пр2 и, следовательно, величина дисперсии в рассматриваемом случае равна нулю.
Если ввести обозначение
D |
1 |
(2.47) |
|
га-1•S, |
|||
|
где |
S = l |
5>, |
|
=i |
;=i |
то коэффициент конкордации можно записать в компактном виде следующим образом:
W = |
125 |
|
(2.48) |
2 / 3 |
ч |
т (п —п)
41
Если в полученных ранжировках есть связные ранги, то коэф фициент конкордации нужно корректировать, так как максималь ное значение дисперсии становится меньше, чем в случае отсут ствия связных рангов. Скорректированный коэффициент конкор дации вычисляется по формуле
W- |
™- |
(2.49) |
|
т2(п3 - п) -m^Tj |
где Т — показатель связных рангов в у'-й ранжировке:
Здесь Я, — число групп равных рангов в у'-й ранжировке; пк — число равных рангов в к-к группе связных рангов в ранжировке, полученной от у'-го эксперта.
Коэффициент конкордации равен 1 в тех случаях, когда мне ния экспертов по всем объектам полностью совпадают, и равен нулю, когда все ранжировки различны. В остальных случаях его значения удовлетворяют неравенству 0 < W < 1, причем чем бли же это значение к 1, тем теснее связь между ранжировками и надежнее групповая оценка.
Коэффициент конкордации, вычисляемый по выведенной фор муле, является, по сути, оценкой истинного значения и пред ставляет собой случайную величину. Естественно, возникает не обходимость в проверке его значимости.
Для небольших значений тип разработана специальная таб лица распределения частот [22]. Если число объектов п > 7, то значимость оценки коэффициента конкордации проверяется с помощью критерия х2- Доказано, что величина
|
X2 =Wm(n-l) |
( 1 5 0 ) |
имеет ^-распределение |
с v = (и — 1) степенями |
свободы. |
Если в некоторых ранжировках есть связные |
ранги, то для |
|
проверки значимости коэффициента конкордации используется |
||
статистика |
|
|
2 _ |
125; |
|
А/ |
/и |
|
тп(п + \)-{п-1У^Т} |
< 2 - 5 1 |
|
42
Проверка значимости коэффициента конкордации гарантирует получение статистически надежных результатов.
Рассмотрим числовой пример, иллюстрирующий процедуру вычисления коэффициента конкордации. Исходные данные и промежуточные результаты расчетов приведены в табл. 2.6.
Т а б л и ц а 2.6
Исходные данные и промежуточные расчеты
Объекты |
|
Эксперты |
|
|
Сумма |
Отклонение |
Квадрат |
|||
1 |
2 |
3 |
4 |
5 |
6 |
рангов |
от среднего |
отклонений |
||
|
||||||||||
1 |
1 |
2 |
1 |
1 |
1 |
2 |
8 |
-19 |
361 |
|
2 |
2 |
1 |
3 |
4 |
4 |
1 |
15 |
-12 |
144 |
|
3 |
3 |
4 |
2 |
2 |
2 |
4 |
17 |
-10 |
100 |
|
4 |
4 |
3 |
6 |
3 |
3 |
3 |
22 |
-5 |
25 |
|
5 |
5 |
5 |
4 |
6 |
5 |
5 |
30 |
3 |
9 |
|
6 |
6 |
6 |
5 |
5 |
7 |
7 |
36 |
9 |
81 |
|
7 |
7 |
7 |
8 |
8 |
8 |
6 |
44 |
17 |
289 |
|
8 |
8 |
8 |
7 |
7 |
6 |
8 |
44 |
17 |
289 |
|
|
|
|
|
Сумма квадратов отклонений S |
1298 |
|||||
Количество ранжируемых объектов п — 8, количество экспер тов, принявших участие в экспертном опросе, т = 6. Средний
ранг равен |
|
|
_ |
(я + 1)ш |
(8 + 1)6 _ |
р = |
= |
= 27 • |
|
2 |
2 |
Отклонения от среднего и квадраты отклонений представлены в двух последних столбцах таблицы. Используя итог последнего
столбца, окончательно |
получаем |
|
|
|
W = |
|
12S |
12-1298 |
= 0,8585. |
|
т2(п-п) |
62-(83-8) |
|
|
Для проверки значимости коэффициента конкордации вычис лим статистику хи-квадрат:
|
X2 = Wm(n -1) = 0,8585 -6-(8-1) = 36,0556. |
|
Сравнение |
расчетного значения х2 с табличным %2 = |
36,0556> |
> 14,07 = #2та6л |
позволяет отвергнуть гипотезу W= 0 и признать, что |
|
мнения экспертов согласованы.
43
Энтропийный коэффициент конкордации определяется через ве личину энтропии Не помощью формулы
W=l — , |
(2.52) |
п — |
|
где H = -J^^Pi.log2p. .
i=I ./=1
В формуле для вычисления энтропии />.. представляет собой оценку вероятности, с которой /-му объекту приписывается у'-й ранг. Вычисляется эта вероятность как отношение числа экспертов т1р приписавших объекту А(- ранг у, к общему числу экспертов
т
р „ = — • |
( 2 - 5 3 ) |
т
Как известно, максимальное значение энтропии достигается при равновероятном распределении рангов. Если в опросе при нимают участие т экспертов, то в случае равномерного распре деления число экспертов, приписавших /-му объекту у'-й ранг, равно их среднему числу, приходящемуся на один объект, т.е.
от.. = т/n. Тогда вероятность определяется с помощью простой формулы
|
р = — |
= i . |
(2.54) |
|
|
4 |
mn |
n |
|
Подставляя эту вероятность в формулу энтропии, |
получаем |
|||
) |
я т |
1 |
т |
|
Н = - 1 |
£ £l°g2 L |
= £log2 л = m\og2n. |
(2.55) |
|
Значение энтропийного коэффициента конкордации заключено между нулем и единицей. Если W3 = 0, то это означает, что между ранжировками нет связи. В этом случае ранги равномерно распре делены между объектами и, следовательно, Н = #m a r Противопо ложный случай: W3 = 1 соответствует ситуации, когда все экспер ты идентично оценили значимость объектов, и ранжировки оказа лись совпадающими между собой. При совпадающих ранжировках
рк/= 1, а все остальные р0 = 0 (i*k, j*l, i = l,n, j = l,m). Поэто му H = 0 и, следовательно,^ = 1.
44
Процедура вычисления энтропийного коэффициента конкордации более громоздкая, чем дисперсионного. Проиллюстрируем ее основные этапы на данных предыдущего примера.
На первом этапе по табл. 2.6 сформируем квадратную матри цу размером п х п с элементами т^, представляющими количество экспертов, приписавших /-му объекту у'-й ранг (табл. 2.7).
Т а б л и ц а 2.7
Частоты экспертных предпочтений
Объекты |
|
|
|
Ранги |
|
|
|
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
||
|
|||||||||
1 |
4 |
2 |
0 |
0 |
0 |
0 |
0 |
0 |
|
2 |
2 |
1 |
1 |
2 |
0 |
0 |
0 |
0 |
|
3 |
0 |
3 |
1 |
2 |
0 |
0 |
0 |
0 |
|
4 |
0 |
0 |
4 |
1 |
0 |
1 |
0 |
0 |
|
5 |
0 |
0 |
0 |
1 |
4 |
1 |
0 |
0 |
|
6 |
0 |
0 |
0 |
0 |
2 |
2 |
2 |
0 |
|
7 |
0 |
0 |
0 |
0 |
0 |
1 |
2 |
3 |
|
8 |
0 |
0 |
0 |
0 |
0 |
1 |
2 |
3 |
|
Разделив все элементы |
этой матрицы на число экспертов |
||||||||
|
|
|
|
III:: |
, |
|
|
(2-56) |
|
|
|
|
|
Ру= — |
|
|
|||
|
|
|
|
т |
|
|
|
|
|
получим матрицу, элементы которой есть вероятности, с которыми эксперты присваивают ранги соответствующим объектам (табл. 2.8).
Т а б л и ц а 2.8
Вероятности, с которыми эксперты проводят ранжировку объекто
Объекты |
|
|
|
Ранги |
|
|
|
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
||
|
|||||||||
1 |
0,667 |
0,333 |
0 |
0 |
0 |
0 |
0 |
0 |
|
2 |
0,333 |
0,167 |
0,167 |
0,333 |
0 |
0 |
0 |
0 |
|
3 |
0 |
0,5 |
0,167 |
0,333 |
0 |
0 |
0 |
0 |
|
4 |
0 |
0 |
0,667 |
0,167 |
0 |
0,167 |
0 |
0 |
|
5 |
0 |
0 |
0 |
0,167 |
0,667 |
0,167 |
0 |
0 |
|
6 |
0 |
0 |
0 |
0 |
0,333 |
0,333 |
0,333 |
0 |
|
7 |
0 |
0 |
0 |
0 |
0 |
0,167 |
0,333 |
0,5 |
|
8 |
0 |
0 |
0 |
0 |
0 |
0,167 |
0,333 |
0,5 |
|
45
Из матрицы вероятностей применением преобразования
htj = -р& log, PiJ |
(2-57) |
легко получается матрица энтропийных характеристик полученных ранжировок, представленная соответствующей частью табл. 2.9.
|
|
|
|
|
|
|
Т а б л и ц а |
2.9 |
|||
|
Энтропийные характеристики ранжировок |
|
|||||||||
Объекты |
|
|
|
Ранги |
|
|
|
Сумма |
|||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
||||
|
|
|
|||||||||
1 |
0,39 |
0,528 |
0 |
0 |
0 |
0 |
0 |
0 |
0,918 |
296 |
|
2 |
0,528 |
0,431 |
0,431 |
0,528 |
0 |
0 |
0 |
0 |
1,918 |
296 |
|
3 |
0 |
0,5 |
0,431 |
0,528 |
0 |
0 |
0 |
0 |
1,459 |
148 |
|
4 |
0 |
0 |
0,39 |
0,431 |
0 |
0,431 |
0 |
0 |
1,251 629 |
||
5 |
0 |
0 |
0 |
0,431 |
0,39 |
0,431 |
0 |
0 |
1,251 629 |
||
6 |
|
|
|
|
0,528 |
0,528 |
0,528 |
0 |
1,584 |
963 |
|
7 |
0 |
0 |
0 |
0 |
0 |
0,431 |
0,528 |
0,5 |
1,459 |
148 |
|
8 |
0 |
0 |
0 |
0 |
0 |
0,431 |
0,528 |
0,5 |
1,459 |
148 |
|
|
|
|
|
|
Суммарная энтропия Н |
11,302 26 |
|||||
Величина максимальной энтропии для рассматриваемого случая равна
tfmax=6.l0g28 = 18Окончательно получаем
^ = 1 - |
^ |
= 1 - 1 ^ = 0,6279. |
# |
т а х |
18 |
Значения дисперсионного и энтропийного коэффициентов кон кордации не совпадают. Причем их значения сближаются по мере увеличения степени согласованности мнений экспертов, т.е. чем ближе к единице, тем меньше различие между ними. Самое боль шое различие между этими коэффициентами имеет место в слу чае, когда эксперты разделились на две группы с полностью про тивоположными точками зрения. По дисперсионному коэффици енту конкордации степень согласованности в этой ситуации будет равна нулю, а по энтропийному — 0,5.
ГЛАВА 3
ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ ЭКСПЕРТНЫХ ПРЕДПОЧТЕНИЙ
3.1.Экспертные оценки
имодели бинарного выбора
3.1.1. Концептуальные основы моделирования экспертных предпочтений
В предыдущих главах достаточно подробно изложен математический аппарат, применяемый в настоящее время (и не без успеха) в различных схемах получения и обработки эксперт ной информации, используемой в задачах обоснования управлен ческих решений. И все же во всех этих схемах, несмотря на их разнообразие, по преимуществу используются методы из одного и того же вышеописанного набора. К этому набору можно доба вить балльное оценивание и простое ранжирование, которые в силу своей распространенности и того, что не приводят к полу чению более надежных оценок, чем метод парных сравнений, не рассматривались среди вышеизложенных. Можно вспомнить и медиану Кемени, процедура нахождения которой достаточно сложна и поэтому редко используется в практике получения груп повых оценок.
Однако в каком бы составе мы не рассматривали эти методы, их главная особенность в том, что для числового представления получаемых результатов в основном используются номинальные и ранговые шкалы. Этим и объясняется, на наш взгляд, тот консер ватизм, который утвердился в отношении методов обработки экс пертной информации. Его природа очевидна: низкая разрешающая способность экспертов, которая служит непреодолимым барьером для повышения точности экспертных оценок. Возникает естествен ный вопрос: "Какой смысл в разработке новых подходов и более точных методов, если они из-за указанного барьера не приводят к уточнению финальных результатов?" Трудно возразить этому тези су. И все же смысл есть. Он появляется в тех случаях, когда меняется привычное представление о сути решаемых задач.
47
В качестве примера, демонстрирующего новый взгляд на обра ботку экспертной информации, рассмотрим в фокусе этого взгля да задачу ранжирования показателей по степени их влияния на возможность появления какого-либо события. Эта задача является одной из наиболее распространенных в практике экспертного оце нивания. Ее решение можно получить с помощью любого из рассмотренных методов. Однако несмотря на многообразие мето дов, суть подхода, реализуемого в этих методах, одна — непосред ственное оценивание показателей. Наряду с простотой реализации этот подход имеет и ряд недостатков. Очевидно, что его примене ние имеет смысл только в линейном случае, когда степень влия ния не зависит от структуры оцениваемого набора показателей.
В реальных ситуациях все гораздо сложней. Представление о линейном взаимодействии — скорее абстракция, помогающая уп ростить задачу, сделав ее всегда решаемой, но с некоторой ошиб кой, которой можно пренебречь. Логика получения результатов по такой схеме оценивания без учета совместных эффектов вполне объяснима. Решение ищется для конкретной ситуации с фиксиро ванной структурой показателей, которая хотя и не указывается в задании эксперту, но, как правило, присутствует в его представ лениях о решаемой задаче. Но как только структура начинает из меняться, сразу же появляются неучтенные эффекты взаимодей ствия и надежность экспертных оценок резко снижается. Поэтому непосредственное оценивание показателей с предполагаемой линей ной структурой взаимосвязей необходимо заменить более сложным, основанным на модельном представлении структуры, но без услож нения самой процедуры опроса экспертов. При этом модель, от ражающая взаимосвязь между возможностью появления интересу ющего нас события и набором оцениваемых показателей, должна быть, по всей вероятности, нелинейной и, кроме того, эконометрической, так как интерес вызывают не только механизм взаимо действия, но и количественная оценка силы этого взаимодействия, а также желание заменить повторные экспертные опросы прогноз ными оценками. Последнее особенно важно. Именно этой воз можностью не обладают ранее рассмотренные методы.
Таким образом, смысл излагаемого здесь подхода в том, что бы экспертную информацию использовать для построения модели, а не для получения самих оценок. Возникает естественный воп рос: "Каким образом экспертная информация может использовать ся для этих целей?" По всей видимости, можно предложить несколько подходов, обеспечивающих реализацию обсуждаемой 48
здесь идеи. Наше предложение заключается в том, чтобы инту ицию и знания экспертов применить для формирования специаль ного набора данных псевдовыборки, по которым оцениваются ко эффициенты модели, имеющей, в отличие от непосредственных экспертных оценок, многоплановое применение: анализ, оценка значимости факторов, прогноз ожидаемых событий и т.п. Есте ственно, это значительно расширяет область практического ис пользования экспертных решений.
Реализация данного подхода предполагает введение бинарной переменной со следующим смыслом:
_ I \, если, по мнению эксперта, событие должно произойти; J О, в противном случае.
Будем считать, что значение этой переменной, характеризу ющей появление интересующего нас события, зависит от оценива емого нами набора показателей xv х2, ... , хт, и существует не которое множество различных вариантов х,, х2, ... , х/( этих на боров х;. = (хп, хп, ... , хш), отличающихся друг от друга все ми или некоторыми своими компонентами (оцениваемыми пока зателями). Предполагается, что у каждого эксперта есть представ ление о том, при реализации каких вариантов ожидаемое собы тие будет иметь место, а при реализации каких — нет. Матема тически это предположение записывается в виде зависимости
yf = f(x,,,*/ 2 ,...,*,„) + £*, |
(3-1) |
где у* — ожидаемое значение бинарной зависимой переменной, которое k-й эксперт связывает с г'-м набором оцениваемых пока зателей; f(xn, ха, ... , xjm) — индексная функция, т.е. функция, принимающая всего два значения: 0 и 1; £,- — ошибка, которую может допустить k-Pi эксперт, оценивая влияние /-го набора на появление ожидаемого события (£,*— случайная переменная со значениями в номинальной шкале: I, 0, -1).
Теперь становится понятной реализация основанной на модель ном подходе идеи получения экспертных решений. Сначала в результате целевого опроса экспертов формируется псевдовыбор ка, объединяющая в себе субъективные мнения по поводу инте ресующих нас закономерностей, предпочтений, рейтингов, про гнозных оценок и т.п. Затем по данным псевдовыборки строит ся регрессионная зависимость (3.1), связывающая субъективные мнения с одновременным их усреднением в единую формализо ванную зависимость. Построенная таким образом модель, по
49
