Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

В. Давнис Прогнозные модели экспертных предпочтений

.pdf
Скачиваний:
222
Добавлен:
14.08.2013
Размер:
3.39 Mб
Скачать

Для вычисления максимально возможного значения дисперсии проведем, используя очевидное равенство

 

 

2£р,=пр>

(2.40)

преобразование

формулы (2.37):

 

 

 

D =

I й

-, 1

 

 

•2P11P,J+»P2

 

-L:^{pi-P)2=-L-

 

 

л -1 /=i

п -1

 

 

i=\j=i

 

 

п-\

IPIJ

-пр

(2.41)

 

 

 

 

 

Преобразованная формула позволяет понять, что максимальное значение дисперсии достигается при наибольшем значении перво­ го члена в квадратных скобках. В свою очередь, наибольшего зна­ чения этот член достигает в том случае, когда у всех экспертов оценки оказались одинаковыми, т.е. все ранжировки одинаковые. В случае одинаковых ранжировок каждая строка в табл. 2.2 будет содержать одинаковые целые числа (ранги) /, и, следовательно, величину, возводимую в квадрат, можно представить в виде

Х/Л = г т >

(2.42)

7=1

 

где / — величина среднего ранга, которая для данного случая целая.

Теперь величина первого члена в квадратных скобках может быть выражена через пит:

1

1

" •>

т2(п + 1)(2и + \)п

(2.43)

IPO

/=1

6

 

7 = 1

 

Это максимально возможное значение для случая, когда оцени­ валось п объектов группой из т экспертов и их точки зрения пол­ ностью совпали. Если изменится хотя бы одна из ранжировок, то сумма уменьшится. Действительно, перестановка рангов в одной из ранжировок приведет к изменению некоторых / под знаком суммиро­ вания. Причем если /, < /2, то /, возрастет на величину (/2 — /,)//я, а /2 — уменьшится на эту же величину. Тогда с помощью простых

40

вычислении можно показать, как изменится в целом вся сумма в зависимости от тех изменений, которые произошли с двумя сла­ гаемыми:

/

л л ,-» л

-I,

 

(2.44)

и +•

с +1; + 2

т

т

 

 

 

 

 

 

 

Из полученного выражения следует, что сумма уменьшается на величину дополнительного слагаемого, которое всегда отрицатель­ ное. Следовательно, дисперсия имеет максимальное значение только в случае полного совпадения мнений экспертов.

Окончательно, подставляя (2.40) в (2.38) и подробно распи­

сывая р, получаем

формулу для вычисления

значения максималь­

ной дисперсии

 

 

 

 

m'(n

+ l)(2n + Y)n

п(п-\) т~

т'(п'-п)

(2.45)

£>

6

4

Щп-1)

 

 

Когда дисперсия равна нулю, имеет смысл рассматривать слу­ чай т - п. Именно в этом случае возникает ситуация, когда один и тот же объект оценивается экспертами по-разному, т.е. все п ранжировок разные. А для разных ранжировок первый член в выражении (2.41) равен

у

г т(т +1) ^

т2(т + \)2п

(2.46)

£ YJPH

 

 

 

При т = п полученное выражение полностью совпадает с вы­ ражением для пр2 и, следовательно, величина дисперсии в рассматриваемом случае равна нулю.

Если ввести обозначение

D

1

(2.47)

га-1•S,

 

где

S = l

5>,

 

=i

;=i

то коэффициент конкордации можно записать в компактном виде следующим образом:

W =

125

 

(2.48)

2 / 3

ч

т (п —п)

41

Если в полученных ранжировках есть связные ранги, то коэф­ фициент конкордации нужно корректировать, так как максималь­ ное значение дисперсии становится меньше, чем в случае отсут­ ствия связных рангов. Скорректированный коэффициент конкор­ дации вычисляется по формуле

W-

™-

(2.49)

 

т2(п3 - п) -m^Tj

где Т — показатель связных рангов в у'-й ранжировке:

Здесь Я, — число групп равных рангов в у'-й ранжировке; пк число равных рангов в к-к группе связных рангов в ранжировке, полученной от у'-го эксперта.

Коэффициент конкордации равен 1 в тех случаях, когда мне­ ния экспертов по всем объектам полностью совпадают, и равен нулю, когда все ранжировки различны. В остальных случаях его значения удовлетворяют неравенству 0 < W < 1, причем чем бли­ же это значение к 1, тем теснее связь между ранжировками и надежнее групповая оценка.

Коэффициент конкордации, вычисляемый по выведенной фор­ муле, является, по сути, оценкой истинного значения и пред­ ставляет собой случайную величину. Естественно, возникает не­ обходимость в проверке его значимости.

Для небольших значений тип разработана специальная таб­ лица распределения частот [22]. Если число объектов п > 7, то значимость оценки коэффициента конкордации проверяется с помощью критерия х2- Доказано, что величина

 

X2 =Wm(n-l)

( 1 5 0 )

имеет ^-распределение

с v = (и — 1) степенями

свободы.

Если в некоторых ранжировках есть связные

ранги, то для

проверки значимости коэффициента конкордации используется

статистика

 

 

2 _

125;

 

А/

 

тп(п + \)-{п-1У^Т}

< 2 - 5 1

42

Проверка значимости коэффициента конкордации гарантирует получение статистически надежных результатов.

Рассмотрим числовой пример, иллюстрирующий процедуру вычисления коэффициента конкордации. Исходные данные и промежуточные результаты расчетов приведены в табл. 2.6.

Т а б л и ц а 2.6

Исходные данные и промежуточные расчеты

Объекты

 

Эксперты

 

 

Сумма

Отклонение

Квадрат

1

2

3

4

5

6

рангов

от среднего

отклонений

 

1

1

2

1

1

1

2

8

-19

361

2

2

1

3

4

4

1

15

-12

144

3

3

4

2

2

2

4

17

-10

100

4

4

3

6

3

3

3

22

-5

25

5

5

5

4

6

5

5

30

3

9

6

6

6

5

5

7

7

36

9

81

7

7

7

8

8

8

6

44

17

289

8

8

8

7

7

6

8

44

17

289

 

 

 

 

Сумма квадратов отклонений S

1298

Количество ранжируемых объектов п — 8, количество экспер­ тов, принявших участие в экспертном опросе, т = 6. Средний

ранг равен

 

 

_

(я + 1)ш

(8 + 1)6 _

р =

=

= 27 •

 

2

2

Отклонения от среднего и квадраты отклонений представлены в двух последних столбцах таблицы. Используя итог последнего

столбца, окончательно

получаем

 

 

W =

 

12S

12-1298

= 0,8585.

 

т2(п-п)

62-(83-8)

 

Для проверки значимости коэффициента конкордации вычис­ лим статистику хи-квадрат:

 

X2 = Wm(n -1) = 0,8585 -6-(8-1) = 36,0556.

 

Сравнение

расчетного значения х2 с табличным %2 =

36,0556>

> 14,07 = #2та6л

позволяет отвергнуть гипотезу W= 0 и признать, что

мнения экспертов согласованы.

43

Энтропийный коэффициент конкордации определяется через ве­ личину энтропии Не помощью формулы

W=l — ,

(2.52)

п

 

где H = -J^^Pi.log2p. .

i=I ./=1

В формуле для вычисления энтропии />.. представляет собой оценку вероятности, с которой /-му объекту приписывается у'-й ранг. Вычисляется эта вероятность как отношение числа экспертов тприписавших объекту А(- ранг у, к общему числу экспертов

т

р „ = — •

( 2 - 5 3 )

т

Как известно, максимальное значение энтропии достигается при равновероятном распределении рангов. Если в опросе при­ нимают участие т экспертов, то в случае равномерного распре­ деления число экспертов, приписавших /-му объекту у'-й ранг, равно их среднему числу, приходящемуся на один объект, т.е.

от.. = т/n. Тогда вероятность определяется с помощью простой формулы

 

р = —

= i .

(2.54)

 

4

mn

n

 

Подставляя эту вероятность в формулу энтропии,

получаем

)

я т

1

т

 

Н = - 1

£ £l°g2 L

= £log2 л = m\og2n.

(2.55)

Значение энтропийного коэффициента конкордации заключено между нулем и единицей. Если W3 = 0, то это означает, что между ранжировками нет связи. В этом случае ранги равномерно распре­ делены между объектами и, следовательно, Н = #m a r Противопо­ ложный случай: W3 = 1 соответствует ситуации, когда все экспер­ ты идентично оценили значимость объектов, и ранжировки оказа­ лись совпадающими между собой. При совпадающих ранжировках

рк/= 1, а все остальные р0 = 0 (i*k, j*l, i = l,n, j = l,m). Поэто­ му H = 0 и, следовательно,^ = 1.

44

Процедура вычисления энтропийного коэффициента конкордации более громоздкая, чем дисперсионного. Проиллюстрируем ее основные этапы на данных предыдущего примера.

На первом этапе по табл. 2.6 сформируем квадратную матри­ цу размером п х п с элементами т^, представляющими количество экспертов, приписавших /-му объекту у'-й ранг (табл. 2.7).

Т а б л и ц а 2.7

Частоты экспертных предпочтений

Объекты

 

 

 

Ранги

 

 

 

1

2

3

4

5

6

7

8

 

1

4

2

0

0

0

0

0

0

2

2

1

1

2

0

0

0

0

3

0

3

1

2

0

0

0

0

4

0

0

4

1

0

1

0

0

5

0

0

0

1

4

1

0

0

6

0

0

0

0

2

2

2

0

7

0

0

0

0

0

1

2

3

8

0

0

0

0

0

1

2

3

Разделив все элементы

этой матрицы на число экспертов

 

 

 

 

III::

,

 

 

(2-56)

 

 

 

 

Ру= —

 

 

 

 

 

 

т

 

 

 

 

получим матрицу, элементы которой есть вероятности, с которыми эксперты присваивают ранги соответствующим объектам (табл. 2.8).

Т а б л и ц а 2.8

Вероятности, с которыми эксперты проводят ранжировку объекто

Объекты

 

 

 

Ранги

 

 

 

1

2

3

4

5

6

7

8

 

1

0,667

0,333

0

0

0

0

0

0

2

0,333

0,167

0,167

0,333

0

0

0

0

3

0

0,5

0,167

0,333

0

0

0

0

4

0

0

0,667

0,167

0

0,167

0

0

5

0

0

0

0,167

0,667

0,167

0

0

6

0

0

0

0

0,333

0,333

0,333

0

7

0

0

0

0

0

0,167

0,333

0,5

8

0

0

0

0

0

0,167

0,333

0,5

45

Из матрицы вероятностей применением преобразования

htj = & log, PiJ

(2-57)

легко получается матрица энтропийных характеристик полученных ранжировок, представленная соответствующей частью табл. 2.9.

 

 

 

 

 

 

 

Т а б л и ц а

2.9

 

Энтропийные характеристики ранжировок

 

Объекты

 

 

 

Ранги

 

 

 

Сумма

1

2

3

4

5

6

7

8

 

 

 

1

0,39

0,528

0

0

0

0

0

0

0,918

296

2

0,528

0,431

0,431

0,528

0

0

0

0

1,918

296

3

0

0,5

0,431

0,528

0

0

0

0

1,459

148

4

0

0

0,39

0,431

0

0,431

0

0

1,251 629

5

0

0

0

0,431

0,39

0,431

0

0

1,251 629

6

 

 

 

 

0,528

0,528

0,528

0

1,584

963

7

0

0

0

0

0

0,431

0,528

0,5

1,459

148

8

0

0

0

0

0

0,431

0,528

0,5

1,459

148

 

 

 

 

 

Суммарная энтропия Н

11,302 26

Величина максимальной энтропии для рассматриваемого случая равна

tfmax=6.l0g28 = 18Окончательно получаем

^ = 1 -

^

= 1 - 1 ^ = 0,6279.

#

т а х

18

Значения дисперсионного и энтропийного коэффициентов кон­ кордации не совпадают. Причем их значения сближаются по мере увеличения степени согласованности мнений экспертов, т.е. чем ближе к единице, тем меньше различие между ними. Самое боль­ шое различие между этими коэффициентами имеет место в слу­ чае, когда эксперты разделились на две группы с полностью про­ тивоположными точками зрения. По дисперсионному коэффици­ енту конкордации степень согласованности в этой ситуации будет равна нулю, а по энтропийному — 0,5.

ГЛАВА 3

ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ ЭКСПЕРТНЫХ ПРЕДПОЧТЕНИЙ

3.1.Экспертные оценки

имодели бинарного выбора

3.1.1. Концептуальные основы моделирования экспертных предпочтений

В предыдущих главах достаточно подробно изложен математический аппарат, применяемый в настоящее время (и не без успеха) в различных схемах получения и обработки эксперт­ ной информации, используемой в задачах обоснования управлен­ ческих решений. И все же во всех этих схемах, несмотря на их разнообразие, по преимуществу используются методы из одного и того же вышеописанного набора. К этому набору можно доба­ вить балльное оценивание и простое ранжирование, которые в силу своей распространенности и того, что не приводят к полу­ чению более надежных оценок, чем метод парных сравнений, не рассматривались среди вышеизложенных. Можно вспомнить и медиану Кемени, процедура нахождения которой достаточно сложна и поэтому редко используется в практике получения груп­ повых оценок.

Однако в каком бы составе мы не рассматривали эти методы, их главная особенность в том, что для числового представления получаемых результатов в основном используются номинальные и ранговые шкалы. Этим и объясняется, на наш взгляд, тот консер­ ватизм, который утвердился в отношении методов обработки экс­ пертной информации. Его природа очевидна: низкая разрешающая способность экспертов, которая служит непреодолимым барьером для повышения точности экспертных оценок. Возникает естествен­ ный вопрос: "Какой смысл в разработке новых подходов и более точных методов, если они из-за указанного барьера не приводят к уточнению финальных результатов?" Трудно возразить этому тези­ су. И все же смысл есть. Он появляется в тех случаях, когда меняется привычное представление о сути решаемых задач.

47

В качестве примера, демонстрирующего новый взгляд на обра­ ботку экспертной информации, рассмотрим в фокусе этого взгля­ да задачу ранжирования показателей по степени их влияния на возможность появления какого-либо события. Эта задача является одной из наиболее распространенных в практике экспертного оце­ нивания. Ее решение можно получить с помощью любого из рассмотренных методов. Однако несмотря на многообразие мето­ дов, суть подхода, реализуемого в этих методах, одна — непосред­ ственное оценивание показателей. Наряду с простотой реализации этот подход имеет и ряд недостатков. Очевидно, что его примене­ ние имеет смысл только в линейном случае, когда степень влия­ ния не зависит от структуры оцениваемого набора показателей.

В реальных ситуациях все гораздо сложней. Представление о линейном взаимодействии — скорее абстракция, помогающая уп­ ростить задачу, сделав ее всегда решаемой, но с некоторой ошиб­ кой, которой можно пренебречь. Логика получения результатов по такой схеме оценивания без учета совместных эффектов вполне объяснима. Решение ищется для конкретной ситуации с фиксиро­ ванной структурой показателей, которая хотя и не указывается в задании эксперту, но, как правило, присутствует в его представ­ лениях о решаемой задаче. Но как только структура начинает из­ меняться, сразу же появляются неучтенные эффекты взаимодей­ ствия и надежность экспертных оценок резко снижается. Поэтому непосредственное оценивание показателей с предполагаемой линей­ ной структурой взаимосвязей необходимо заменить более сложным, основанным на модельном представлении структуры, но без услож­ нения самой процедуры опроса экспертов. При этом модель, от­ ражающая взаимосвязь между возможностью появления интересу­ ющего нас события и набором оцениваемых показателей, должна быть, по всей вероятности, нелинейной и, кроме того, эконометрической, так как интерес вызывают не только механизм взаимо­ действия, но и количественная оценка силы этого взаимодействия, а также желание заменить повторные экспертные опросы прогноз­ ными оценками. Последнее особенно важно. Именно этой воз­ можностью не обладают ранее рассмотренные методы.

Таким образом, смысл излагаемого здесь подхода в том, что­ бы экспертную информацию использовать для построения модели, а не для получения самих оценок. Возникает естественный воп­ рос: "Каким образом экспертная информация может использовать­ ся для этих целей?" По всей видимости, можно предложить несколько подходов, обеспечивающих реализацию обсуждаемой 48

здесь идеи. Наше предложение заключается в том, чтобы инту­ ицию и знания экспертов применить для формирования специаль­ ного набора данных псевдовыборки, по которым оцениваются ко­ эффициенты модели, имеющей, в отличие от непосредственных экспертных оценок, многоплановое применение: анализ, оценка значимости факторов, прогноз ожидаемых событий и т.п. Есте­ ственно, это значительно расширяет область практического ис­ пользования экспертных решений.

Реализация данного подхода предполагает введение бинарной переменной со следующим смыслом:

_ I \, если, по мнению эксперта, событие должно произойти; J О, в противном случае.

Будем считать, что значение этой переменной, характеризу­ ющей появление интересующего нас события, зависит от оценива­ емого нами набора показателей xv х2, ... , хт, и существует не­ которое множество различных вариантов х,, х2, ... , х/( этих на­ боров х;. = п, хп, ... , хш), отличающихся друг от друга все­ ми или некоторыми своими компонентами (оцениваемыми пока­ зателями). Предполагается, что у каждого эксперта есть представ­ ление о том, при реализации каких вариантов ожидаемое собы­ тие будет иметь место, а при реализации каких — нет. Матема­ тически это предположение записывается в виде зависимости

yf = f(x,,,*/ 2 ,...,*,„) + £*,

(3-1)

где у* — ожидаемое значение бинарной зависимой переменной, которое k-й эксперт связывает с г'-м набором оцениваемых пока­ зателей; f(xn, ха, ... , xjm) — индексная функция, т.е. функция, принимающая всего два значения: 0 и 1; £,- — ошибка, которую может допустить k-Pi эксперт, оценивая влияние /-го набора на появление ожидаемого события (£,*— случайная переменная со значениями в номинальной шкале: I, 0, -1).

Теперь становится понятной реализация основанной на модель­ ном подходе идеи получения экспертных решений. Сначала в результате целевого опроса экспертов формируется псевдовыбор­ ка, объединяющая в себе субъективные мнения по поводу инте­ ресующих нас закономерностей, предпочтений, рейтингов, про­ гнозных оценок и т.п. Затем по данным псевдовыборки строит­ ся регрессионная зависимость (3.1), связывающая субъективные мнения с одновременным их усреднением в единую формализо­ ванную зависимость. Построенная таким образом модель, по

49

Соседние файлы в предмете Анализ данных