
В. Давнис Прогнозные модели экспертных предпочтений
.pdfОт первого подхода сразу нужно отказаться, Дело в том, что псевдовыборка, сформированная с ориентиром на согласованное мнение экспертов, не всегда гарантирует построение адекватной модели. Это бывает в том случае, когда согласованными оказа лись мнения некомпетентных экспертов. Подобная ситуация не возникает в задачах прямого экспертного оценивания. В них ком петентность оценивается либо экзогенно, и тогда она не связана с результатами опроса, либо в зависимости от того, насколько соответствующее индивидуальное мнение похоже на групповое.
Второй подход представляет собой авторское решение задачи, в рамках которой проверяется согласованность экспертных сужде ний. Как и в случае прямого экспертного оценивания, в пред лагаемом подходе предусматриваются проверка согласованности мнений двух экспертов и проверка согласованности мнений всей группы экспертов, принявших участие в экспертизе. Обе провер ки основаны на одной и той же идее. Смысл этой идеи в том, что эксперты с близкими мнениями распределяют свои предпоч тения по выборочной совокупности так, что полученные псевдо выборки обеспечивают построение почти идентичных моделей. Таким образом, проверка согласованности сводится к статистичес кой проверке значимости уровня идентичности. Выполнить такую проверку можно несколькими способами.
На наш взгляд, наиболее приемлемым следует считать способ, который позволяет не только оценить статистическую значимость, но и получить содержательно интерпретируемую величину, харак теризующую уровень идентичности моделей и, следовательно, уровень согласованности экспертов. В качестве такой величины удобно использовать коэффициент Юла, который измеряет тесноту связи между двумя дихотомическими переменными.
Формально с помощью этого коэффициента мы можем оценить тесноту связи между предикторными возможностями двух моделей бинарного выбора. Для этого заполняется таблица сопряженнос ти 2 х 2 следующего вида:
Модель 1-го эксперта
Коды |
1 |
0 |
1 |
а |
в |
0 |
с |
d |
Правило заполнения таблицы сопряженности довольно про стое. В верхней левой клеточке стоит число случаев, когда пред-
60
сказания по обеим моделям совпадали и были равны 1, в ниж ней правой — число случаев, когда обе модели предсказали 0. В остальных клеточках стоит число несовпадающих предсказаний. Коэффициент Юла рассчитывается по формуле
ad-be |
,, g. |
ad + be
При полном совпадении предсказанных значений qn — 1, и мы наблюдаем случай, когда мнения экспертов идентичны; при qn = —\ мнения экспертов противоположны, а при qn = 0 — независимы. Чем ближе значение коэффициента к 1, тем выше уровень согласованности экспертных мнений.
Для проверки групповой согласованности нет подходящего из мерителя. Но можно предложить следующую двухэтапную проце дуру. На первом этапе для каждой пары экспертов вычисляется коэффициент сопряженности Юла, и все эксперты делятся на две группы. В первую группу включаются только те эксперты, по моделям которых предсказанные значения имеют положительную связь между собой. Из коэффициентов сопряженности этой груп пы формируется матрица
|
Яи Яи |
Яш |
Q = |
Яп |
Ягт |
|
|
Матрица Q обладает всеми свойствами, необходимыми для того, чтобы с помощью обычной итерационной процедуры вычис лить максимальное собственное значение Я, которое является дей ствительным числом. Тогда в качестве меры, определяющей уро вень согласованности экспертов, можно использовать величину
L = ^ - |
= — , |
(3.10) |
trQ-1 |
m-1 |
|
в знаменателе которой стоит след матрицы без единицы.
Так, определенный коэффициент согласованности будем назы вать характеристическим. Он равен 1, когда между всеми экспер тами группы наблюдается абсолютное согласие, и равен 0, если результаты экспертного опроса статистически независимы.
С отбракованной на первом этапе группой экспертов поступа ют точно так же.
61
Окончательно групповая оценка строится только для группы экспертов, имеющих согласованные мнения. Для этого все псев довыборки объединяются в одну, по данным которой строится модель, отражающая групповое экспертное мнение. Ее и реко мендуется использовать в расчетах.
3.1.5. Предельный анализ моделей субъективных предпочтений
Предельный анализ факторов модели экспертных предпочтений проводится по схеме предельного анализа бинарной модели. Поэтому вначале изложим все детали предельного анализа бинарной модели, а затем обсудим интерпретацию этих результа тов для случая, когда моделируются экспертные предпочтения. Рассмотрение начнем с линейной модели.
В классической теории коэффициенты линейной регрессии интерпретируют как предельные коэффициенты абсолютного ро ста. Принято считать, что k-н коэффициент регрессии показы вает, насколько изменится зависимая переменная (моделируемый показатель), если к-я независимая переменная изменится на еди ницу при условии, что эта единица достаточно мала, а все ос тальные переменные неизменны. Естественно, при построении пробит- и логит-моделей возникает аналогичный вопрос.
Предельный анализ с использованием пробит- и логит-моделей в силу их нелинейного характера и вероятностной интерпретации результатов моделирования требует более сложных математических обоснований по сравнению с линейными моделями.
Рассмотрим общий случай модели бинарного выбора и запи
шем для события yt- условное математическое ожидание |
|
||
E(y,.|x,.) = lF(xi.b) + 0(l-F(x,b))- |
(3-П) |
||
Предельный эффект к-го фактора вычисляется в виде первой |
|||
производной |
|
|
|
ЭЕ(у,.|х,.) |
faF(x,.b)3(x,.b) |
= f(x,.b)bt, |
(3.12) |
dxik |
{ Э(х,Ь) dxik |
|
|
где f() — функция плотности, связанная |
с соответствующим |
||
кумулятивным распределением F(). |
|
|
Полученный предельный эффект можно интерпретировать как величину, на которую изменяется вероятность выбора при изме нении фактора на единицу, т.е., по сути, как изменится неопре-
62
деленность ситуации бинарного выбора. Однако механизм форми рования этой величины не так прост, как в линейной модели, и представляет собой взаимодействие двух составляющих, каждая из которых имеет собственную интерпретацию.
Первая составляющая определяется плотностью распределения, которая в предельном эффекте является изменяемой характерис тикой, зависящей от х- Рассмотрим основные механизмы фор мирования этой составляющей и ее содержательную интерпрета цию. Прежде всего обратим внимание на то обстоятельство, что изменение к-й переменной, например в сторону увеличения ее значения, может привести как к увеличению, так и снижению плотности вероятности. Механизм реализации этих изменений начинает действовать с изменения значения линейной формы:
Zi = x,b = b0+ bxxn +••• + bkxik +••• + bmxim. |
(3.13) |
Изменение линейной формы зависит от величины и знака ко эффициента регрессии Ьк. В свою очередь, изменение плотнос ти вероятности зависит не только от величины, на которую из менилось значение линейной формы, но и от того, где это зна чение расположено на оси z- Если оно лежит в левой половине распределения, то увеличение z приводит к возрастанию плотно сти, если в правой — то к снижению. Это положение хорошо иллюстрирует рис. 3.1.
Рис. 3.1. Изменение плотности вероятности в зависимости от распо ложения значения линейной формы
Анализ предельной производительности факторов позволяет обнаружить, что максимально возможная производительность фактора достигается в тех точках, в которых плотность имеет наи большее значение. Интересно, что именно в этих точках ситуа ция бинарного выбора обладает самым высоким уровнем неопре деленности. Это становится совершенно очевидным для логит-
63
модели, если вспомнить о выражении для плотности и предель ную производительность ее А:-го фактора записать в виде
Э Е ( У ' | Х ' ) = F(x,b)(l - F(x,b))b,. |
(3.14) |
Максимальное значение первой составляющей, которая в дан ном выражении представлена произведением вероятностей, до стигается при F(x;b) = 0,5, т.е. когда имеет место самый высо кий уровень неопределенности.
Вторая составляющая менее интересна для анализа. Она рав на постоянной величине и в основном играет роль мультиплика тора, усиливающего или снижающего вклад первой в предельную производительность. Геометрически (см. рис. 3.1) при увеличе нии xik на единицу коэффициент Ьк определяет ширину прямо угольника с высотой f(x(.b), на величину площади которого изме няется вероятность бинарного выбора в условиях, описываемых вектором х(.
Так как события бинарного выбора несовместны, то при рас смотрении результатов предельного анализа нужно помнить, что увеличение вероятности возможного появления одного из событий влечет за собой уменьшение на ту же самую величину вероятно сти возможного возникновения альтернативного события. Поэтому если из двух вероятностей увеличивается при изменении xjk та, которая имеет большее значение, то неопределенность выбора снижается; если та, которая имеет меньшее значение, то неопре деленность выбора увеличивается.
Переходя к интерпретации результатов моделирования эксперт ных предпочтений, прежде всего попытаемся понять смысл рас
четных значений |
|
&=F(x,.b)- |
(3.15) |
С одной стороны, это вероятность возможного появления собы тия, состоящего в том, что yj примет значение, равное 1, а с другой — это характеристика оставшейся в предпочтениях эксперта неопределенности. Действительно, с ее помощью можно вычис лить энтропию
Я, =-F(x,.b)log2F(x,.b)-(l-F(x1.b))log2(l-F(x,6)). ( з л 6 )
которая характеризует уровень неопределенности бинарного выбо ра, сохраняемый в точке х,- после экспертного опроса.
64
Предельная производительность фактора, изменяя вероятность выбора, естественно, изменяет и энтропию ситуации, в которой осуществляется выбор. Причем, как упоминалось выше, рост вероятности в одних случаях снижает энтропию, а в других при водит к ее увеличению. Фактически это означает, что для экспер та более важной является информация о ситуации, в которой он будет принимать решение, а не информация о возможном изме нении ситуации.
Ситуацию с максимальной энтропией можно понимать как равновесную, смысл которой в том, что эксперт не располагает информацией, позволяющей одну альтернативу предпочесть дру гой. Естественно, что именно в этой ситуации любая информа ция, позволяющая изменить степень предпочтения эксперта, це нится дороже, чем та же самая информация, но в условиях, когда уже сформированы убедительные предпочтения.
На основе результатов анализа предельных производительностей легко выстраивается процедура ранжирования факторов по степени их влияния на вероятность появления интересующего нас события (на изменение уровня неопределенности). В основе про цедуры лежит простое соображение. Так как первая составляющая (плотность вероятности) одинакова для всех факторов, то поря док значимости факторов следует определять по абсолютной вели чине коэффициентов бинарной регрессии. Если вспомнить, что в случае линейной модели ранжирование факторов по величине соответствующих коэффициентов регрессии некорректно, то вы вод следует признать неожиданным.
Таким образом, предельный анализ модели экспертных пред почтений позволяет оценить влияние факторов на уровень неопре деленности в каждой ситуации бинарного выбора, а также упо рядочить все факторы по степени их влияния на выбор в любой из рассмотренных ситуаций.
3.2. Методы оценивания моделей бинарного выбора
3.2.1. Метод максимального |
правдоподобия |
Построение регрессионных моделей с использованием нелинейных зависимостей подобного типа практически исключа ет применение метода наименьших квадратов. Для оценивания моделей бинарного выбора обычно используется метод максималь ного правдоподобия [2]. Применение этого метода осуществляется
65
в предположении, что каждое наблюдение может трактоваться как однократный выбор из распределения Бернулли. Таким образом, модель с вероятностью успеха F(x/b) и независимыми наблюдени ями (эксперты опрашиваются независимо друг от друга) представ ляет собой вероятность совместного появления всей совокупнос ти ожидаемых событий:
Wx=yx,Y2=y2, |
... Y„=yn)= n F ( x , b ) n ( l - F ( x ; b ) . (3.17) |
Для каждого вектора у, представляющего собой результаты конкретного экспертного опроса, величина вероятности зависит от вектора оцениваемых параметров b и может быть записана как функция правдоподобия
L(y,b) = nF(x,.b)v '[l-F(x,b)]1 -v '. |
(3.18) |
В данной форме записи множители произведения селектиру ются с помощью компонент вектора у, принимающих всего два значения: 0 или 1.
Удобнее и математически проще максимизировать логарифми ческую функцию правдоподобия:
lnL = E[y,lnF(x,b) +(l-3>/)ln(l-F(x,.b))]. (3.19)
Используя сокращенные записи F; = F(x(b) и F£(x.b) = f-> вы пишем для логарифмической функции правдоподобия условия максимизации первого порядка:
a i n _ L = « v f |
- f |
х', = 0 . |
(3.20) |
|
(l-F,) |
Подставляя в полученное выражение логистическое распределе ние, имеем после очевидных преобразований следующую систему уравнений:
Х(х-Л,)х,=0. (3.21)
/=1
В случае нормального распределения система уравнений име ет вид
cHnL |
=1 |
М + ( 1 _Л ) _^_ х ' = 0 . |
(3.22) |
|
эь |
|
Ф; |
(1-Ф,) |
|
66
Введение в рассмотрение переменной qt = 2у. |
1 позволяет |
переписать эту систему следующим образом: |
|
<7,0(tf,x,b) х ' = 0 . |
(3.23) |
Ф(?,х,Ь) |
|
Полученные системы уравнений нелинейны, и для их решения необходимо применять численные методы. Прежде чем приступить к численному решению, следует убедиться в том, что итерацион ная процедура обеспечивает получение глобального максимума логарифмической функции правдоподобия. Для этого покажем, что данная функция является строго вогнутой, т.е. имеет един ственный максимум.
Чтобы убедиться в этом, достаточно показать, что lnF(x) и 1п( 1—F(x)) являются строго вогнутыми. В силу того, что сумма строго вогнутых функций есть строго вогнутая функция, следует, что и логарифмическая функция правдоподобия строго вогнута.
Основным признаком строгой вогнутости является отрицатель ность второй производной. Сначала покажем, что этим свойством обладает lnF(x). Последовательно дифференцируя, получаем
d(lnF(x)) _ 1 |
dF(x) _ |
f(x). |
(3.24) |
||
|
dx |
F(x) |
dx |
F(x) |
|
|
|
||||
d2(lnF(x)) |
d |
( f(x) Л |
f'(x)F(x)-F'(x)f(x) |
(3.25) |
|
dx |
dx |
F(x) |
|
F2(x) |
|
|
|
В соответствии с полученными выражениями для логистичес кой функции имеем
|
d(lnF(x)) |
|
|
e |
|
|
(3.26) |
|
dx |
|
|
(1 + е~х)2 |
1 + е~ |
||
|
|
|
|
||||
Пх) = |
< е~* |
е'х(1 + е-хГ -2(1 + е-х)(-е~х)е- |
|
||||
х\2 |
|
|
|
х |
4 |
|
|
|
а+е~ ) |
|
|
а + е~ ) |
|
|
|
|
|
-е |
-х |
. -2х |
|
|
|
|
|
|
+е |
|
|
(3.27) |
|
|
|
(\ + е~х)3 |
|
|
|||
|
|
|
|
|
67
|
-е х +е 2х |
1 |
(1 + е-у |
d2(lnF(A-)) |
(l + O 3 |
1 + е" |
|
dx2 |
_ |
1 |
~(1 + <Г*)Т <0. (3-28) |
|
|
(l + O 2 |
|
Строгая вогнутость lnF(x) доказана. Так как (1—F(x)) в случае логистической функции симметрична F(x), то она тоже строго вогнута. Следовательно, логарифмическая функция правдоподо бия, представляющая собой сумму строго вогнутых функций, сама является строго вогнутой, и применение градиентной про цедуры приводит к получению единственного решения.
В случае, когда F(x) есть функция нормального распределе ния, результат тот же самый — логарифмическая функция прав доподобия строго вогнута. Таким образом, численное решение системы (3.21) или (3.23) приводит к получению оценок, макси мизирующих соответствующие функции правдоподобия.
3-2.2. Численное решение с помощью метода Ньютона — Рафсона
Рассмотрим построенную на основе метода Ньютона
— Рафсона вычислительную схему решения нелинейной системы уравнений
Э]пЦЬ)
эь
Все детали этой схемы будут изложены без уточнения, на осно ве какого распределения была построена функция правдоподобия.
Считая левую часть системы (3.29) дифференцируемой векторфункцией (для исследуемых здесь распределений это действительно так), запишем отрезок ряда Тейлора, являющегося линейной
аппроксимацией этой функции в окрестности некоторой точки Ь0: |
|||
ainL(b) |
ainL(b) a2inL(b),. |
. ч |
|
-эьГ |
= ~^ьГ+^МьГ( |
о)" |
(130) |
Производная по Ь0 обозначает производную по Ь, вычислен ную в точке Ь0. Саму точку Ь0 будем считать начальным прибли жением искомой оценки. Ее значение можно определить как век
тор параметров линейной регрессии |
|
у = ХЬ + £, |
(3.31) |
оцененных с помощью метода наименьших квадратов, т.е.
68
b 0 = ( X ' X ) ~ ' X y . |
(3.32) |
Обозначив произвольную точку окрестности через Ь| и помня, что нашей целью является нахождение такого вектора параметров, кото рый обращает первую производную в ноль, целесообразно записать
Э1пЦЬ) Э21пЦЬ)] |
<133) |
0= -эьГ + - э м ь Г ( Ь , - Ь о ) - |
Раскрывая круглые скобки и перенося влево член, содержащий Ь,, а затем, умножая обе части уравнения на обратную матрицу, получаем выражение, задающее итерационный процесс нахожде ния искомого решения:
ь'=ь«-Ьмьг! - » г - |
<334) |
Вектор Ь, является первой оценкой искомых параметров. Вы числяя значения производных во вновь получаемых точках и про должая итерационный процесс по рекуррентной формуле
[Э21пЦЬА,)1"'Э1пЦЬ,) |
(3-35) |
ь ' + 1 = ь * - Г э ь э ь Н — э ^ - ' |
имеем последовательность {Ь^.}. Если предел этой последователь ности равен Ь, то он есть искомое решение системы, так как соотношение
К |
г к к [Э21пЬ(Ь)Г'Э1пЦЬ) |
|
Ь |
-ЙЕЬ '«-Ь -ЬЁН ~А- |
(зад |
имеет смысл при
Э1пЦЬ)^0 |
(3.37) |
|
эь |
||
|
Следовательно, полученное решение является также и оценкой максимального правдоподобия.
3.2.3. Итерационная схема обобщенного МНК (метод Берксона)
В некоторых ситуациях появляется возможность для оценки параметров логит- и пробит-моделей применять метод наи меньших квадратов [16]. Подобная ситуация возникает в случае
69