Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

В. Давнис Прогнозные модели экспертных предпочтений

.pdf
Скачиваний:
217
Добавлен:
14.08.2013
Размер:
3.39 Mб
Скачать

От первого подхода сразу нужно отказаться, Дело в том, что псевдовыборка, сформированная с ориентиром на согласованное мнение экспертов, не всегда гарантирует построение адекватной модели. Это бывает в том случае, когда согласованными оказа­ лись мнения некомпетентных экспертов. Подобная ситуация не возникает в задачах прямого экспертного оценивания. В них ком­ петентность оценивается либо экзогенно, и тогда она не связана с результатами опроса, либо в зависимости от того, насколько соответствующее индивидуальное мнение похоже на групповое.

Второй подход представляет собой авторское решение задачи, в рамках которой проверяется согласованность экспертных сужде­ ний. Как и в случае прямого экспертного оценивания, в пред­ лагаемом подходе предусматриваются проверка согласованности мнений двух экспертов и проверка согласованности мнений всей группы экспертов, принявших участие в экспертизе. Обе провер­ ки основаны на одной и той же идее. Смысл этой идеи в том, что эксперты с близкими мнениями распределяют свои предпоч­ тения по выборочной совокупности так, что полученные псевдо­ выборки обеспечивают построение почти идентичных моделей. Таким образом, проверка согласованности сводится к статистичес­ кой проверке значимости уровня идентичности. Выполнить такую проверку можно несколькими способами.

На наш взгляд, наиболее приемлемым следует считать способ, который позволяет не только оценить статистическую значимость, но и получить содержательно интерпретируемую величину, харак­ теризующую уровень идентичности моделей и, следовательно, уровень согласованности экспертов. В качестве такой величины удобно использовать коэффициент Юла, который измеряет тесноту связи между двумя дихотомическими переменными.

Формально с помощью этого коэффициента мы можем оценить тесноту связи между предикторными возможностями двух моделей бинарного выбора. Для этого заполняется таблица сопряженнос­ ти 2 х 2 следующего вида:

Модель 1-го эксперта

Коды

1

0

1

а

в

0

с

d

Правило заполнения таблицы сопряженности довольно про­ стое. В верхней левой клеточке стоит число случаев, когда пред-

60

сказания по обеим моделям совпадали и были равны 1, в ниж­ ней правой — число случаев, когда обе модели предсказали 0. В остальных клеточках стоит число несовпадающих предсказаний. Коэффициент Юла рассчитывается по формуле

ad-be

,, g.

ad + be

При полном совпадении предсказанных значений qn 1, и мы наблюдаем случай, когда мнения экспертов идентичны; при qn = —\ мнения экспертов противоположны, а при qn = 0 — независимы. Чем ближе значение коэффициента к 1, тем выше уровень согласованности экспертных мнений.

Для проверки групповой согласованности нет подходящего из­ мерителя. Но можно предложить следующую двухэтапную проце­ дуру. На первом этапе для каждой пары экспертов вычисляется коэффициент сопряженности Юла, и все эксперты делятся на две группы. В первую группу включаются только те эксперты, по моделям которых предсказанные значения имеют положительную связь между собой. Из коэффициентов сопряженности этой груп­ пы формируется матрица

 

Яи Яи

Яш

Q =

Яп

Ягт

 

 

Матрица Q обладает всеми свойствами, необходимыми для того, чтобы с помощью обычной итерационной процедуры вычис­ лить максимальное собственное значение Я, которое является дей­ ствительным числом. Тогда в качестве меры, определяющей уро­ вень согласованности экспертов, можно использовать величину

L = ^ -

= — ,

(3.10)

trQ-1

m-1

 

в знаменателе которой стоит след матрицы без единицы.

Так, определенный коэффициент согласованности будем назы­ вать характеристическим. Он равен 1, когда между всеми экспер­ тами группы наблюдается абсолютное согласие, и равен 0, если результаты экспертного опроса статистически независимы.

С отбракованной на первом этапе группой экспертов поступа­ ют точно так же.

61

Окончательно групповая оценка строится только для группы экспертов, имеющих согласованные мнения. Для этого все псев­ довыборки объединяются в одну, по данным которой строится модель, отражающая групповое экспертное мнение. Ее и реко­ мендуется использовать в расчетах.

3.1.5. Предельный анализ моделей субъективных предпочтений

Предельный анализ факторов модели экспертных предпочтений проводится по схеме предельного анализа бинарной модели. Поэтому вначале изложим все детали предельного анализа бинарной модели, а затем обсудим интерпретацию этих результа­ тов для случая, когда моделируются экспертные предпочтения. Рассмотрение начнем с линейной модели.

В классической теории коэффициенты линейной регрессии интерпретируют как предельные коэффициенты абсолютного ро­ ста. Принято считать, что k-н коэффициент регрессии показы­ вает, насколько изменится зависимая переменная (моделируемый показатель), если к-я независимая переменная изменится на еди­ ницу при условии, что эта единица достаточно мала, а все ос­ тальные переменные неизменны. Естественно, при построении пробит- и логит-моделей возникает аналогичный вопрос.

Предельный анализ с использованием пробит- и логит-моделей в силу их нелинейного характера и вероятностной интерпретации результатов моделирования требует более сложных математических обоснований по сравнению с линейными моделями.

Рассмотрим общий случай модели бинарного выбора и запи­

шем для события yt- условное математическое ожидание

 

E(y,.|x,.) = lF(xi.b) + 0(l-F(x,b))-

(3-П)

Предельный эффект к-го фактора вычисляется в виде первой

производной

 

 

 

ЭЕ(у,.|х,.)

faF(x,.b)3(x,.b)

= f(x,.b)bt,

(3.12)

dxik

{ Э(х,Ь) dxik

 

 

где f() — функция плотности, связанная

с соответствующим

кумулятивным распределением F().

 

 

Полученный предельный эффект можно интерпретировать как величину, на которую изменяется вероятность выбора при изме­ нении фактора на единицу, т.е., по сути, как изменится неопре-

62

деленность ситуации бинарного выбора. Однако механизм форми­ рования этой величины не так прост, как в линейной модели, и представляет собой взаимодействие двух составляющих, каждая из которых имеет собственную интерпретацию.

Первая составляющая определяется плотностью распределения, которая в предельном эффекте является изменяемой характерис­ тикой, зависящей от х- Рассмотрим основные механизмы фор­ мирования этой составляющей и ее содержательную интерпрета­ цию. Прежде всего обратим внимание на то обстоятельство, что изменение к-й переменной, например в сторону увеличения ее значения, может привести как к увеличению, так и снижению плотности вероятности. Механизм реализации этих изменений начинает действовать с изменения значения линейной формы:

Zi = x,b = b0+ bxxn +••• + bkxik +••• + bmxim.

(3.13)

Изменение линейной формы зависит от величины и знака ко­ эффициента регрессии Ьк. В свою очередь, изменение плотнос­ ти вероятности зависит не только от величины, на которую из­ менилось значение линейной формы, но и от того, где это зна­ чение расположено на оси z- Если оно лежит в левой половине распределения, то увеличение z приводит к возрастанию плотно­ сти, если в правой — то к снижению. Это положение хорошо иллюстрирует рис. 3.1.

Рис. 3.1. Изменение плотности вероятности в зависимости от распо­ ложения значения линейной формы

Анализ предельной производительности факторов позволяет обнаружить, что максимально возможная производительность фактора достигается в тех точках, в которых плотность имеет наи­ большее значение. Интересно, что именно в этих точках ситуа­ ция бинарного выбора обладает самым высоким уровнем неопре­ деленности. Это становится совершенно очевидным для логит-

63

модели, если вспомнить о выражении для плотности и предель­ ную производительность ее А:-го фактора записать в виде

Э Е ( У ' | Х ' ) = F(x,b)(l - F(x,b))b,.

(3.14)

Максимальное значение первой составляющей, которая в дан­ ном выражении представлена произведением вероятностей, до­ стигается при F(x;b) = 0,5, т.е. когда имеет место самый высо­ кий уровень неопределенности.

Вторая составляющая менее интересна для анализа. Она рав­ на постоянной величине и в основном играет роль мультиплика­ тора, усиливающего или снижающего вклад первой в предельную производительность. Геометрически (см. рис. 3.1) при увеличе­ нии xik на единицу коэффициент Ьк определяет ширину прямо­ угольника с высотой f(x(.b), на величину площади которого изме­ няется вероятность бинарного выбора в условиях, описываемых вектором х(.

Так как события бинарного выбора несовместны, то при рас­ смотрении результатов предельного анализа нужно помнить, что увеличение вероятности возможного появления одного из событий влечет за собой уменьшение на ту же самую величину вероятно­ сти возможного возникновения альтернативного события. Поэтому если из двух вероятностей увеличивается при изменении xjk та, которая имеет большее значение, то неопределенность выбора снижается; если та, которая имеет меньшее значение, то неопре­ деленность выбора увеличивается.

Переходя к интерпретации результатов моделирования эксперт­ ных предпочтений, прежде всего попытаемся понять смысл рас­

четных значений

 

&=F(x,.b)-

(3.15)

С одной стороны, это вероятность возможного появления собы­ тия, состоящего в том, что yj примет значение, равное 1, а с другой — это характеристика оставшейся в предпочтениях эксперта неопределенности. Действительно, с ее помощью можно вычис­ лить энтропию

Я, =-F(x,.b)log2F(x,.b)-(l-F(x1.b))log2(l-F(x,6)). ( з л 6 )

которая характеризует уровень неопределенности бинарного выбо­ ра, сохраняемый в точке х,- после экспертного опроса.

64

Предельная производительность фактора, изменяя вероятность выбора, естественно, изменяет и энтропию ситуации, в которой осуществляется выбор. Причем, как упоминалось выше, рост вероятности в одних случаях снижает энтропию, а в других при­ водит к ее увеличению. Фактически это означает, что для экспер­ та более важной является информация о ситуации, в которой он будет принимать решение, а не информация о возможном изме­ нении ситуации.

Ситуацию с максимальной энтропией можно понимать как равновесную, смысл которой в том, что эксперт не располагает информацией, позволяющей одну альтернативу предпочесть дру­ гой. Естественно, что именно в этой ситуации любая информа­ ция, позволяющая изменить степень предпочтения эксперта, це­ нится дороже, чем та же самая информация, но в условиях, когда уже сформированы убедительные предпочтения.

На основе результатов анализа предельных производительностей легко выстраивается процедура ранжирования факторов по степени их влияния на вероятность появления интересующего нас события (на изменение уровня неопределенности). В основе про­ цедуры лежит простое соображение. Так как первая составляющая (плотность вероятности) одинакова для всех факторов, то поря­ док значимости факторов следует определять по абсолютной вели­ чине коэффициентов бинарной регрессии. Если вспомнить, что в случае линейной модели ранжирование факторов по величине соответствующих коэффициентов регрессии некорректно, то вы­ вод следует признать неожиданным.

Таким образом, предельный анализ модели экспертных пред­ почтений позволяет оценить влияние факторов на уровень неопре­ деленности в каждой ситуации бинарного выбора, а также упо­ рядочить все факторы по степени их влияния на выбор в любой из рассмотренных ситуаций.

3.2. Методы оценивания моделей бинарного выбора

3.2.1. Метод максимального

правдоподобия

Построение регрессионных моделей с использованием нелинейных зависимостей подобного типа практически исключа­ ет применение метода наименьших квадратов. Для оценивания моделей бинарного выбора обычно используется метод максималь­ ного правдоподобия [2]. Применение этого метода осуществляется

65

в предположении, что каждое наблюдение может трактоваться как однократный выбор из распределения Бернулли. Таким образом, модель с вероятностью успеха F(x/b) и независимыми наблюдени­ ями (эксперты опрашиваются независимо друг от друга) представ­ ляет собой вероятность совместного появления всей совокупнос­ ти ожидаемых событий:

Wx=yx,Y2=y2,

... Y„=yn)= n F ( x , b ) n ( l - F ( x ; b ) . (3.17)

Для каждого вектора у, представляющего собой результаты конкретного экспертного опроса, величина вероятности зависит от вектора оцениваемых параметров b и может быть записана как функция правдоподобия

L(y,b) = nF(x,.b)v '[l-F(x,b)]1 -v '.

(3.18)

В данной форме записи множители произведения селектиру­ ются с помощью компонент вектора у, принимающих всего два значения: 0 или 1.

Удобнее и математически проще максимизировать логарифми­ ческую функцию правдоподобия:

lnL = E[y,lnF(x,b) +(l-3>/)ln(l-F(x,.b))]. (3.19)

Используя сокращенные записи F; = F(x(b) и F£(x.b) = f-> вы­ пишем для логарифмической функции правдоподобия условия максимизации первого порядка:

a i n _ L = « v f

- f

х', = 0 .

(3.20)

 

(l-F,)

Подставляя в полученное выражение логистическое распределе­ ние, имеем после очевидных преобразований следующую систему уравнений:

Х(х-Л,)х,=0. (3.21)

/=1

В случае нормального распределения система уравнений име­ ет вид

cHnL

=1

М + ( 1 _Л ) _^_ х ' = 0 .

(3.22)

эь

 

Ф;

(1-Ф,)

 

66

Введение в рассмотрение переменной qt = 2у.

1 позволяет

переписать эту систему следующим образом:

 

<7,0(tf,x,b) х ' = 0 .

(3.23)

Ф(?,х,Ь)

 

Полученные системы уравнений нелинейны, и для их решения необходимо применять численные методы. Прежде чем приступить к численному решению, следует убедиться в том, что итерацион­ ная процедура обеспечивает получение глобального максимума логарифмической функции правдоподобия. Для этого покажем, что данная функция является строго вогнутой, т.е. имеет един­ ственный максимум.

Чтобы убедиться в этом, достаточно показать, что lnF(x) и 1п( 1—F(x)) являются строго вогнутыми. В силу того, что сумма строго вогнутых функций есть строго вогнутая функция, следует, что и логарифмическая функция правдоподобия строго вогнута.

Основным признаком строгой вогнутости является отрицатель­ ность второй производной. Сначала покажем, что этим свойством обладает lnF(x). Последовательно дифференцируя, получаем

d(lnF(x)) _ 1

dF(x) _

f(x).

(3.24)

 

dx

F(x)

dx

F(x)

 

 

d2(lnF(x))

d

( f(x) Л

f'(x)F(x)-F'(x)f(x)

(3.25)

dx

dx

F(x)

 

F2(x)

 

 

В соответствии с полученными выражениями для логистичес­ кой функции имеем

 

d(lnF(x))

 

 

e

 

 

(3.26)

 

dx

 

 

(1 + е~х)2

1 + е~

 

 

 

 

Пх) =

< е~*

е'х(1 + е-хГ -2(1 + е-х)(-е~х)е-

 

х\2

 

 

 

х

4

 

 

а+е~ )

 

 

а + е~ )

 

 

 

 

. -2х

 

 

 

 

 

 

 

 

(3.27)

 

 

(\ + е~х)3

 

 

 

 

 

 

 

67

 

х

1

(1 + е-у

d2(lnF(A-))

(l + O 3

1 + е"

dx2

_

1

~(1 + <Г*)Т <0. (3-28)

 

 

(l + O 2

 

Строгая вогнутость lnF(x) доказана. Так как (1—F(x)) в случае логистической функции симметрична F(x), то она тоже строго вогнута. Следовательно, логарифмическая функция правдоподо­ бия, представляющая собой сумму строго вогнутых функций, сама является строго вогнутой, и применение градиентной про­ цедуры приводит к получению единственного решения.

В случае, когда F(x) есть функция нормального распределе­ ния, результат тот же самый — логарифмическая функция прав­ доподобия строго вогнута. Таким образом, численное решение системы (3.21) или (3.23) приводит к получению оценок, макси­ мизирующих соответствующие функции правдоподобия.

3-2.2. Численное решение с помощью метода Ньютона Рафсона

Рассмотрим построенную на основе метода Ньютона

— Рафсона вычислительную схему решения нелинейной системы уравнений

Э]пЦЬ)

эь

Все детали этой схемы будут изложены без уточнения, на осно­ ве какого распределения была построена функция правдоподобия.

Считая левую часть системы (3.29) дифференцируемой векторфункцией (для исследуемых здесь распределений это действительно так), запишем отрезок ряда Тейлора, являющегося линейной

аппроксимацией этой функции в окрестности некоторой точки Ь0:

ainL(b)

ainL(b) a2inL(b),.

. ч

 

-эьГ

= ~^ьГ+^МьГ(

о)"

(130)

Производная по Ь0 обозначает производную по Ь, вычислен­ ную в точке Ь0. Саму точку Ь0 будем считать начальным прибли­ жением искомой оценки. Ее значение можно определить как век­

тор параметров линейной регрессии

 

у = ХЬ + £,

(3.31)

оцененных с помощью метода наименьших квадратов, т.е.

68

b 0 = ( X ' X ) ~ ' X y .

(3.32)

Обозначив произвольную точку окрестности через Ь| и помня, что нашей целью является нахождение такого вектора параметров, кото­ рый обращает первую производную в ноль, целесообразно записать

Э1пЦЬ) Э21пЦЬ)]

<133)

0= -эьГ + - э м ь Г ( Ь , - Ь о ) -

Раскрывая круглые скобки и перенося влево член, содержащий Ь,, а затем, умножая обе части уравнения на обратную матрицу, получаем выражение, задающее итерационный процесс нахожде­ ния искомого решения:

ь'=ь«-Ьмьг! - » г -

<334)

Вектор Ь, является первой оценкой искомых параметров. Вы­ числяя значения производных во вновь получаемых точках и про­ должая итерационный процесс по рекуррентной формуле

21пЦЬА,)1"'Э1пЦЬ,)

(3-35)

ь ' + 1 = ь * - Г э ь э ь Н — э ^ - '

имеем последовательность {Ь^.}. Если предел этой последователь­ ности равен Ь, то он есть искомое решение системы, так как соотношение

К

г к к [Э21пЬ(Ь)Г'Э1пЦЬ)

 

Ь

-ЙЕЬ '«-Ь -ЬЁН ~А-

(зад

имеет смысл при

Э1пЦЬ)^0

(3.37)

эь

 

Следовательно, полученное решение является также и оценкой максимального правдоподобия.

3.2.3. Итерационная схема обобщенного МНК (метод Берксона)

В некоторых ситуациях появляется возможность для оценки параметров логит- и пробит-моделей применять метод наи­ меньших квадратов [16]. Подобная ситуация возникает в случае

69

Соседние файлы в предмете Анализ данных