Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

35589645

.pdf
Скачиваний:
22
Добавлен:
10.03.2016
Размер:
8.06 Mб
Скачать

РОССИЙСКАЯ КОРРУПЦИЯ: УРОВЕНЬ, СТРУКТУРА, ДИНАМИКА. ОПЫТ СОЦИОЛОГИЧЕСКОГО АНАЛИЗА

Для наглядности приведем регрессионные графики линейных связей между рейтингом Х и рейтингами Y и P.

Рис. 1.3.1. Линейные связи между разными типами рейтингов

Задача (b)

Выбор интервалов Au, 1≤ u ≤ 5, для конкретизации семейства распределений Fh(x | z) влияет на расчеты рейтинга. Однако характер этого влияния может быть существенным или нет. Для изучения устойчивости относительно

140

ГЛАВА 1. МЕТОДЫ ИССЛЕДОВАНИЯ

выбора интервалов, то есть степени варьирования рейтингов в зависимости от их выбора, было проведено случайное моделирование с шестью вариантами разбиения отрезка [0;1] на интервалы точками a1, a2, a3 и a4 (табл. 1.3.7).

Таблица 1.3.7. Варианты разбиения на интервалы Au = {x: аu–1 x< аu},

а0 = 0, а5 = 1

Вариант

a1

a2

a3

a4

 

 

 

 

 

1

0,15

0,30

0,70

0,85

 

 

 

 

 

2

0,10

0,30

0,70

0,90

 

 

 

 

 

3

0,10

0,35

0,65

0,90

 

 

 

 

 

4

0,15

0,35

0,65

0,85

 

 

 

 

 

5

0,15

0,40

0,60

0,85

 

 

 

 

 

6

0,20

0,40

0,60

0,80

 

 

 

 

 

Это моделирование проводилось для получения частотного распределения вариантов выбора ответа респондентами на вопрос. «Как бы вы оценили следующие органы власти, организации, социальные группы по степени их коррумпированности по шкале от «Честный» до «Бесчестный»?» Этот вопрос относился к 29 объектам, по каждому из которых допускался один из следующих ответов: «Весьма честный» — 1, «Довольно честный» — 2, «Довольно бесчестный» — 3, «Весьма бесчестный» — 4, «Затрудняюсь ответить» — 5.

Для конкретности приведем результаты, когда условные вероятности попа-

дания рейтинговых оценок в интервалы при фиксированном ответе определялось таблицей 1.3.8.

Таблица 1.3.8. Вероятности распределения градационных оценок по интервалам

Варианты ответов

А1

А2

А3

А4

А5

 

 

 

 

 

 

Весьма честный

0

0

0

0,2

0,8

 

 

 

 

 

 

Довольно честный

0

0

0,2

0,6

0,2

 

 

 

 

 

 

Довольно бесчестный

0,2

0,6

0,2

0

0

 

 

 

 

 

 

Весьма бесчестный

0,8

0,2

0

0

0

 

 

 

 

 

 

Затрудняюсь ответить

0,05

0,3

0,3

0,3

0,05

 

 

 

 

 

 

Моделировались фактически ответы респондентов; мы как бы заново проводили «опрос». Было проведено 60 таких «опросов», и по результатам каждого из них были вычислены рейтинги всех 29 «объектов» для каждого из 6 вариантов разбиения на интервалы. В совокупности мы могли подвергнуть

141

РОССИЙСКАЯ КОРРУПЦИЯ: УРОВЕНЬ, СТРУКТУРА, ДИНАМИКА. ОПЫТ СОЦИОЛОГИЧЕСКОГО АНАЛИЗА

сравнению 60×29 = 2340 наборов из 6 рейтингов. При моделировании использовался как равновероятный выбор оценок респондентами (30 модельных «опросов»), так и выбор с вероятностями, совпадающими с частотами из реального опроса населения (еще 30 модельных «опросов»). Оказалось, что среднеквадратичное отклонение (стандарт) по 6 вариантам разбиения на интервалы практически не превосходит 0.01 (всего 11 случаев дали значения

впределах 0.01–0.03. Несколько примеров из этой серии расчета приводится

втаблице 1.3.9.

Таблица 1.3.9. Примеры результатов моделирования

 

 

Варианты разбиения

 

 

Характеристики

 

 

 

 

 

 

 

 

1

2

3

4

5

6

среднее

стандарт

 

 

 

 

 

 

 

 

0,534

0,535

0,533

0,533

0,531

0,53

0,533

0,0017

 

 

 

 

 

 

 

 

0,396

0,395

0,398

0,399

0,402

0,404

0,399

0,0032

 

 

 

 

 

 

 

 

0,452

0,451

0,453

0,454

0,455

0,456

0,454

0,0018

 

 

 

 

 

 

 

 

0,437

0,436

0,44

0,441

0,445

0,447

0,441

0,0044

 

 

 

 

 

 

 

 

0,490

0,493

0,485

0,482

0,473

0,469

0,482

0,0094

 

 

 

 

 

 

 

 

Из всего этого комплекса исследований мы можем вывести вполне «приятный» для использования результат: весьма значительные различия в разбие-

нии шкалы рейтингов на интервалы Au = {x: аu–1 x< аu} из таблицы 1.3.7 край-

не слабо влияют на структуру рейтинговых оценок, так что аппроксимация

условных распределений рейтинговых оценок Fh(x| z) кусочно-равно-

мерными распределениями с фиксированным на все случаи жизни набо-

ром интервалов вполне оправдана.

Задача (с)

Задача устойчивости рейтинговой структуры оцениваемых объектов при колебаниях экспертных оценок для условных вероятностей попадания рейтинговых оценок в интервалы Au, 1≤ u≤ 5, при известной градационной оценке объекта представляется одной из самых важных. Для исследования в качестве примера мы рассмотрим тот же самый вопрос об оценке 29 объектов (органы власти, организации, социальные группы) по степени их коррумпированности, который рассматривался в предыдущем разделе. Достаточно широкое разнообразие экспертных оценок представлено в следующих 4-х вариантах из таблицы 1.3.10.

142

ГЛАВА 1. МЕТОДЫ ИССЛЕДОВАНИЯ

Таблица 1.3.10. Варианты экспертных оценок условных вероятностей. Цифры в заголовках столбцов соответствуют 5-ти вариантам ответов:

1. Весьма честный, 2. Довольно честный, 3. Довольно бесчестный, 4. Весьма бесчестный, 5. Затрудняюсь ответить.

 

 

 

V(1)

 

 

 

 

V(2)

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервал

1

2

3

4

5

1

2

3

4

5

 

 

 

 

 

 

 

 

 

 

 

0,85–1

0,8

0,2

0

0

0,05

0,9

0,1

0

0

0,05

 

 

 

 

 

 

 

 

 

 

 

0,65–0,85

0,2

0,6

0

0

0,3

0,1

0,7

0

0

0,3

 

 

 

 

 

 

 

 

 

 

 

0,35–0,65

0

0,2

0,2

0

0,3

0

0,2

0,2

0

0,3

 

 

 

 

 

 

 

 

 

 

 

0,15–0,35

0

0

0,6

0,2

0,3

0

0

0,7

0,1

0,3

 

 

 

 

 

 

 

 

 

 

 

0–0,15

0

0

0,2

0,8

0,05

0

0

0,1

0,9

0,05

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V(1)

 

 

 

 

V(2)

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервал

1

2

3

4

5

1

2

3

4

5

 

 

 

 

 

 

 

 

 

 

 

0,85–1

0,7

0,25

0

0

0,05

0,9

0,1

0

0

0,2

 

 

 

 

 

 

 

 

 

 

 

0,65–0,85

0,25

0,6

0

0

0,3

0,1

0,7

0

0

0,2

 

 

 

 

 

 

 

 

 

 

 

0,35–0,65

0,05

0,15

0,15

0,05

0,3

0

0,2

0,2

0

0,2

 

 

 

 

 

 

 

 

 

 

 

0,15–0,35

0

0

0,6

0,25

0,3

0

0

0,7

0,1

0,2

 

 

 

 

 

 

 

 

 

 

 

0–0,15

0

0

0,25

0,7

0,05

0

0

0,1

0,9

0,2

 

 

 

 

 

 

 

 

 

 

 

Рейтинги Х(m) были вычислены для всех этих 4-х вариантов условных веро-

ятностей при одном и том же разбиении шкалы индекса на 5 интервалов. Несмотря на значительные колебания вероятностей (сравните V(2) и V(4) в таблице 1.3.10 и взгляните на те же столбцы в таблице 1.3.11), результаты оказываются практически совпадающими: относительные различия лежат в окрестности 1%. Из общего распределения выпадает всего одно значение (строка 25), где отклонение 0,271 от 0,263 превышает 3%.

На рисунке 1.3.2 приведено поле рассеяния 29 точек, рассчитанное по 4-м последним столбцам таблицы 1.3.11, причем ординатами являются относительные величины

y(x) = max(V(1);V(2);V(3);V(4)) – min(V(1);V(2);V(3);V(4)) , min(V(1);V(2);V(3);V(4))

а абсциссами — величины х = min(V(1);V(2);V(3);V(4)). Как уже было замечено выше, из общей закономерности выпадает лишь точка, соответствующая 25-му «объекту», тогда как все остальные образуют весьма «правильное» облако рассеяния.

143

РОССИЙСКАЯ КОРРУПЦИЯ: УРОВЕНЬ, СТРУКТУРА, ДИНАМИКА. ОПЫТ СОЦИОЛОГИЧЕСКОГО АНАЛИЗА

Рис. 1.3.2. Визуальное представление вариабельности экспертных оценок для 29 объектов: ось Х — минимальный рейтинг из 4-х, а ось Y — размах по отношению к минимальному

Таблица 1.3.11. Частоты разных ответов по объектам и рейтинги объектов, подсчитанные для 4-х вариантов экспертных оценок вероятностей

Номер

 

Номера вариантов ответа

 

 

Варианты экспертиз

 

 

 

 

 

 

 

 

 

 

 

объекта

1

2

3

4

5

V(1)

V(2)

V(3)

 

V(4)

 

 

 

 

 

 

 

 

 

 

 

1

185

720

436

155

508

0,546

0,549

0,543

 

0,543

 

 

 

 

 

 

 

 

 

 

 

2

95

497

636

283

492

0,438

0,439

0,437

 

0,437

 

 

 

 

 

 

 

 

 

 

 

3

354

691

335

136

488

0,599

0,6

0,598

 

0,598

 

 

 

 

 

 

 

 

 

 

 

4

149

595

475

263

504

0,49

0,494

0,488

 

0,488

 

 

 

 

 

 

 

 

 

 

 

5

67

447

661

319

488

0,412

0,414

0,411

 

0,411

 

 

 

 

 

 

 

 

 

 

 

6

70

418

722

356

435

0,392

0,394

0,393

 

0,393

 

 

 

 

 

 

 

 

 

 

 

7

25

148

780

555

494

0,291

0,293

0,292

 

0,292

 

 

 

 

 

 

 

 

 

 

 

8

33

244

754

555

411

0,309

0,312

0,309

 

0,309

 

 

 

 

 

 

 

 

 

 

 

9

53

310

627

376

618

0,381

0,383

0,381

 

0,381

 

 

 

 

 

 

 

 

 

 

 

10

78

469

696

395

364

0,396

0,399

0,395

 

0,395

 

 

 

 

 

 

 

 

 

 

 

11

62

451

655

365

466

0,402

0,405

0,401

 

0,401

 

 

 

 

 

 

 

 

 

 

 

12

143

562

528

335

441

0,461

0,465

0,459

 

0,459

 

 

 

 

 

 

 

 

 

 

 

13

141

574

490

256

543

0,485

0,488

0,483

 

0,483

 

 

 

 

 

 

 

 

 

 

 

144

ГЛАВА 1. МЕТОДЫ ИССЛЕДОВАНИЯ

Таблица 1.3.11. Продолжение

14

88

423

711

346

436

0,401

0,402

0,402

0,402

 

 

 

 

 

 

 

 

 

 

15

64

293

787

573

288

0,315

0,318

0,315

0,315

 

 

 

 

 

 

 

 

 

 

16

168

674

361

198

599

0,536

0,541

0,533

0,533

 

 

 

 

 

 

 

 

 

 

17

86

568

676

324

350

0,431

0,433

0,429

0,429

 

 

 

 

 

 

 

 

 

 

18

45

374

798

414

367

0,357

0,358

0,357

0,357

 

 

 

 

 

 

 

 

 

 

19

120

741

558

163

408

0,516

0,519

0,513

0,513

 

 

 

 

 

 

 

 

 

 

20

172

699

468

219

442

0,521

0,525

0,518

0,518

 

 

 

 

 

 

 

 

 

 

21

338

832

231

120

484

0,633

0,636

0,629

0,629

 

 

 

 

 

 

 

 

 

 

22

216

663

457

184

471

0,536

0,538

0,534

0,534

 

 

 

 

 

 

 

 

 

 

23

376

830

245

91

453

0,647

0,649

0,644

0,644

 

 

 

 

 

 

 

 

 

 

24

82

424

791

413

295

0,374

0,375

0,374

0,374

 

 

 

 

 

 

 

 

 

 

25

47

197

715

760

285

0,265

0,271

0,263

0,263

 

 

 

 

 

 

 

 

 

 

26

297

912

378

130

288

0,612

0,616

0,608

0,608

 

 

 

 

 

 

 

 

 

 

27

134

509

732

285

343

0,435

0,435

0,435

0,435

 

 

 

 

 

 

 

 

 

 

28

150

757

596

203

296

0,51

0,513

0,508

0,508

 

 

 

 

 

 

 

 

 

 

29

150

748

485

204

416

0,524

0,528

0,521

0,521

 

 

 

 

 

 

 

 

 

 

Все эти результаты относились к усредненному определенным образом мнению экспертов. На рис. 1.3.3 приведен разброс в мнениях экспертов о

вероятностях (шансах) попадания рейтинговых оценок в тот или иной интер-

Рис. 1.3.3. Диаграмма рассеяния: по оси Х представлены средние оцифровки градаций по 8 экспертам, а по оси Y — среднеквадратичные отклонения по совокупности этих оцифровок

145

РОССИЙСКАЯ КОРРУПЦИЯ: УРОВЕНЬ, СТРУКТУРА, ДИНАМИКА. ОПЫТ СОЦИОЛОГИЧЕСКОГО АНАЛИЗА

вал из пяти заданных в таблице 1.3.10 интервалов. Оценки шансов проводились восемью экспертами для шести списков с вариантами ответа: в двух было по четыре оценочных градации с вариантом «Затрудняюсь ответить», в одном — пять оценочных градаций, и три списка состояли из трех оценочных градаций (все списки отличались друг от друга по типу оценок). По оси Х отложены средние значения оценок, а по оси ординат — стандартные отклонения. Мы видим, что оценки достаточно устойчивы, мало отличаются для крайних градаций и имеют несколько больший разброс для средних.

Из всей совокупности самых разных исследований вариабельности рейтингов в зависимости от выбора параметров нашей модели следует, что рекомен-

дуемый подход расчета рейтингов со стандартизированным семейством

моделей приводит к устойчивым и надежным результатам.

ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ РЕЙТИНГОВ И ИХ СРАВНЕНИЕ

В этом разделе мы приводим решение двух задач: (a) построение доверительных границ для «истинных» рейтингов при разной априорной информации о первичных результатах опроса и (b) проверка гипотезы о различии значений двух рейтингов.

Процедуры вычислений достаточно просты. Их можно представить в виде ряда этапов. Опишем их последовательно.

1. Все наши табличные вопросы, по которым вычисляется рейтинг, содержат

градации типа «согласен — не согласен», «лучше — хуже», «важно — не важно»

и тому подобное. Дополнительно может быть или не быть градация «Затрудняюсь ответить». Вместо всех этих градаций, имеющих разную содержательную интерпретацию, мы рассмотрим только следующие (как типы):

1.отлично — 5, хорошо — 4, посредственно — 3, плохо — 2, отвратительно — 1;

2.хорошо — 4, лучше, чем посредственно — 3, хуже, чем посредственно — 2, плохо — 1;

3.хорошо — 3, посредственно — 2, плохо — 1;

4.удовлетворительно — 2, неудовлетворительно — 1.

Это четыре типа градаций. Предполагается, что при каждом типе эти градации делят шкалу оценок на примерно равные «объемы качества» и что градация «Затрудняюсь ответить» (если таковая имеется) представляет симметричное распределение мнения на шкале с примерно равномерным распределением внутри межквартильного диапазона и с 5% на каждом краю.

2. Из наших многочисленных проб и экспертных разработок были созданы единообразные таблицы соответствия между градациями оценок и позициями на шкале рейтинга. Например, для типа 3 с добавкой «Затрудняюсь ответить» наша таблица имеет следующий вид:

146

ГЛАВА 1. МЕТОДЫ ИССЛЕДОВАНИЯ

Градация

Балл

0–0,15

0,15–0,35

0,35–0,65

0,65–0,85

0,85–1

 

 

 

 

 

 

 

Затрудняюсь ответить

0

0,05

0,3

0,3

0,3

0,05

 

 

 

 

 

 

 

Плохо

1

0,75

0,2

0,05

0

0

 

 

 

 

 

 

 

Посредственно

2

0,05

0,2

0,5

0,2

0,05

 

 

 

 

 

 

 

Хорошо

3

0

0

0,05

0,2

0,75

 

 

 

 

 

 

 

Другими словами, в строках даются вероятности интервалов (границы интервалов указаны в заголовках столбцов), в которых предположительно равномерно распределен рейтинг оцениваемого объекта, если респондент выбрал оценку из данной строки.

3. При оценке точности нам понадобятся данные из нижеследующей таблицы (чуть расширенный вариант таблицы 1.3.3):

Балл

Тип 1

Тип 2

Тип 3

Тип 4

 

 

 

 

 

0

0,5

0,5

0,5

0,5

 

 

 

 

 

1

0,10125

0,11

0,13125

0,1525

 

 

 

 

 

2

0,2825

0,265

0,5

0,8475

 

 

 

 

 

3

0,5

0,735

0,86875

 

 

 

 

 

 

4

0,7175

0,89

 

 

50,89875

Аименно, надо взять данные из столбца того типа градаций, который был в обрабатываемом вопросе. Пусть в вопросе имеется 0, 1, …, h баллов (h = 5 для типа 1, h= 4 для типа 2, h= 3 для типа 3 и h = 2 для типа 4), и пусть в соответ-

ствующем столбце стоят числа Q0, Q1, …, Qh. Теперь мы для любого одного объекта (из сравниваемых) определим числа N0, N1, …, Nh, где Nk — число респондентов, выставивших оценку «k».

Если обозначить N = N0 + N1 + … + Nh, то надо вычислить сначала число

h

Q2

N

h

Q

N

2

 

b =

m

m

 

 

m m

 

 

.

m=0

N

(m=0

 

N

)

 

Фактически написана формула для «сигмы» (корень из дисперсии) для случайной величины, принимающей значения Q0, Q1, …, Qh с вероятностями, определяемыми отношением чисел N0, N1, …, Nh к N. После этого доверительный полуинтервал для рейтинга Р этого объекта δР(α) уровня α приближенно равен

147

РОССИЙСКАЯ КОРРУПЦИЯ: УРОВЕНЬ, СТРУКТУРА, ДИНАМИКА. ОПЫТ СОЦИОЛОГИЧЕСКОГО АНАЛИЗА

 

b

–1

 

α

δР(α) =

N

· Φ

(1 –

2

).

4. Следует отметить, что у нас всегда1 b≤ 0,692, и при уровне значимости

α = 0,01 мы получим гарантированное неравенство δ (0,01) ≤ 1,783.

Р N

Аналогичные неравенства будут и при других α. Можно составить табличку:

Интервал

 

Значимость

 

 

 

 

 

 

точности

0,01

 

0,02

 

0,05

 

 

 

 

 

 

 

 

 

0,03

 

 

 

 

2954

 

 

 

 

 

 

0,04

2870

 

2341

 

1661

 

 

 

 

 

 

0,05

1837

 

1498

 

1063

 

 

 

 

 

 

0,06

1275

 

1040

 

738,4

 

 

 

 

 

 

0,07

937

 

764,3

 

542,5

 

 

 

 

 

 

0,08

717,4

 

585,2

 

415,4

 

 

 

 

 

 

0,09

566,8

 

462,3

 

328,2

 

 

 

 

 

 

0,1

459,1

 

374,5

 

265,8

 

 

 

 

 

 

В клетках таблицы стоят «критические» значения размера выборки: при размерах, бóльших указанного, точность (с указанным уровнем значимости) заведомо выше той, что стоит в первом столбце. По косвенным расчетам и некото-

рому опыту можно судить, что «истинная» точность в два и более раз лучше

этой оценки по грубому неравенству для b.

5. Теперь решим главную задачу (b): пусть два рейтинга модельно представ-

ляют величины Х(h)=Х (h)+

b(h)

·ξ(h), h=1 или 2, где ξ(1) и ξ(2) — гауссов-

 

0

N(h)

 

 

 

ские и независимые случайные величины с единичными дисперсиями и нулевыми средними. Будем считать, что Х(2) > Х(1) и что проверяется гипотеза

Х0(2) > Х0(1).

При нулевой гипотезе Х0(2) = Х0(1) мы получим, что

 

Х(2) – Х(1) =

b2(1)

+

b2(2)

· ξ,

(1)

N(1)

N(2)

 

 

 

 

где ξ — стандартная гауссовская величина. Следовательно, мы можем вычислить, какова при нулевой гипотезе вероятность получить расхождение между бόльшим и меньшим рейтингами на величину > 0:

1Можно дать более точную оценку b при известном h. Так, b не превосходит значений 0.27, 0.31, 0.5 и 0.52 для S = 2, 3, 4 и 5 соответственно.

148

ГЛАВА 1. МЕТОДЫ ИССЛЕДОВАНИЯ

P{Х(2) – Х(1) ≥ } = 1 – Φ(

 

), где b[N(1), N(2)] =

b2(1)

+

b2(2)

 

 

 

.

b[N(1), N(2)]

N(1)

N(2)

При заданном уровне значимости α граничное значение (α) для

 

вычис-

ляется по следующей формуле:

 

 

 

 

–1

b2(1) b2(2)

(α) = Φ (1 – α) ·

 

+

 

.

N(1)

N(2)

Для очень грубых оценок может оказаться полезным неравенство:

 

 

 

 

–1

1

 

 

1

 

 

 

 

(α) ≤

*(α | h) = f(h) · Φ (1 – α) ·

 

 

 

+

 

,

 

 

N(1)

N(2)

где f(h) берутся из таблички:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

2

3

 

4

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f(h)

 

0,27

0,3

 

0,5

 

 

0,52

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, если окажется, что K(α | h) =

|X(2) – X(1)|

– 1 > 0, то можно

 

 

 

 

 

 

 

*(α | h)

 

 

 

с уверенностью говорить, что рейтинги различаются, а вероятность ошибки этого вывода заведомо меньше α.

§ 1.4. ПОСТРОЕНИЕ СИНТЕТИЧЕСКИХ ТИПОЛОГИЙ

ПОСТАНОВКА ЗАДАЧИ

Построение латентных социологических переменных посредством экспер- тно-статистического метода является одним из новых подходов в анализе данных социологических опросов, используемым Фондом ИНДЕМ в проводимых им исследованиях. Этот метод развивался в Фонде с 1998 г., неоднократно использовался в исследованиях по политической социологии, а в 2001 г. был

149