Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ведение в социально - экономическую статистику. Учебник. Новосибирск, 2004. 739 с

.pdf
Скачиваний:
43
Добавлен:
22.08.2013
Размер:
4.02 Mб
Скачать

9.2. Модели с биномиальной зависимой переменной

303

 

 

Таблица 9.1

 

 

 

 

 

 

 

 

 

 

 

 

 

Предсказано

 

 

 

 

 

 

 

 

 

 

 

 

0

 

1

Сумма

 

 

 

 

 

 

 

 

 

 

На самом

0

×

 

×

×

 

 

деле

1

×

 

×

×

 

 

 

Сумма

×

 

×

×

 

Величину xci = zia можно назвать по аналогии с линейной регрессией расчетными значениями. При za > 0 для логита и пробита предсказанная вероятность единицы, F (za), превосходит 1 2, поэтому для такого наблюдения более вероятно наблюдать 1, чем 0. Таким образом, уравнение za = 0 задает ту гиперплоскость, которой разделяются две группы точек — те точки, для которых предсказано x = 0, и те точки, для которых предсказано x = 1. Поэтому наглядно о качестве модели можно судить по диаграмме xi по xci : чем лучше разделены две группы точек, тем более качественна модель. О качестве модели можно судить также по графику оценки E(x) по xc. Этот график в случае «хорошей» модели должен быть «крутым» в нуле.

На этих двух графиках (рис. 9.2) слева внизу и справа вверху расположены правильно предсказанные точки, а слева вверху и справа внизу — неправильно. То же самое можно представить таблицей 9.1.

Понятно, что «хорошая» модель должна давать высокий процент правильных предсказаний (в таблице они лежат на диагонали).

1

1

0

0

 

 

 

Хорошее качество модели

 

Плохое качество модели

Рис. 9.2

304

Глава 9. Целочисленные переменные в регрессии

9.3. Упражнения и задачи

Упражнение 1

1.1.Пусть ZG = {ziG1 ziG2} — фиктивная переменная, где ziG1 равно единице, если фактор в i -м наблюдении относится к годам войны (1941, . . . , 1945), и нулю

в противном случае. Как выглядит вектор zG

? Оцените двумя способами

 

X = + Z

0

 

0

˜G ˜

i2

 

модель

β

с помощью искусственно созданных

 

 

+ Z β + ε

данных из табл. 9.2, рассмотрев в качестве X столбец X1 :

а) исключив столбец z1G в исходной форме регрессии;

б) исключив в исходной форме регрессии параметр при переменной z1G .

Убедитесь, что значения коэффициентов исходной регрессии по способам а) и б) совпадают.

1.2.Запишите модель регрессии, в которой качественный фактор влияет не только на значение свободного члена регрессии, но и на коэффициент регрессии при факторе Z1.

Посчитайте матрицы

¯ ˜G

и

¯

0

¯G

] . Оцените данную модель ре-

Z1 Z

Z1 [Z

, Z

грессии на данных таблицы 9.2, рассмотрев в качестве X столбец X2 способами а) и б).

Упражнение 2

Самостоятельно подберите ряды наблюдений и охарактеризуйте цены на российском вторичном рынке жилья в зависимости от жилой и нежилой площади, площади кухни, местоположения квартиры по районам города, расположения на этажах, количество комнат, наличия телефона, балкона, лифта и т.д.

Упражнение 3

В таблице 9.3 приводится данные о голосовании по поводу увеличения налогов на содержание школ в городе Троя штата Мичиган в 1973 г. Наблюдения относятся к 95 индивидуумам: результаты голосования и различные характеристики индивидов.

Pub = 1, если хотя бы один ребенок посещает государственную школу, иначе 0,

Priv = 1, если хотя бы один ребенок посещает частную школу, иначе 0,

Years = срок проживания в данном районе,

Teach = 1, если работает учителем, иначе 0,

9.3. Упражнения и задачи

 

 

 

 

 

 

305

 

 

 

 

 

Таблица 9.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Годы

X1

X2

Z1

Z2

 

Годы

X1

X2

Z1

Z2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1935

2.81

2.81

117.10

9.70

 

1945

24.95

19.93

200.70

32.00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1936

10.66

10.66

201.60

10.40

 

1946

16.44

16.44

220.80

34.60

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1937

4.16

4.16

280.30

11.80

 

1947

15.04

15.04

165.60

45.60

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1938

8.30

8.30

204.00

15.60

 

1948

15.44

15.44

160.40

54.30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1939

16.94

16.94

225.60

17.20

 

1949

23.43

23.43

61.80

55.50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1940

5.01

5.01

213.20

18.60

 

1950

6.98

6.98

161.10

64.70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1941

35.49

30.90

183.40

22.10

 

1951

18.61

18.61

181.90

67.10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1942

26.76

22.79

158.80

28.80

 

1952

22.74

22.74

207.90

72.60

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1943

34.88

30.50

174.90

32.00

 

1953

24.63

24.63

237.10

80.00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1944

35.27

31.06

168.70

32.10

 

1954

31.35

31.35

275.90

88.90

 

 

 

 

 

 

 

 

 

 

 

 

 

 

LnInc = логарифм годового дохода семьи в долларах,

PropTax = логарифм налогов на имущество в долларах за год (заменяет плату за обучение — плата зависит от имущественного положения),

Yes = 1, если человек проголосовал на референдуме «за», 0, если «против».

Зависимая переменная — Yes. В модель включаются все перечисленные факторы, а также квадрат Years.

3.1.Получите приближенные оценки для логита и пробита с помощью линейной регрессии

3.2.Вычислите коэффициенты логита через коэффициенты пробита и сравните.

3.3.Для логита найдите маргинальные значения для Teach, LnInc и PropTax при среднем уровне факторов.

3.4.Постройте график вероятности голосования «за» в зависимости от Years при среднем уровне остальных факторов.

3.5.Постройте аналогичный график маргинального значения Years.

306

Глава 9. Целочисленные переменные в регрессии

Таблица 9.3. (Источник: R. Pindyck and D. Rubinfeld, Econometric Models and Economic Forecasts, 1998, Fourth Edition, Table 11.8, p. 332)

Номер

Pub

Priv

Years

Teach

LnInc

PropTax

Yes

 

 

 

 

 

 

 

 

1

1

0

10

1

9.77

7.0475

1

 

 

 

 

 

 

 

 

2

1

0

8

0

10.021

7.0475

0

 

 

 

 

 

 

 

 

3

1

0

4

0

10.021

7.0475

0

 

 

 

 

 

 

 

 

4

1

0

13

0

9.4335

6.3969

0

 

 

 

 

 

 

 

 

5

1

0

3

1

10.021

7.2792

1

 

 

 

 

 

 

 

 

6

1

0

5

0

10.463

7.0475

0

 

 

 

 

 

 

 

 

7

0

0

4

0

10.021

7.0475

0

 

 

 

 

 

 

 

 

8

1

0

5

0

10.021

7.2793

1

 

 

 

 

 

 

 

 

9

1

0

10

0

10.222

7.0475

0

 

 

 

 

 

 

 

 

10

1

0

5

0

9.4335

7.0475

1

 

 

 

 

 

 

 

 

11

1

0

3

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

12

1

0

30

0

9.77

6.3969

0

 

 

 

 

 

 

 

 

13

1

0

1

0

9.77

6.7452

1

 

 

 

 

 

 

 

 

14

1

0

3

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

15

1

0

3

0

10.82

6.7452

1

 

 

 

 

 

 

 

 

16

1

0

42

0

9.77

6.7452

1

 

 

 

 

 

 

 

 

17

1

0

5

1

10.222

7.0475

1

 

 

 

 

 

 

 

 

18

1

0

10

0

10.021

7.0475

0

 

 

 

 

 

 

 

 

19

1

0

4

0

10.222

7.0475

1

 

 

 

 

 

 

 

 

20

1

1

4

0

10.222

6.7452

1

 

 

 

 

 

 

 

 

21

1

0

11

1

10.463

7.0475

1

 

 

 

 

 

 

 

 

22

0

0

5

0

10.222

7.0475

1

 

 

 

 

 

 

 

 

23

1

0

35

0

9.77

6.7452

1

 

 

 

 

 

 

 

 

24

1

0

3

0

10.463

7.2793

1

 

 

 

 

 

 

 

 

25

1

0

16

0

10.021

6.7452

1

 

 

 

 

 

 

 

 

26

0

1

7

0

10.463

7.0475

0

 

 

 

 

 

 

 

 

27

1

0

5

1

9.77

6.7452

1

 

 

 

 

 

 

 

 

28

1

0

11

0

9.77

7.0475

0

 

 

 

 

 

 

 

 

29

1

0

3

0

9.77

6.7452

0

 

 

 

 

 

 

 

 

30

1

1

2

0

10.222

7.0475

1

 

 

 

 

 

 

 

 

31

1

0

2

0

10.021

6.7452

1

 

 

 

 

 

 

 

 

32

1

0

2

0

9.4335

6.7452

0

 

 

 

 

 

 

 

 

33

1

0

2

1

8.294

7.0475

0

 

 

 

 

 

 

 

 

34

0

1

4

0

10.463

7.0475

1

 

 

 

 

 

 

 

 

9.3. Упражнения и задачи

307

Таблица 9.3. (продолжение)

Номер

Pub

Priv

Years

Teach

LnInc

PropTax

Yes

 

 

 

 

 

 

 

 

35

1

0

2

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

36

1

0

3

0

10.222

7.2793

0

 

 

 

 

 

 

 

 

37

1

0

3

0

10.222

7.0475

1

 

 

 

 

 

 

 

 

38

1

0

2

0

10.222

7.4955

1

 

 

 

 

 

 

 

 

39

1

0

10

0

10.021

7.0475

0

 

 

 

 

 

 

 

 

40

1

0

2

0

10.222

7.0475

1

 

 

 

 

 

 

 

 

41

1

0

2

0

10.021

7.0475

0

 

 

 

 

 

 

 

 

42

1

0

3

0

10.82

7.4955

0

 

 

 

 

 

 

 

 

43

1

0

3

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

44

1

0

3

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

45

1

0

6

0

10.021

6.7452

1

 

 

 

 

 

 

 

 

46

1

0

2

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

47

1

0

26

0

9.77

6.7452

0

 

 

 

 

 

 

 

 

48

0

1

18

0

10.222

7.4955

0

 

 

 

 

 

 

 

 

49

0

0

4

0

9.77

6.7452

0

 

 

 

 

 

 

 

 

50

0

0

6

0

10.021

7.0475

0

 

 

 

 

 

 

 

 

51

0

0

12

0

10.021

6.7452

1

 

 

 

 

 

 

 

 

52

1

0

49

0

9.4335

6.7452

1

 

 

 

 

 

 

 

 

53

1

0

6

0

10.463

7.2793

1

 

 

 

 

 

 

 

 

54

0

1

18

0

9.77

7.0475

0

 

 

 

 

 

 

 

 

55

1

0

5

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

56

1

0

6

0

9.77

5.9915

1

 

 

 

 

 

 

 

 

57

1

0

20

0

9.4335

7.0475

0

 

 

 

 

 

 

 

 

58

1

0

1

1

9.77

6.3969

1

 

 

 

 

 

 

 

 

59

1

0

3

0

10.021

6.7452

1

 

 

 

 

 

 

 

 

60

1

0

5

0

10.463

7.0475

0

 

 

 

 

 

 

 

 

61

1

0

2

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

62

1

1

5

0

10.82

7.2793

0

 

 

 

 

 

 

 

 

63

1

0

18

0

9.4335

6.7452

0

 

 

 

 

 

 

 

 

64

1

0

20

1

9.77

5.9915

1

 

 

 

 

 

 

 

 

65

0

0

14

0

8.9227

6.3969

0

 

 

 

 

 

 

 

 

66

1

0

3

0

9.4335

7.4955

0

 

 

 

 

 

 

 

 

67

1

0

17

0

9.4335

6.7452

0

 

 

 

 

 

 

 

 

68

1

0

20

0

10.021

7.0475

0

 

 

 

 

 

 

 

 

308

Глава 9. Целочисленные переменные в регрессии

Таблица 9.3. (продолжение)

Номер

Pub

Priv

Years

Teach

LnInc

PropTax

Yes

 

 

 

 

 

 

 

 

69

1

1

3

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

70

1

0

2

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

71

0

0

5

0

10.222

7.0475

1

 

 

 

 

 

 

 

 

72

1

0

35

0

9.77

7.0475

1

 

 

 

 

 

 

 

 

73

1

0

10

0

10.021

7.2793

0

 

 

 

 

 

 

 

 

74

1

0

8

0

9.77

7.0475

1

 

 

 

 

 

 

 

 

75

1

0

12

0

9.77

7.0475

0

 

 

 

 

 

 

 

 

76

1

0

7

0

10.222

6.7452

1

 

 

 

 

 

 

 

 

77

1

0

3

0

10.463

6.7452

1

 

 

 

 

 

 

 

 

78

1

0

25

0

10.222

6.7452

0

 

 

 

 

 

 

 

 

79

1

0

5

1

9.77

6.7452

1

 

 

 

 

 

 

 

 

80

1

0

4

0

10.222

7.0475

1

 

 

 

 

 

 

 

 

81

1

0

2

0

10.021

7.2793

1

 

 

 

 

 

 

 

 

82

1

0

5

0

10.463

6.7452

1

 

 

 

 

 

 

 

 

83

1

0

3

0

9.77

7.0475

0

 

 

 

 

 

 

 

 

84

1

0

2

0

10.82

7.4955

1

 

 

 

 

 

 

 

 

85

0

1

6

0

8.9227

5.9915

0

 

 

 

 

 

 

 

 

86

1

1

3

0

9.77

7.0475

1

 

 

 

 

 

 

 

 

87

1

0

12

0

9.4335

6.3969

1

 

 

 

 

 

 

 

 

88

0

0

3

0

9.77

6.7452

1

 

 

 

 

 

 

 

 

89

1

0

3

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

90

0

0

3

0

10.021

6.7452

1

 

 

 

 

 

 

 

 

91

1

0

3

0

10.222

7.2793

1

 

 

 

 

 

 

 

 

92

1

0

3

1

10.021

7.0475

1

 

 

 

 

 

 

 

 

93

1

0

5

0

10.021

7.0475

1

 

 

 

 

 

 

 

 

94

0

0

35

1

8.9277

5.9915

1

 

 

 

 

 

 

 

 

95

1

0

3

0

10.463

7.4955

0

 

 

 

 

 

 

 

 

9.3. Упражнения и задачи

309

Задачи

1.Какие из перечисленных факторов учитываются в регрессии с помощью фиктивных переменных: а) профессия; б) курс доллара; в) численность населения; г) размер среднемесячных потребительских расходов?

2.В уравнение регрессии для доходов населения вводятся два качественных фактора: «пол» и «наличие судимости». Сколько фиктивных переменных (с учетом взаимодействия факторов) в исходной и преобразованной (после устранения линейных зависимостей) форме уравнения?

3.В уравнение регрессии для доходов населения вводятся три качественных

фактора: пол («муж.», «жен.»), образование («нач.», «сред.», «высш.») и место проживания («гор.», «сел.»). Сколько фиктивных переменных (с учетом всех взаимодействий факторов) в исходной и преобразованной (после устранения линейных зависимостей) форме уравнения? Как выглядят матри-

цы преобразований ¯ и ?

C C

4. Известно, что котировки многих ценных бумаг зависят от того, в какой день рабочей недели (понедельник, вторник, среда, . . . ) проходят торги. Как учесть эту зависимость при построении регрессионной модели котировок?

5. Предположим, что оценивается зависимость спроса на лыжи от располагаемого личного дохода, используя наблюдения по месяцам. Как ввести фиктивную переменную для оценивания сезонных колебаний? Запишите со-

ответствующие матрицы преобразований ¯ и для каждого фиктивного

C C

фактора.

6. Рассмотрим регрессионную модель xt = α1zt1 +α2zt2 +β0 +εt, t = 1, . . . , T . Пусть для наблюдений t = 1 и 2 параметры α1 , α2 и β0 отличаются от остальных ( T − 2) наблюдений. Запишите регрессионную модель с фиктивными переменными и опишите возникшие проблемы оценивания.

7.На основе данных о расходах на автомобили (X) и располагаемом личном доходе (Z) за период с 1963 по 1982 года получена модель: X = 0.77 + + 0.035Z − 4.7Z1G , где Z1F — фиктивная переменная, учитывающая нефтяной кризис 1974 года, равная 0 для периодов с 1963 по 1973 гг. и равной единице для периода с 1974 по 1982 гг.

а) Схематично нарисуйте график регрессионной функции и дайте полную интерпретацию.

б) Запишите модель, в которой качественный фактор zG не влияет на свободный член, но влияет на наклон линии регрессии. Схематично нарисуйте график регрессионной функции.

310

Глава 9. Целочисленные переменные в регрессии

8.Как меняется коэффициент детерминации при добавлении в регрессионную модель фиктивной объясняющей переменной?

9.На основе опроса населения США Current Population Survey за 1985 г. изучаются факторы, определяющие зарплату:

WAGE: зарплата (долларов за час) — изучаемая переменная, EDU: образование (лет),

SOUTH: индикаторная переменная для Юга (1 = человек живет на Юге, 0 = человек живет в другом месте),

SEX: индикаторная переменная для пола (1 = жен, 0 = муж), EXPER: стаж работы (лет),

UNION: индикаторная переменная для членства в профсоюзе (1 = член профсоюза, 0 = нет),

AGE: возраст (лет),

RACE: раса (1 = другое, 2 = «Hispanic», 3 = белый),

OCCUP: профессиональная категория ( 1 = другое, 2 = Management, 3 = Sales, 4 = Clerical, 5 = Service, 6 = Professional),

SECTOR: сектор экономики (0 = другое, 1 = промышленность, 2 = строительство),

MARR: семейное положение (0 = неженатый/незамужняя, 1 = женатый/замужняя).

а) Какие из перечисленных переменных можно назвать фиктивными? Объясните.

б) Объясните, в каком виде следует учитывать переменные RACE, OCCUP и SECTOR в регрессии.

в) Для каждого фиктивного фактора запишите соответствующую матрицу преобразований C.

г) Объясните, как будут выглядеть фиктивные переменные, соответствующие эффектам второго порядка для пола и расы.

10.Модель регрессии с биномиальной зависимой переменной можно представить в виде: (зависимая переменная) = (математическое ожидание) + (ошибка). Какие предположения классической линейной регрессии при этом будут нарушены?

9.3. Упражнения и задачи

311

11.Предположим, что с помощью обычного линейного МНК с биномиальной зависимой переменной были получены оценки a. Как на их основе получить приближенные оценки для модели пробит?

12.Логит-оценивание модели Pr(x = 1) = F () дало результат x = 5.89 + + 0.2z. Чему равна вероятность x = 1 при z = 50?

13. Пробит-оценивание модели Pr(x = 1) = F () дало результат x =

= 2.85 + 0.092z. Чему равна вероятность x = 1 при z = 50?

14.Логит-оценивание модели Pr(x = 1) = F () дало результат x = 5.89 + + 0.2z. Чему равно увеличение вероятности Pr (x = 1) при увеличении z на единицу, если z = 50?

15. Пробит-оценивание модели Pr(x = 1) = F () дало результат x = = 2.85 + 0.092z. Чему равно увеличение вероятности Pr (x = 1) при увеличении z на единицу, если z = 50?

16. Логит-модель применили к выборке, в которой x = 1, если производительность труда на предприятии выросла, и x = 0 в противном случае. z1 — доход предприятия в млн. руб. в год, z1G = 1 если предприятие относится к области высоких технологий ( z1G = 0 в противном случае). Получена следующая модель: x = 0.5 + 0.1z1 + 0.4z1G . Определите оценку вероятности роста производительности труда для высокотехнологичного предприятия с доходом 100 млн. руб. в год и для предприятия, не относящегося к сфере высоких технологий, с доходом 150 млн. руб. в год.

17.Имеется выборка, состоящая из 600 наблюдений, в которой x = 1, если работник состоит в профсоюзе, и x = 0 в противном случае. Предполагается, что членство в профсоюзе зависит от образования, лет ( z1 ), стажа работы, лет ( z2 ) и пола ( z3 ). Выборочные средние равны x¯ = 0.2, z¯1 = 14, z¯2 = 18 и z¯3 = 0.45. На основе выборочных данных получена следующая пробит-модель: x = 0.9 0.01z1 + 0.4z2 0.6z3 . Определить, насколько снижается вероятность быть членом профсоюза в расчете на год дополнительного образования.

18.Пусть переменная x, принимающая значения 0 или 1, зависит от одного фактора z. Модель включает также константу. Данные приведены в таблице:

x

0

0

1

1

0

1

0

1

0

1

 

 

 

 

 

 

 

 

 

 

 

z

1

2

3

4

5

6

7

8

9

10

 

 

 

 

 

 

 

 

 

 

 

312

Глава 9. Целочисленные переменные в регрессии

а) Получите приближенные оценки логита и пробита методом усреднения, разбив данные на две группы по 5 наблюдений. Каким будет процент правильных предсказаний по модели для этих данных?

б) Ответьте на вопросы предыдущего пункта для метода приближенного оценивания логита и пробита с помощью линейной регрессии.

в) Найдите маргинальное значение для фактора z в точке, соответствующей его среднему уровню.

19.Пусть переменная x, принимающая значения 0 или 1, зависит от фиктивной переменной z, принимающей значения 0 или 1. Модель включает также константу. Данные резюмируются следующей таблицей (в клетках стоят количества соответствующих наблюдений):

 

 

x = 0

x = 1

 

 

 

 

 

 

 

z = 0

N00

N01

 

 

 

 

 

 

 

z = 1

N10

N11

 

 

 

 

 

 

а) При каких условиях можно на

основе этих данных оценить логит

и пробит?

 

 

 

б) Получите приближенные оценки логита и пробита методом усреднения. Чему они будут равны при N00 = 15, N01 = 5, N10 = 5, N11 = 15? Каким будет процент правильных предсказаний по модели для этих данных?

в) Ответьте на вопросы предыдущего пункта для метода приближенного оценивания логита и пробита с помощью линейной регрессии.

Рекомендуемая литература

1.Айвазян С.А. Основы эконометрики. Т.2. — М.: «Юнити», 2001. (Гл. 2)

2.Доугерти К. Введение в эконометрику. — М.: «Инфра-М», 1997. (Гл. 9).

3.Дрейпер Н., Смит Г. Прикладной регрессионный анализ. В 2-х книгах. Кн. 2. — М.: «Финансы и статистика», 1986. (Гл. 9).

4.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: «Дело», 2000. (Гл. 4).

5.Маленво Э. Статистические методы эконометрии. — М.: «Статистика». Вып. 1, 1975. (Гл. 8).

Соседние файлы в предмете Политология