Добавил:

fench Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет

Предмет:

Политология

Файл:

Ведение в социально - экономическую статистику. Учебник. Новосибирск, 2004. 739 с

.pdf

Скачиваний:

Добавлен:

22.08.2013

Размер:

4.02 Mб

Скачать

☆

<<< < Предыдущая 50 51 52 53 54 55 56 57 58 59 60 6162 / 7462 63 64 65 66 67 68 69 70 71 72 73 74 > Следующая >>>

20.1. Дисперсионный анализ без повторений

613

лагается по эффектам всех возможных взаимодействий факторов (здесь и далее модели записываются в оценках параметров, т.е. β меняются на b):

	G
X =	ZJ bJ ,	(20.4)
	J =0
	G
X =	ZJ bJ ,	(20.5)

J=0

амодель в покомпонентном представлении (20.2) еще и без линейного внутригруппового индекса:

			G
			xI = b0 + bIJ(J ).		(20.6)
			J =1
Модель (20.5) можно переписать более компактно:
			X = Zb.		(20.7)
	Поскольку матрицы ZJ имеют размерности N K−J ( K−J =			J	(kj − 1),
K0	G	KJ	= K = N (как это было показано в п. 4.3), то матрица Z
K0	= 1), а	KJ	= K = N (как это было показано в п. 4.3), то матрица Z
−	J =0	−

квадратна, и b = Z−1X . Но для получения общих результатов, имеющих значение и для частных моделей, в которых эффекты высоких порядков принимаются за случайную ошибку, используется техника регрессионного анализа:

b= M −1m = ( N1 Z Z)−1 N1 Z X.

Вэтом параграфе сделанные утверждения будут иллюстрироваться примером,

вкотором n = 2, k1 = k2 = 2 и модели (20.4) и (20.5) записываются следующим образом:

x11		1	1	0			1	0			1	0	0	0	b1112
x12	=	1	1	0	b1	+	0	1	b2	+	0	1	0	0	b12	,
	=	b0 +			1	+			1	+					12	,
x21		1	0	1	b21		1	0	b22		0	0	1	0	b2112
x22		1	0	1			0	1			0	0	0	1	b2212

614				Глава 20. Дисперсионный анализ
x11		1	−1	−1	1
x12	=	1 b0 +	−1 b21 +	1 b22 +	−1 b2212.
x21		1	1	−1	−1
x22		1	1	1	1

Каждая из матриц ZJ является прямым произведением ряда матриц и векторов:

ZJ =		Ikj , если j J .

	G	1kj	, если j / J

В этом легко убедиться, рассуждая по индукции. Так, в рассматриваемом при-

мере:
Z0 =		1	1 , Z1 =		1	0	1 ,
		1		1	0	1	1
Z2 =	1	1		0 , Z12 =	1	0	1	0 .
	1		0	1	0	1	0	1

Матрицы CJ можно представить следующим образом:

CJ = Cj = Cj , если j J .

1, если j / J

Тогда, используя свойство коммутативности прямого и «обычного» умножения

матриц (см. п. 9.1), можно показать следующее:
ZJ = ZJ CJ =		Ikj , если j J	Cj , если j J				=

	G	1kj , если j / J	1, если j / J
		1kj , если j / J	1, если j / J
			=		Cj	, если j J		. (20.8)

				G	1kj	, если j / J
					1kj	, если j / J

20.1. Дисперсионный анализ без повторений											615
Теперь можно уточнить структуру матрицы M . Она состоит из блоков
						M J¯J =	1	ZJ¯ ZJ ,
						M J¯J =		ZJ¯ ZJ ,
							N
						¯
и все внедиагональные блоки (при J = J ), благодаря (20.8), равны 0.
Действительно,
	1				j	¯				j
M J¯J =	1		C			, если j J			C		, если j J
M J¯J =						, если j J					, если j J
		G	1			, если j / J¯			1		, если j / J
	N		1			, если j / J¯			1		, если j / J
				kj					kj
¯
и, если j J , / J , то в ряду прямых произведений матриц возникает матрица
(точнее, вектор-столбец) C			j	1kj		¯
(точнее, вектор-столбец) C				1kj		; если j / J , J , то появляется матрица (вектор-

строка)

1kj Cj . И та, и другая матрица (вектор-столбец или вектор-строка) по

= 0

= J .

построению матриц C

равны нулю. Следовательно, M

при J

Для диагональных блоков выполняются следующие соотношения:

M J J = M J =

Cj Cj =

Cj Cj = M j ,

N G−J

где M j

Cj Cj =

+ I

kj −1

kj kj −1 kj −1

В рассматриваемом примере M = I4 .

Вектор m состоит из блоков mJ :

mJ =

ZJ X =

CJ ZJ X =

CJ XJ ,

где XJ

ZJ X — вектор-столбец средних по сочетаниям значений факто-

ров J . Его компоненты в пункте 4.3 обозначались xI(J )

( xIJ(J )

— добавлен верх-

ний индекс J — является средним значением x по тем наблюдениям, в которых 1-й фактор из множества J находится на ij1 -м уровне, 2-й — на ij2 -м уровне и т.д.); X0 = x¯, XG = X . Это следует из структуры матрицы ZJ .

После решения системы нормальных уравнений

mJ = M J bJ , J = 1, . . . , G

и перехода к «полным» векторам параметров эффектов получается следующее:

bJ = CJ (CJ CJ )−1CJ XJ = BJ XJ = Bj XJ ,

где B

= C

)−

= Ikj −

( 1

= 1kj 1kj ), B

= 1.

616			Глава 20. Дисперсионный анализ
В рассматриваемом примере
				1	−1	−1	1
B0 = 1, B1 = B2 =	1	1	−1 , B12 =	−1	1	1	−1 .
B0 = 1, B1 = B2 =	2	−1	−1 , B12 =	−1			−1 .
	2	−1	1	−1	1	1	−1
				1	−1	−1	1

В силу блочной диагональности матрицы B, параметры разных эффектов bJ (разных по J ) не зависят друг от друга, и исключение из уравнения некоторых из них не повлияет на значения параметров оставшихся эффектов. Кроме того, это доказывает справедливость приведенного в пункте 4.3 дисперсионного тождества (4.41).

Действительно, воспользовавшись одной из формул (6.18) для объясненной дисперсии, которая в данном случае равна полной дисперсии, можно получить следующее:

G	G	1		G	1	G
s2 = bJ M J bJ =			bJ CJ CJ bJ =			bJ bJ = sJ2 ,
		KJ			KJ
J =1	J =1			J =1		J =1

т.е. то, что и требуется.

Введенное в пункте 4.3 рекуррентное правило расчета параметров эффектов, когда параметры более младших эффектов рассчитываются по значениям параметров более старших эффектов, действует, поскольку наряду с соотношениями (20.4) и (20.6) выполняются аналогичные соотношения для всех средних:

XJ =	¯ ¯					(20.9)
XJ =	ZJJ bJ ,					(20.9)
	¯
	0,J J
			¯			¯
где суммирование ведется от нуля и по всем подмножествам			J (J	J ), а	Z		—
матрица фиктивных переменных для сочетания факторов		¯	в модели, для которой
матрица фиктивных переменных для сочетания факторов		J	в модели, для которой

полным набором факторов является J , т.е.

ZJ¯J =			¯
ZJ¯J =		Ikj , если j J
			¯
	J	1kj , если j / J
		1kj , если j / J
		xJ	= b0	+
		I(J )

XG = X, ZJ G = ZJ ,

bJ( ¯). (20.10)

I J

J J

20.1. Дисперсионный анализ без повторений

617

Для доказательства этого факта обе части соотношения (20.5) умножаются

слева на

(текущим множеством в сумме становится J ):

G KJ

J¯ J¯

X =

b ,

(20.11)

J =0

ирассматривается произведение ZJ ZJ из правой части полученного соотношения, которое представляется следующим образом:

			Ikj , если j J			j		¯
			Ikj , если j J		C		,	если j J .	(20.12)
		G	1 ,	если j / J	1		,	если j / J¯
			1 ,	если j / J	1		,	если j / J¯
			kj		kj
Возможны четыре случая.
1)		J¯, тогда в этом произведении возникает сомножитель							kj
1)	j / J, j	J¯, тогда в этом произведении возникает сомножитель							1 Cj ,

который равен нулю, т.е. в правой части соотношения (20.11) остаются только

	¯
такие слагаемые, для которых J J .
2)	¯
2)	j / J, j / J , тогда возникает сомножитель kj , и, следовательно, каждое
слагаемое в правой части (20.11) получает сомножитель							N	, который сокраща-
слагаемое в правой части (20.11) получает сомножитель								, который сокраща-
		KJ					KJ
		KJ
ется с уже имеющимся сомножителем			.
ется с уже имеющимся сомножителем			.
	¯	N
3)	¯				j	.
3)	j J, j J , тогда возникает сомножитель C					.
4)	¯
4)	j J, j / J , тогда возникает сомножитель 1kj .						¯
Таким образом, рассматриваемое произведение в точности равно ZJ J . По-
скольку левая часть соотношения есть XJ				по определению, доказательство за-
вершено.

Соотношение (20.9) дает правило расчета bJ , если все параметры более старших эффектов известны. При J = 0 это соотношение означает

X0 = x¯ = b0.

Далее последовательно рассчитываются параметры все более младших эффектов.

Техника применения F -критерия для проверки степени значимости отдельных факторов и их сочетаний приведена в пункте 4.3. Здесь важно отметить, что она применима только в рамках гипотезы о нормальности распределения x.

618	Глава 20. Дисперсионный анализ

20.2. Дисперсионный анализ с повторениями

Переходя к более общему и более сложному случаю модели дисперсионного анализа с повторениями (20.1), полезно воспользоваться следующим подходом. Если в модели регрессионного анализа

X = Zα + ε

несколько строк матрицы Z одинаковы, то можно перейти к сокращенной модели, в которой из всех этих строк оставлена одна, а в качестве соответствующей компоненты вектора X взято среднее по этим наблюдениям с одинаковыми значениями независимых факторов. Это агрегированное наблюдение в соответствии

с требованием ОМНК должно быть взято с весом Ng , где Ng — количество одинаковых строк в исходной модели, поскольку, как известно, дисперсия средней ошибки в этом наблюдении в Ng раз меньше дисперсии исходных ошибок. Значения оценок параметров в исходной и сокращенной моделях будут одинаковыми, но полная и остаточная суммы квадратов в исходной модели будут больше, чем в сокращенной, на сумму квадратов отклонений переменных x по исключенным наблюдениям от своей средней.

При доказательстве этого утверждения считается, что одинаковы первые N1

строк в матрице Z:
x1	=	1N1 z1 a +	e1 .
X		Z	e

Система нормальных уравнений для оценки a записывается следующим образом:

z Z

1N1 z1 a

или, после умножения векторов и матриц,

z x

+ Z X = (1

z 1

x1=1

z + Z Z)a

N z

x¯

+ Z X = (N

z + Z Z)a.

Сокращенная модель записывается следующим образом:

N1x¯1

N1z1 a +

N1e¯1 .

20.2. Дисперсионный анализ с повторениями

619

Видно, что система нормальных уравнений для оценки параметров этой модели в точности совпадает с системой нормальных уравнений для исходной модели, т.е. оценки параметров в исходной и сокращенной моделях одинаковы.

Остаточная сумма квадратов в исходной модели равна
e1e1 + e e,	(20.13)
в сокращенной модели —
N1e¯12 + e e.	(20.14)

Пусть первые N1 наблюдений в исходной модели имеют нижний индекс 1i, где i = 1, . . . , N1 . Тогда

e1i = x1i − z1a = x¯1 + x1i − x¯1 − z1a = e¯1 + (x1i − x¯1)

e1e1 = e21i =

= (¯e1 − (x1i − x¯1))2 = N1e¯21 + 2¯e1 (x1i − x¯1) + (x1i − x¯1)2.

←−−−−−−−−−−−→

Сравнение (20.13) и (20.14) с учетом полученного результата завершает доказательство.

В исходной модели (20.1) строки матрицы Z, относящиеся к одной конечной группе, одинаковы, что позволяет в конечном счете перейти к сокращенной модели,

						IK	NI , и пусть
существенно меньшей размерности. В исходной модели N =
						I=I1
xI , sI2			— средняя и дисперсия в I -й конечной группе,
s2 =		1	N	I	s2	— внутригрупповая дисперсия,
		N
e					I
x¯ =	1		NI xI			— общая средняя,
	N

sq2 =		1	NI (xI − x¯)2 — общая межгрупповая дисперсия.
		N

Еще в пункте 4.3 было доказано, что

s2 = s2e + s2q .

На основании этого тождества, учитывая, что количество степеней свободы внутригрупповой дисперсии равно N − K − 1, а межгрупповой — K, можно проверить статистическую гипотезу о значимости влияния всех факторов сразу на изучаемую переменную. Но в данном случае можно провести более детальный анализ

620	Глава 20. Дисперсионный анализ

влияния отдельных факторов и их сочетаний, аналогичный тому, который проводился в случае модели без повторений. В таком анализе используется сокращенная модель, дающая (как это было показано выше) такие же оценки параметров регрессии, что и исходная модель, но представляющая не всю дисперсию, а только межгрупповую:

G
N XG = N ZJ bJ = N ZJ bJ ,	(20.15)

J =0

где XG — вектор средних по конечным группам xI , N — диагональная матрица численностей конечных групп NI .

Эта модель отличается от моделей (20.4) и (20.5) только наличием матричного

множителя N . Но это отличие принципиальное. Оно влечет потерю всех тех «хороших» свойств, которыми обладала модель без повторений. В частности, матрица M в общем случае перестает быть блочно-диагональной, эффекты разных сочетаний факторов становятся зависимыми, а дисперсионное тождество теряет простую структуру.

С моделью (20.15) можно работать как с обычной регрессионной моделью, используя известные критерии проверки разных статистических гипотез (понимая при этом, что результаты проверки будут неоднозначны, в силу взаимозависимостей регрессоров). Но следует иметь в виду, что оценки параметров в этой модели

смещены (что, впрочем, не влияет на результаты проверки гипотез). В частности, b0 = x¯.

Для того чтобы исключить смещенность оценок, необходимо правильно строить матрицы C, используемые при устранении линейных зависимостей в матрице Z. Это связано с тем, что теперь должны равняться нулю не простые, а взвешенные суммы компонент векторов βJ по каждому элементу нижнего мультииндекса I(J ).

В частности, если Ni — численность группы, в которой j-й фактор находится

на ij -м уровне, то

		1	j	· · ·	j
Cj =	−N1j ( N2			· · ·	Nkj	)

Ikj −1

(понятно, что когда численности всех конечных групп равны единице, эта матрица приобретает обычную структуру).

Можно показать, что специальный выбор структуры матриц CJ может обес-


печить максимальную «разреженность» матрицы							M , т.е. обеспечить равенство
	0G	(G	= 0), M	¯	¯	J ). Работая со структурой матриц C		J
нулю блоков M		(G	= 0), M		(J	J ). Работая со структурой матриц C			,

можно обнаружить частный случай, когда модель с повторениями обладает теми

20.3. Упражнения и задачи

621

же свойствами, что и модель без повторений. Этот случай имеет место, если каждый последующий (более младший) фактор делит все полученные ранее группы в одинаковой пропорции. Однако усилия, которые необходимы для доказательства этих фактов, далеко не соответствуют их практической значимости. Так, вряд ли можно ожидать, что ряд групп, имеющих разную численность, можно разбить на подгруппы в одинаковой пропорции — хотя бы в силу целочисленности образуемых подгрупп.

Впринципе, с моделью межгрупповой дисперсии (20.15) можно работать

ибез сомножителя N , т.е. в рамках «хороших» свойств модели без повторений. Для этого достаточно предположить, что исходная модель (20.1) неоднородна по дисперсии ошибок в разных наблюдениях. А именно: считать, что дисперсия ошибки наблюдения обратно пропорциональна численности конечной группы, в которую оно входит (чем больше наблюдений — повторений — в конечной группе, тем меньше дисперсия ошибки в отдельном наблюдении). Тогда сокращенная модель будет однородной по дисперсии и для ее оценки окажется применим простой МНК.

20.3. Упражнения и задачи

Упражнение 1

Провести дисперсионный анализ (без повторений) данных,

приведенных в таблице 20.1:

Таблица 20.1

Имеются 2 фактора по 3 уровня каждый (I, II, III и A, B, C,
Имеются 2 фактора по 3 уровня каждый (I, II, III и A, B, C,
соответственно). Рассчитать коэффициенты b, а также Z, Z,				A	B	C
b , C1 , C2 , C12 , B1	, B2 , B12	, M , m.
b , C1 , C2 , C12 , B1	, B2 , B12	, M , m.	I	3	0	4
			I	3	0	4

Упражнение 2			II	0	7	0

			III	2	8	3
			III	2	8	3

В Таблице 20.2 приведены данные о зарплатах 52-х пре-

подавателей американского колледжа: SX — пол (жен. — 1, муж. – 0); ученое звание: RK1 — assistant professor, RK2 — associate professor, RK3 — full professor; DG — ученая степень (доктор — 1, магистр — 0); SL — средний заработок за академический год, долл.

2.1.Провести дисперсионный анализ с помощью обычной регрессии.

2.2.Провести дисперсионный анализ с помощью взвешенной регрессии, когда совокупность наблюдений с одинаковыми значениями независимых факторов заменяется одним групповым наблюдением.

622	Глава 20. Дисперсионный анализ

Таблица 20.2. (Источник: S. Weisberg (1985), Applied Linear Regression, 2nd Ed, New York: Wiley, page 194)

SX	RK1	RK2	RK3	DG	SL	SX	RK1	RK2	RK3	DG	SL


0	0	0	1	1	36350	0	0	1	0	1	24800

0	0	0	1	1	35350	1	0	0	1	1	25500

0	0	0	1	1	28200	0	0	1	0	0	26182

1	0	0	1	1	26775	0	0	1	0	0	23725

0	0	0	1	0	33696	1	1	0	0	0	21600

0	0	0	1	1	28516	0	0	1	0	0	23300

1	0	0	1	0	24900	0	1	0	0	0	23713

0	0	0	1	1	31909	1	0	1	0	0	20690

0	0	0	1	0	31850	1	0	1	0	0	22450

0	0	0	1	0	32850	0	0	1	0	1	20850

0	0	0	1	1	27025	1	1	0	0	1	18304

0	0	1	0	1	24750	0	1	0	0	1	17095

0	0	0	1	1	28200	0	1	0	0	1	16700

0	0	1	0	0	23712	0	1	0	0	1	17600

0	0	0	1	1	25748	0	1	0	0	1	18075

0	0	0	1	1	29342	0	1	0	0	0	18000

0	0	0	1	1	31114	0	0	1	0	1	20999

0	0	1	0	0	24742	1	1	0	0	1	17250

0	0	1	0	0	22906	0	1	0	0	1	16500

0	0	0	1	0	24450	0	1	0	0	1	16094

0	1	0	0	0	19175	1	1	0	0	1	16150

0	0	1	0	0	20525	1	1	0	0	1	15350

0	0	0	1	1	27959	0	1	0	0	1	16244

1	0	0	1	1	38045	1	1	0	0	1	16686

0	0	1	0	1	24832	1	1	0	0	1	15000

0	0	0	1	1	25400	1	1	0	0	1	20300

<<< < Предыдущая 50 51 52 53 54 55 56 57 58 59 60 6162 / 7462 63 64 65 66 67 68 69 70 71 72 73 74 > Следующая >>>

Соседние файлы в предмете Политология