Связь ответов на вопросы «Точки зрения на иностранную помощь» и «Возможности удовлетворения территориальных требований Японии» (частоты и проценты)

V1 точка зрения на иностранную помощь		V4 Возможность удовлетворить территориальные требования Японии			Total
V1 точка зрения на иностранную помощь		1 отдать	2 не надо	3 не знаю
Не нужна	Count	21	143	11	175
	% row	12,0	81,7	6,3	100,0
	% col	19,6	27,2	13,9	24,6
Огранич.	Count	57	326	48	431
	% row	13,2	75,6	11,1	100,0
	% col	53,3	62,0	60,8	60,5
Нужна	Count	27	32	14	73
	% row	37,0	43,8	19,2	100,0
	% col	25,2	6,1	17,7	10,3
Не знаю	Count	2	25	6	33
	% row	6,1	75,8	18,2	100,0
	% col	1,9	4,8	7,6	4,6
Total	Count	107	526	79	712
	% row	15,0	73,9	11,1	100,0
	% col	100,0	100,0	100,0	100,0

Проценты в CROSSTABSпозволяют изучать взаимосвязь переменных, а не только структуру таблицы. В частности, сравнивая строки, можно сделать заключение, что более склонны отдать острова те, кто считает, что нужна помощь восточным регионам (37 %), чем те, кто считает, что помощи не нужно. Можно взять в качестве точки отсчета распределение в целом по совокупности (всего 15 % в среднем по массиву готовы отдать все или часть островов).

3.2.1.3. Cтатистики смещения частот

Реализованные в параметре CELLSстатистики позволяют провести более сложный анализ связи переменных. Например, в табл. 3.4 можно увидеть, что среди полагающих ненужной иностранную помощь 12 % готовы отдать острова Японии. Среди считающих, что помощь нужна,их 37 %. В то же время в целом по совокупности лишь 15 % готовы передать острова. Существенны ли полученные отличия долей подмножеств соответственно на 3 % и 22 % от доли в целом по совокупности? Может ли в следующем обследовании связь оказаться противоположной? Основой для исследования смещения выборки от истинного распределения служат теоретические значения, ожидаемые в случае независимости выборки. ПодпараметрEXPECTEDпараметраCELLSпозволяет вывести в клетках абсолютные значения частот (N_ij) и ожидаемые в предположении независимости переменных (теоретические) частоты (E_ij). Отклонение (N_ij–E_ij) наблюдаемой частоты от ожидаемой – более удобная величина для анализа, она достаточно наглядна, но остается неясным, насколько это отклонение статистически значимо.

Более полезна статистика Z_ij= (N_ij–E_ij)/σ_ij– стандартизованное смещение частоты;Z_ijвыдается в клетке при указании подпараметраASRESID(Adjusted residuals). Иными словами,Z_ijпредставляет собой отклонение наблюдаемой частоты от ожидаемой, измеренное в числе стандартных отклонений. При этом стандартное отклонение σ_ijвычисляется исходя из предположения, чтоN_ij– случайная величина, имеющая гипергеометрическое распределение:

Если переменные независимы, то при больших Nслучайная величинаZ_ijимеет нормальное распределение с параметрами (0,1). Для нее практически невероятно принять значение, большее трех стандартных отклонений, т. к. вероятность такого значения составляет менее0,0027(правило «трех сигм»). Поэтому, если мы получаем значениеZ_ij, превышающее 3, то можем считать, чтоi-е значение иj-е значениеXиYсвязаны. На практике, когда анализируется единственная клетка таблицы, выставляются более слабые требования. Существенными считаются уже те односторонние отклонения, которые превышают лишь 1,65σ_ij– вероятность их получения составляет 5 %_.Таким образом, начиная с отклонения 1,65 (Z_ijимеет σ_ij = 1) и большего, можно высказывать гипотезу о существовании связи между значениями. (См. таблицу нормального распределения в любом статистическом справочнике).

В практических расчетах принято считать теоретическое распределение Z_ijблизким к нормальному, если. Хотя последнее ограничение достаточно жестко, так как можно показать, что для его выполнения в выборке должно быть по крайней мере 144 наблюдения.

К сожалению, получив данные расчетов, указывающие на зависимость (Z_ij> 1,96 в случае 5 %-го двустороннего критерия) значений, мы не вправе быть уверенными, что эта зависимость существует.

На практике мы рассчитываем показатели значимости для множества клеток. Чем их больше, тем выше вероятность случайно получить хотя бы одно значение, превышающее указанный порог. Из теории следует, что если клетки независимы, то при критическом значении статистикиZ_ij, равном 1,96 (5 %-й уровень значимости), мы в среднем найдем 5 «значимых» из 100 клеток таблицы. А хотя бы одну статистику, превзошедшую критическое значение (|Z_ij| > 1,96), в условиях независимости клеток мы можем получить с вероятностью (1 – 0,95¹⁰⁰) = 0,9941! Таким образом, если мы получили значимые связи, то это дает нам лишь повод для высказывания гипотезы об их наличии и требует содержательной дополнительной проверки. Поэтому сложившаяся практика руководствоваться отклонением 1,96 оберегает нас только от грубейших ошибок. В то же время, если мы не получили значимых связей, то можем делать вывод либо об их отсутствии, либо о недостаточном количестве данных для их обнаружения.

Величина SRESID– стандартизованное изменение частоты по сравнению с ожидаемым (N_ij–E_ij)/– связана с распределением Пуассона. Напомним, что распределение Пуассона – это распределение числа успехов для редко случающихся событий при большом числе испытаний. Если попадание наблюдения в клетку (i,j) считать этим редким событием, то ожидаемое значениеможно считать оценкой параметра распределения Пуассона (). Дисперсия распределения Пуассона совпадает с его математическим ожиданием, поэтому (N_ij–E_ij)/является отклонением, вычисленным в числе стандартных отклонений. При больших ожидаемых частотахE_ijтак же, как,ASRESIDраспределение Пуассона, асимптотическинормально, что позволяет нам решать вопрос о независимости ответов,проверив попадание наблюдаемого значенияSRESIDв критическую область.

Пример.(См. табл. 3.5.) Определим зависимость между отношением к получению иностранной помощи и «Возможностью удовлетворить территориальные требований Японии»:

CROSSTABS /TABLES = v1 BY W4/CELLS = COUNT EXPECTED RESID ASRESID.

Так как в CELLSуказан параметрCOUNT, EXPECTED, RESID и ASRESID, то в клетках выведены реальные и ожидаемые значения, а также абсолютная разность расчетной частоты от ожидаемой. В нижней строке клеток выведена эта же разность, но в числе стандартных отклонений.

Таблица 3.5

<<< < Предыдущая 11 12 13 14 15 16 17 18 19 20 21 2223 / 6923 24 25 26 27 28 29 30 31 32 33 34 35 > Следующая >>>