Статистики переменной v14 – «Душевой доход», выданные командой frequencies

N	Valid	673
	Missing	48
Mean		229,11
Std. Error of Mean		5,83
Median		200
Mode		200
Std. Deviation		151,342
Variance		22904,531
Skewness		3,035
Std. Error of Skewness		0,094
Kurtosis		15,080
Std. Error of Kurtosis		0,188
Range		1479
Minimum		21
Maximum		1500
Sum		154190
Percentiles	10	100
	25	140
	50	200
	75	280
	90	400

Анализируя полученные данные (табл. 3.2), видим, что доход в семьях меняется в диапазоне от 21 до 1 500 р. (разброс равен 1 479). При этом средний доход составил около 229,11 р. Приближенными границами пятипроцентного доверительного интервала для матожидания будут значения 229,11 1,965,83, где 1,96 – критическое значение нормального распределения дляp = 0,05/2 = 0,025. Скошенностьskewness = 3,035 и пикообразностьkurtosis = 15,08 значительно больше нуля. Их стандартные ошибки (0,094 и 0,188 соответственно) свидетельствуют о статистической значимости такого отличия. Действительно, отношение коэффициентов к ошибкам достаточно велико и попадает в критическую область, что позволяет отклонить гипотезу о равенстве полученных статистик нулю.

Результатом задания процентилей и n-тилей являются выданные в таблице процентили (у 10 % опрошенных респондентов доход меньше 100 р., у 90 % – меньше 400; имеются также процентили,ограничивающие уровни дохода для 25, 50, 75 % респондентов).

3.1.2.Descriptives– описательные статистики

Если команда FREQUENCIESполучает описательные статистики «попутно», тоDESCRIPTIVESспециально для этого предназначена. Ею удобнее пользоваться для анализа количественных переменных.

DESCRIPTIVES VAR = V9 V14 /STATISTICS = MEAN MIN MAX / SAVE.

Синтаксис: указывается список переменных, список необходимых статистик, подкоманда сохранения в файле полученных стандартизованных переменных (/save).

Список вычисляемых статистик (10) здесь значительно меньше, чем в команде Frequencies(16):

MEAN MIN SKEWNESS STDDEV SEMEAN MAX KURTOSIS VARIANCE SUM RANGE.

Стандартизованные переменные. КомандойDESCRIPTIVESнеобходимо пользоваться для получения нормированных переменных. Потребность в них может появиться, например, для проведения кластерного или регрессионного анализа. Иногда это связано с необходимостью сопоставления разномасштабной информации.

Пример.Мы имеем данные по заработной плате за два последних года. На основании этих данных необходимо определить, в каком социальном слое находятся респонденты. Но это затруднительно сделать, поскольку за 2 годасущественноизменился масштаб цен. Для сравнения преобразуем к стандартному виду данные по каждому году, что позволит нам провести сравнительный анализ для определенных социальных слоев:

, гдеS– cтандартное отклонение переменнойХ;.

Стандартизованные переменные можно получить, указав в скобках за переменной имя новой, стандартизованной, переменной:

DESCRIPTIVES VAR V14(Z14) V9(Z9).

Если используется подкоманда SAVE, то сообщать имена нет необходимости. Стандартизованные переменные запишутся в конец файла данных под именами, которые будут автоматически образованы добавлением буквы Z слева к имени исходной переменной.

Например,

DESCRIPTIVES VAR = V9 V14/SAVE.

Новым переменным пакет присвоит имена ZV9иZV14.

Напомним, что более разнообразные преобразования переменных можно получить командой RANK. С помощью этой команды можно ранжировать значения переменной, перекодировать переменную с целью получения нормального распределения, получать процентили и др.

<<< < Предыдущая 8 9 10 11 12 13 14 15 16 17 18 1920 / 6920 21 22 23 24 25 26 27 28 29 30 31 32 > Следующая >>>