Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
168
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

Глава

Средние

7

Процедура Средние вычисляет средние значения для подгрупп и связанные с ними одномерные статистики для зависимых переменных внутри категорий одной или нескольких независимых переменных. Дополнительно вы можете провести однофакторный дисперсионный анализ, найти значения статистики эта (eta), а также выполнить тесты

на линейность.

Пример. Измерим среднее поглощаемое количество жира для каждого из трех типов кулинарного жира, и проведем однофакторный дисперсионный анализ для проверки, различаются ли эти средние значения.

Статистики. Сумма, число наблюдений, среднее значение, медиана, групповая медиана, стандартная ошибка среднего значения, минимальное и максимальное значения, размах, значение группирующей переменной для первой категории, значение группирующей переменной для последней категории, стандартное отклонение, дисперсия, эксцесс, стандартная ошибка эксцесса, асимметрия, стандартная ошибка асимметрии, процент от общей суммы, процент от общего N, процент от суммы в, процент от N в, геометрическое среднее, гармоническое среднее. Дополнительные статистики включают дисперсионный анализ, значения эта (eta) и эта квадрат, а также критерий линейности, R и R2.

Данные. Зависимые переменные - количественные, независимые переменные - категориальные. Значения группирующих переменных могут быть числовыми и текстовыми.

Предположения. Некоторые статистики для подгрупп, например, среднее и стандартное отклонение, основаны на теории нормального распределения и подходят для количественных переменных с симметричными распределениями. Робастные статистики, такие как медиана, годятся и для количественных переменных, которые могут не удовлетворять условию нормальной распределенности. Дисперсионный анализ является робастным в отношении отклонений от нормальности, однако данные в каждой ячейке должны быть симметричными. При проведении дисперсионного анализа предполагается, что группы принадлежат совокупностям с одинаковыми дисперсиями. Для проверки этого предположения используйте критерий однородности дисперсии Ливиня, который выполняется в процедуре Однофакторный дисперсионный анализ.

Как выполнить процедуру Средние

E Выберите в меню:

Анализ > Сравнение средних > Средние...

© Copyright IBM Corporation 1989, 2011.

38

39

Средние

Рисунок 7-1

Диалоговое окно Средние

E Выберите одну или несколько зависимых переменных.

EИспользуйте один из следующих методов для выбора категориальных независимых переменных:

Выберите одну или несколько независимых переменных. Для каждой независимой переменной результаты будут выведены отдельно.

Выберите один или несколько слоев независимых переменных. Каждый слой в дальнейшем делит выборку на подгруппы. Если одна из независимых переменных находится в слое 1, а вторая - в слое 2, то результаты будут выведены в одной таблице сопряженности, а не в отдельных таблицах для каждой независимой переменной.

EКроме того, можно щелкнуть Параметры для получения дополнительных статистических данных, таблицы дисперсионного анализа, значения эта (eta), эта квадрат, R и R2.

40

Глава 7

Параметры процедуры Средние

Рисунок 7-2

Диалоговое окно Средние: Параметры

Вы можете выбрать одну или несколько из следующих статистик для подгрупп, рассчитываемых для переменных внутри каждой отдельной категории каждой группирующей переменной: сумма, число наблюдений, среднее значение, медиана, медиана группы, стандартная ошибка среднего значения, минимальное и максимальное значения, размах, значение группирующей переменной для первой категории, значение группирующей переменной для последней категории, стандартное отклонение, дисперсия, эксцесс, стандартная ошибка эксцесса, асимметрия, стандартная ошибка асимметрии, процент от общей суммы, процент от общего N, процент от суммы в, процент от N в, геометрическое среднее, гармоническое среднее. Вы можете изменить порядок, в котором выводятся статистики подгрупп. Порядок, в котором статистики приведены в списке Статистики в ячейках, определяет их порядок при выводе. Итожащие статистики также выводятся для каждой переменной по всем категориям.

Первое. Выводит первое значение данных, встреченное в файле данных. Геометрическое среднее. Корень n-й степени из произведения n значений наблюдений.

Групповая медиана. Медианы, вычисленные для данных, закодированных по принадлежности к группам. Например, для данных о возрасте каждое значение для 30-летних кодируется как 35, каждое значение для 40-летних кодируется как 45 и т.д.; групповая медиана - это медиана, вычисленная по закодированным данным.

Гармоническое среднее. Используется для оценки среднего объема группы, когда объемы выборок в группах различаются. Гармоническое среднее - это общее число выборок, деленное на сумму величин, обратных объемам отдельных групп.

41

Средние

Эксцесс. Мера сгруппированности наблюдений вокруг центральной точки. Для нормального распределения значение эксцесса равно 0. Положительный эксцесс указывает на то, что по отношению к нормальному распределению наблюдения для таких распределений сгруппированы более плотно около центра и имеют более тонкие хвосты до экстремумов распределения, и более толстые хвосты в области экстремальных значений. Отрицательный эксцесс указывает на то, что по отношению к нормальному распределению наблюдения для таких распределений сгруппированы менее плотно около центра и имеют более толстые хвосты до экстремумов распределения, и более тонкие хвосты в области экстремальных значений.

Последнее. Выводит последнее значение в файле данных. Максимум. Наибольшее значение числовой переменной.

Среднее. Мера центральной тенденции. Арифметическое среднее; сумма, деленная на число наблюдений.

Медиана. Значение, выше и ниже которого попадает по половине наблюдений, иначе 50-й процентиль. Если число наблюдений четно, медиана есть арифметическое среднее двух находящихся в середине значений, если выборку упорядочить по убыванию или по возрастанию. Медиана представляет собой меру центральной тенденции, которая нечувствительна к выбросам, в отличие от среднего значения, которое могут исказить несколько экстремально больших или малых значений.

Минимум. Наименьшее значение числовой переменной. Количество. Число случаев (наблюдений или записей).

Процент от общего количества N. Процент от общего количества наблюдений в каждой категории.

Процент от общей суммы. Процент от общей суммы в каждой категории.

Диапазон. Разность между наибольшим и наименьшим значениями числовой переменной; максимум минус минимум.

Асимметрия. Мера асимметрии распределения. Нормальное распределение симметрично, и для него асимметрия равна 0. Распределение со значимой положительной асимметрией имеет длинный хвост справа. Распределение со значимой отрицательной асимметрией имеет длинный хвост слева. В качестве грубого правила можно сказать, что значение асимметрии, более чем вдвое превышающее ее стандартную ошибку, указывает на наличие асимметрии распределения.

Стандартная ошибка эксцесса. Отношение эксцесса к его стандартной ошибке можно использовать как критерий нормальности (то есть, можно отвергнуть нормальность, если это отношение меньше –2 или больше +2). Большое положительное значение эксцесса указывает, что хвосты распределения длиннее, чем у нормального; отрицательное значение эксцесса указывает на более короткие хвосты (как у равномерного распределения).

Стандартная ошибка асимметрии. Отношение асимметрии к ее стандартной ошибке можно использовать как критерий нормальности (то есть, можно отвергнуть нормальность, если это отношение меньше, чем –2, или больше, чем +2). Большое положительное значение асимметрии указывает на длинный правый хвост (распределения); большое отрицательное значение - на длинный левый хвост.

42

Глава 7

Сумма. Сумма или итог для всех значений по всем наблюдениям, имеющим непропущенные значения.

Дисперсия. Мера разброса относительно среднего значения. Равна сумме квадратов отклонений от среднего, деленной на число, на единицу меньшее числа наблюдений. Дисперсия измеряется в единицах, которые равны квадратам единиц измерения самой переменной.

Статистики для первого слоя

Таблица дисперсионного анализа и эта. Выводит таблицу однофакторного дисперсионного анализа и вычисляет значение эта и эта в квадрате (меры близости) для каждой независимой переменной в первом слое.

Критерий линейности. Вычисляет сумму квадратов, степени свободы и средний квадрат для линейных и нелинейных компонентов, а также F-отношение, значения R и R-квадрат. Линейность не вычисляется, если независимой объявлена короткая текстовая переменная.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]