Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
168
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

Глава

Непараметрические критерии

27

Непараметрические критерии требуют минимальных предположений о распределении данных. Критерии, доступные с помощью данных диалоговых окон, можно разделить на три общие категории в зависимости от организации данных:

Одновыборочный критерий анализирует единственное поле.

Критерий для связанных выборок сравнивает два или большее число полей для одного и того же набора наблюдений.

Критерий для независимых выборок анализирует единственное поле, разбитое на группы категориями другого поля.

Одновыборочные непараметрические критерии

Процедура Одновыборочные непараметрические критерии выявляет различия в единичных полях, используя один или несколько непараметрических критериев. Непараметрические критерии не предполагают, что данные соответствуют нормальному распределению.

Рисунок 27-1

Вкладка Одновыборочные непараметрические критерии: Цель

Какова Ваша цель? Вкладка цели позволяет быстро задать параметры для решения различных и в то же время наиболее типичных задач.

Автоматически сравнить наблюденные данные с гипотетическими Для этой цели к категориальным полям, имеющим только две категории, применяется биномиальный критерий. Ковсемостальнымкатегориальнымполямприменяетсякритерийхи-квадрат. К непрерывным полям применяется критерий Колмогорова-Смирнова.

© Copyright IBM Corporation 1989, 2011.

211

212

Глава 27

Проверить последовательность на случайность. Для проверки наблюденной последовательности данных на случайность используется критерий серий.

Настроить анализ. Выберите этот вариант при желании вручную внести коррективы в параметры тестирования на вкладке Параметры. Обратите внимание на то, что этот выбор производится автоматически, если на вкладке Параметры сделать изменения, несовместимые с выбранной целью.

Чтобы получить одновыборочные непараметрические критерии

Выберите в меню:

Анализ > Непараметрические критерии > Одновыборочные...

EЩелкните по кнопке Запуск.

Дополнительно Вы можете:

Задать цель на вкладке Цель.

Задать назначение полей на вкладке Поля.

Самостоятельно выбрать параметры на вкладке Параметры.

Вкладка Поля

Рисунок 27-2

Вкладка Одновыборочные непараметрические критерии: Поля

На вкладке Поля задаются проверяемые поля.

Использовать заранее заданные роли. При этом варианте выбора используется имеющаяся информация о полях. Все поля с предопределенными ролями, такими как Входная, Целевая или Двойного назначения, будут использованы как проверяемые поля. Необходимо задать, по крайней мере, одно поле для проверки.

213

Непараметрические критерии

Настроить назначение полей. Этот вариант выбора позволяет не принимать во внимание роли, назначенные полям. После выбора этого варианта задайте поля:

Проверяемые поля. Выберите одно или несколько полей.

Вкладка Параметры

Вкладка Параметры содержит несколько различных групп параметров, которые можно изменять, чтобы точно настроить то, как алгоритм будет обрабатывать имеющиеся данные. Если в настройку параметров по умолчанию внести изменения, которые несовместимы с выбранной целью, то выбор на вкладке Цели будет автоматически изменен на Настроить анализ.

Выберите критерии

Рисунок 27-3

Параметры группы Выберите критерии (Одновыборочные непараметрические критерии)

Эти параметры определяют, какие критерии будут применяться к полям, заданным на вкладке Поля.

Автоматически выбрать критерии на основе данных. При выборе этого варианта к категориальным полям, имеющим только две категории (с не пропущенными значениями), применяется биномиальный критерий. Ко всем остальным категориальным полям применяется критерий хи-квадрат. К непрерывным полям применяется критерий Колмогорова-Смирнова.

Настроить критерии. Этот вариант дает возможность выбрать применяемые критерии.

Сравнить наблюденную двоичную вероятность с гипотетической (Биномиальный критерий). Биномиальный критерий можно применить ко всем полям. Применяется одновыборочный критерий для проверки того, соответствует ли выборочное распределение поля признака (категориальное поле с двумя категориями)

214

Глава 27

заданному биномиальному распределению. Дополнительно можно запросить вывод доверительных интервалов. Обратитесь к Вкладка Параметры Биномиального критерия за подробностями, касающимися параметров критериев.

Сравнить наблюденные вероятности с гипотетическими (критерий Хи-квадрат).

Критерий хи-квадрат применяется к номинальным и порядковым полям. Применяется одновыборочный критерий, который вычисляет статистику хи-квадрат на основе разностей между наблюденными и ожидаемыми частотами категорий поля. Обратитесь

кВкладка Параметры критерия Хи-квадрат за подробностями, касающимися параметров критериев.

Сравнить наблюденное распределение с гипотетическим (критерий

Колмогорова-Смирнова). Критерий Колмогорова-Смирнова применяется к непрерывным полям. Применяется одновыборочный критерий для проверки того, что выборочная функция распределения для поля согласуется с равномерным, нормальным или экспоненциальнымраспределением, а также распределением Пуассона. Обратитесь к Параметры критерия Колмогорова-Смирнова за подробностями, касающимися параметров критериев.

Сравнить медиану с гипотетической (критерий знаковых рангов Вилкоксона).

Критерий знаковых рангов Вилкоксона применяется к непрерывным полям. Для проверки медианы значений поля применяется одновыборочный критерий. Задайте число в качестве гипотетического значения медианы.

Проверить последовательность на случайность (критерий серий). Критерий серий применяется ко всем полям. Применяется одновыборочный критерий для проверки того, что последовательность значений дихотомизированного поля является случайной. Обратитесь к Параметры критерия серий за подробностями, касающимися параметров критериев.

Вкладка Параметры Биномиального критерия

Рисунок 27-4

Параметры Биномиального критерия (Одновыборочные непараметрические критерии)

215

Непараметрические критерии

Биномиальный критерий предназначен для полей признаков (категориальных полей только с двумя категориями), однако он применяется ко всем полям, используя правило задания “успеха”.

Гипотетическая доля. Здесь задается ожидаемая доля записей, заданных как “успех”, или p. Задайте значение, большее 0 и меньшее 1. Значение по умолчанию равно 0,5.

Доверительный интервал. Доступны следующие методы вычисления доверительных интервалов для бинарных данных:

Клоппер-Пирсон (точный). Точный интервал, основанный на функции распределения биномиального распределения.

Джеффриз. Байесовский интервал, основанный на апостериорном распределении p при использовании априорного распределения вероятностей Джеффриза.

Отношение правдоподобия. Интервал, основанный на функции правдоподобия для p.

Задать “успех” для категориальных полей. Здесь задается, как для категориальных полей определяется “успех”, т.е. значение или значения, доля которых сравнивается с гипотетической долей.

Использовать первую категорию, встретившуюся в данных. В качестве “успеха” для

биномиального критерия используется первое значение, найденное в выборке. Этот выбор применим только к номинальным и порядковым полям и только с двумя категориями. Все остальные категориальные поля, заданные на вкладке Поля, проверяться не будут. Это задано по умолчанию.

Задать значения “успеха”. Биномиальный критерий применяется с целым списком

значений, заданных в качестве “успеха”. Задайте список текстовых или числовых значений. Значения из списка необязательно должны присутствовать в выборке.

Задать “успех” для количественных полей. Здесь задается, как для непрерывных полей определяется “успех”, т.е. значение или значения, доля которых сравнивается с тестовым значением. Успех задается как значения, равные или меньшие, чем точка отсечения.

Средняя точка выборки задает в качестве точки отсечения среднее значение

минимального и максимального значений.

Заданная точка отсечения позволяет задать значение точки отсечения.

216

Глава 27

Вкладка Параметры критерия Хи-квадрат

Рисунок 27-5

Параметры критерия Хи-квадрат (Одновыборочные непараметрические критерии)

У всех категорий равные вероятности. Это дает равные частоты всем категориям из выборки. Это задано по умолчанию.

Задать ожидаемую вероятность. Это позволяет задать неравные частоты для заданного списка категорий. Задайте список текстовых или числовых значений. Значения из списка необязательно должны присутствовать в выборке. В столбце Категория задайте значения категорий. В столбце Относительная частота для каждой категории задайте положительное значение. Задаваемые частоты рассматриваются как относительные частоты, так что, например, задание частот 1, 2 и 3 эквивалентно заданию частот 10, 20 и 30, причем оба эти набора частот говорят о том, что ожидается, что 1/6 записей попадет в первую категорию, 1/3 - во вторую и 1/2 - в третью. Когда задаются ожидаемые вероятности, задаваемые значения категорий должны включать все значения полей в данных. В противном случае для соответствующего поля тест не будет выполнен.

217

Непараметрические критерии

Параметры критерия Колмогорова-Смирнова

Рисунок 27-6

Параметры критерия Колмогорова-Смирнова (Одновыборочные непараметрические критерии)

В этом диалоговом окне задается, какие распределения должны быть проверены, а также параметры предполагаемых распределений.

Нормальное. Использовать данные выборки использует наблюденные среднее и стандартное отклонение, Задать позволяет задать значения.

Равномерное. Использовать данные выборки использует наблюденные минимум и максимум, Задать позволяет задать значения.

Экспоненциальное. Выборочное среднее использует наблюденное среднее значение, Задать позволяет задать значения.

Пуассона. Выборочное среднее использует наблюденное среднее значение, Задать позволяет задать значения.

218

Глава 27

Параметры критерия серий

Рисунок 27-7

Параметры критерия серий (Одновыборочные непараметрические критерии)

Критерий серий предназначен для полей признаков (категориальных полей только с двумя категориями), однако его можно применить ко всем полям, используя правило задания групп.

Задать группы для категориальных полей

В выборке имеется только две категории. Критерий серий применяется с использованием

значений для задания групп, найденных в выборке. Этот выбор применим только к номинальным и порядковым полям и только с двумя категориями. Все остальные категориальные поля, заданные на вкладке Поля, проверяться не будут.

Перекодировать данные в 2 категории. Критерий серий применяется с использованием

целого заданного списка значений для задания одной из групп. Все остальные значения из выборки задают другую группу. В выборке необязательно должны присутствовать все значения из списка, но, по крайней мере, одна запись должна быть в каждой группе.

Задать точку отсечения для количественных полей. Здесь задается, как формируются группы для непрерывных полей. К первой группе относятся значения, равные или меньшие, чем точка отсечения.

Выборочная медиана задает точку отсечения равной выборочной медиане.

Выборочное среднее задает точку отсечения равной выборочному среднему.

Задать позволяет задать значение точки отсечения.

219

Непараметрические критерии

Параметры критериев

Рисунок 27-8

Параметры группы Параметры критериев (Одновыборочные непараметрические критерии)

Уровень значимости. Здесь задается уровень значимости (альфа) для всех критериев. Задайте числовое значение между 0 и 1. 0,05 является значением по умолчанию.

Доверительный интервал (%). Здесь задается доверительный уровень для всех рассчитываемых доверительных интервалов. Задайте числовое значение между 0 и 100. 95 является значением по умолчанию.

Исключенные наблюдения. Здесь задается, какие наблюдения используются при выполнении тестов.

Исключать наблюдения целиком означает, что записи с пропущенными значениями в

любых полях, указанных на вкладке Поля, исключаются из анализа.

Исключать по отдельности означает, что записи с пропущенными значениями в поле,

используемом при выполнении конкретного теста, не используются при выполнении этого теста. Когда задано одновременно несколько тестов, для каждого из них вопрос об использовании записей с пропущенными значениями решается независимо от других.

Пользовательские пропущенные значения

Рисунок 27-9

Параметры группы Пользовательские пропущенные значения (Одновыборочные непараметрические критерии)

Пользовательские пропущенные значения для категориальных полей. Категориальные поля должны иметь допустимые значения, для того чтобы запись была включена в анализ. С помощью этих управляющих элементов можно определить, рассматривать ли пользовательские пропущенные значения в категориальных полях как допустимые. Системные пропущенные значения и пропущенные значения для непрерывных полей всегда рассматриваются как недопустимые.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]