- •IBM SPSS Statistics Base 20
- •Содержание
- •1. Информация о данных
- •Вкладка Информация о данных: Вывод
- •Вкладка Информация о данных: Статистики
- •2. Частоты
- •Статистики в процедуре Частоты
- •Диаграммы в процедуре Частоты
- •Частоты: Формат
- •3. Описательные
- •Параметры процедуры Описательные статистики
- •Команда DESCRIPTIVES: дополнительные возможности
- •4. Исследовать
- •Статистики процедуры Исследовать
- •Графики процедуры Исследовать
- •Степенные преобразования в процедуре Исследовать
- •Параметры процедуры Исследовать
- •Команда EXAMINE: дополнительные возможности
- •5. Таблицы сопряженности
- •Слои таблиц сопряженности
- •Кластеризованные столбиковые диаграммы в процедуре Таблицы сопряженности
- •Таблицы сопряженности, выводящие переменные слоев в слоях таблицы
- •Вывод в ячейках для таблиц сопряженности
- •Формат таблиц сопряженности
- •6. Подытожить
- •Параметры процедуры Подытожить наблюдения
- •Статистики процедуры Подытожить наблюдения
- •7. Средние
- •Параметры процедуры Средние
- •8. OLAP Кубы
- •Статистики в процедуре OLAP Кубы
- •OLAP Кубы: Разности
- •OLAP Кубы: Заголовок
- •9. T-критерии
- •T-критерий для независимых выборок
- •Параметры процедуры T-критерий для независимых выборок
- •T-критерий для парных выборок
- •Параметры процедуры Т-критерий для парных выборок
- •Одновыборочный T-критерий
- •Параметры процедуры Одновыборочный T-критерий
- •Команда T-TEST: дополнительные возможности
- •10. Однофакторный дисперсионный анализ
- •Контрасты для однофакторного дисперсионного анализа
- •Апостериорные критерии для однофакторного дисперсионного анализа
- •Параметры процедуры Однофакторный дисперсионный анализ
- •Команда ONEWAY: дополнительные возможности
- •11. Общая линейная модель: одномерный анализ
- •Общая линейная модель (ОЛМ)
- •Создать члены
- •Сумма квадратов
- •Контрасты ОЛМ
- •Типы контрастов
- •Графики профилей в ОЛМ
- •Апостериорные сравнения в ОЛМ
- •Сохранение новых переменных в ОЛМ
- •Параметры процедуры ОЛМ
- •Команда UNIANOVA: дополнительные возможности
- •12. Парные корреляции
- •Параметры процедуры Парные корреляции
- •13. Частные корреляции
- •Параметры процедуры Частные корреляции
- •Команда PARTIAL CORR: дополнительные возможности
- •14. Расстояния
- •Меры различия
- •Меры сходства
- •Команда PROXIMITIES: дополнительные возможности
- •15. Линейные модели
- •Как запустить процедуру построения линейной модели
- •Цели
- •Основные параметры
- •Подбор модели
- •Ансамбли
- •Дополнительные параметры
- •Параметры модели
- •Сводка для модели
- •Автоматическая подготовка данных
- •Важность предикторов
- •Предсказанные против наблюденных
- •Остатки
- •Выбросы
- •Эффекты
- •Коэффициенты
- •Оцененные средние
- •Сводка по построению модели
- •16. Линейная регрессия
- •Методы отбора переменных для линейной регрессии
- •Задание правила отбора наблюдений для линейной регрессии
- •Графики процедуры Линейная регрессия
- •Линейная регрессия: Сохранение новых переменных
- •Статистики процедуры Линейная регрессия
- •Параметры процедуры Линейная регрессия
- •Команда REGRESSION: дополнительные возможности
- •17. Порядковая регрессия
- •Порядковая регрессия: Параметры
- •Порядковая регрессия: Вывод
- •Порядковая регрессия: Модель положения
- •Создать члены
- •Порядковая регрессия: Модель масштаба
- •Команда PLUM: дополнительные возможности
- •18. Подгонка кривых
- •Модели подгонки кривых
- •Подгонка кривых: Сохранить
- •19. Регрессия частично наименьших квадратов
- •Модель
- •Параметры
- •20. Анализ методом ближайших соседей
- •Соседи
- •Показатели
- •Группы
- •Сохранить
- •Вывод
- •Параметры
- •Вид Модель
- •Пространство показателей
- •Важность переменных
- •Соседи
- •Расстояния до ближайших соседей
- •Диаграмма квадрантов
- •Значения ошибок при отборе показателей
- •Значения ошибок при выборе k
- •Значения ошибок при отборе показателей и выборе k
- •Таблица классификации
- •Сводка ошибок
- •21. Дискриминантный анализ
- •Задание диапазона в процедуре Дискриминантный анализ
- •Отбор наблюдений для процедуры дискриминантного анализа
- •Статистики в процедуре Дискриминантный анализ
- •Метод пошагового отбора процедуры Дискриминантный анализ
- •Дискриминантный анализ: Классификация
- •Дискриминантный анализ: Сохранить
- •Команда DISCRIMINANT: дополнительные возможности
- •22. Факторный анализ
- •Отбор наблюдений для факторного анализа
- •Описательные статистики факторного анализа
- •Выделение факторов в процедуре Факторный анализ
- •Вращение факторов для факторного анализа
- •Значения факторов в процедуре факторного анализа
- •Параметры процедуры Факторный анализ
- •Команда FACTOR: дополнительные возможности
- •23. Выбор процедуры кластеризации
- •24. Двухэтапный кластерный анализ
- •Параметры процедуры Двухэтапный кластерный анализ
- •Вывод процедуры Двухэтапный кластерный анализ
- •Средство просмотра кластеров
- •Закладка Средство просмотра кластеров
- •Перемещение по средству просмотра кластеров
- •Фильтрация записей
- •25. Иерархический кластерный анализ
- •Задание метода иерархического кластерного анализа
- •Статистики для процедуры Иерархический кластерный анализ
- •Графики для процедуры Иерархический кластерный анализ
- •Сохранение новых переменных в процедуре Иерархический кластерный анализ
- •Эффективность кластерного анализа методом k-средних
- •Итерации в кластерном анализе методом k-средних
- •Сохранение новых переменных в кластерном анализе методом k-средних
- •Параметры процедуры Кластерный анализ методом К-средних
- •Команда QUICK CLUSTER: дополнительные возможности
- •27. Непараметрические критерии
- •Одновыборочные непараметрические критерии
- •Чтобы получить одновыборочные непараметрические критерии
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для независимых выборок
- •Чтобы получить непараметрические критерии для независимых выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для связанных выборок
- •Чтобы применить непараметрические критерии для связанных выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Представление модель
- •Сводка по проверке гипотез
- •Сводка по доверительным интервалам
- •Одновыборочный критерий
- •Критерии для связанных выборок
- •Критерий для независимых выборок
- •Информация по категориальным полям
- •Информация по количественным полям
- •Парные сравнения
- •Однородные подмножества
- •Команда NPTESTS: дополнительные возможности
- •Устаревшие диалоговые окна
- •Критерий хи-квадрат
- •Биномиальный критерий
- •Критерий серий
- •Одновыборочный критерий Колмогорова-Смирнова
- •Критерии для двух независимых выборок
- •Критерии для двух связанных выборок
- •Критерии для нескольких независимых выборок
- •Критерии для нескольких связанных выборок
- •28. Анализ множественных ответов
- •Задание наборов множественных ответов
- •Частоты для множественных ответов
- •Таблицы сопряженности для множественных ответов
- •Задание диапазонов переменных в таблицах сопряженности для наборов множественных ответов
- •Параметры процедуры Таблицы сопряженности для множественных ответов
- •Команда MULT RESPONSE: дополнительные возможности
- •29. Создание отчетов
- •Итоги по строкам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по строкам
- •Параметры группировки отчета
- •Параметры отчета
- •Компоновка отчета
- •Заголовки отчета
- •Итоги по столбцам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по столбцам
- •Итожащие функции столбцов данных
- •Формат столбцов отчета
- •Параметры группировки отчета с итогами по столбцам
- •Параметры отчета для итогов по столбцам
- •Компоновка отчета с итогами по столбцам
- •Команда REPORT: дополнительные возможности
- •30. Анализ пригодности
- •Статистики процедуры Анализ пригодности
- •Команда RELIABILITY: дополнительные возможности
- •31. Многомерное шкалирование
- •Многомерное шкалирование: Форма данных
- •Создание меры для многомерного шкалирования
- •Модель многомерного шкалирования
- •Параметры процедуры Многомерное шкалирование
- •Команда ALSCAL: дополнительные возможности
- •32. Статистики отношений
- •Статистики отношений
- •33. Кривые ROC
- •Параметры процедуры ROC Кривые
- •Указатель
Глава
Кривые ROC
33
Эта процедура полезна для оценки эффективности схем классификации, в которых есть одна переменная с двумя категориями, по которым классифицируются объекты.
Пример. Банк заинтересован в том, чтобы правильно классифицировать заемщиков по признаку возврата или не возврата предоставляемого им кредита. Для такой классификации разработаны различные методы. ROC кривые могут использоваться для оценки того, как хорошо работают эти методы.
Статистики. Площадь под ROC кривой с доверительным интервалом и точками координат ROC кривой. Графики: ROC кривая.
Методы. Оценка площади под ROC кривой может быть вычислена или непараметрически, или параметрически с использованием дважды отрицательной экспоненциальной
(binegative exponential) модели.
Данные. Тестируемые переменные являются числовыми. Они нередко представляют собой вероятности, полученные из дискриминантного анализа или логистической регрессии, или баллы в произвольной шкале, обозначающие “степень уверенности” эксперта или оценивающего в том, что субъектпопадает в ту или иную категорию. Переменная состояния может быть любого типа и указывает истинную категорию, к которой принадлежит субъект. Значение переменной состояния обозначает категорию, которую следует рассматривать как положительную.
Предположения. Предполагается, что возрастающие значения на шкале эксперта или оценивающего представляют возрастающую уверенность в том, что субъект принадлежит одной категории, тогда как убывающие значения на шкале представляют возрастающую уверенность в том, что субъект принадлежит другой категории. Пользователь должен выбрать направление, которое будет считаться положительным. Предполагается также, что известна истинная категория, к которой принадлежит каждый субъект.
Как запустить процедуру ROC Кривые
E Выберите в меню:
Анализ > ROC кривые...
© Copyright IBM Corporation 1989, 2011. |
330 |
331
Кривые ROC
Рисунок 33-1
Диалоговое окно ROC Кривые
EВыберите одну или несколько тестируемых переменных с вероятностями в качестве значений.
E Выберите одну переменную состояния.
E Задайте положительное значение для переменной состояния.
Параметры процедуры ROC Кривые
Рисунок 33-2
Диалоговое окно ROC Кривые: Параметры
332
Глава 33
Вы можете задать следующие спецификации для ROC анализа:
Классификация. Позволяет определить, следует ли при классификации включать значение отсечения в группу, идентифицируемую как положительную, или нет. В настоящее время это не влияет на вывод результатов.
Направление теста. Позволяетзадатьнаправлениешкалыпоотношениюкположительной категории.
Параметры для стандартной ошибки площади. Позволяет задать метод оценивания стандартной ошибки площади под кривой. Доступными методами являются непараметрический и основанный на дважды отрицательном экспоненциальном распределении. Также можно задать уровень для доверительного интервала. Доступным является диапазон от 50.1% до 99.9%.
Пропущенные значения. Позволяет задать режим обработки пропущенных значений.
Приложение
Уведомления
A
Эта информация относится к продуктам и сервису, предлагаемым по всему миру.
Корпорация IBM может не предлагать в некоторых странах продукты, сервис или возможности, описываемые в данном документе. Обратитесь к локальному представителю IBM за информацией о продуктах и сервисе, доступных в настоящее время в вашем регионе. Любая ссылка на продукт, программу или сервис корпорации IBM не имеет целью утверждать или подразумевать, что может использоваться только данный продукт, программа или сервис корпорации IBM. Любой функционально эквивалентный продукт, программа или сервис, который не нарушает право на интеллектуальную собственность корпорации IBM, может использоваться взамен. Однако ответственность за оценку
и проверку работы любого продукта, программы или сервиса, не произведенного корпорацией IBM, лежит на пользователе.
Корпорация IBM может иметь патенты или ожидающие патента приложения, охватывающие предмет рассмотрения в этом документе. Предъявление данного документа не предоставляет какую-либо лицензию на эти патенты. Вы можете послать письменный запрос о лицензии по адресу:
IBM Director of Licensing, IBM Corporation, North Castle Drive, Armonk, NY 10504-1785, U.S.A.
По вопросу лицензирования, касающемуся информации в наборе двухбайтовых символов (DBCS), обратитесь в отдел интеллектуальной собственности корпорации IBM в вашей стране или пошлите письменный запрос по адресу:
Intellectual Property Licensing, Legal and Intellectual Property Law, IBM Japan Ltd., 1623-14, Shimotsuruma, Yamato-shi, Kanagawa 242-8502 Japan.
Следующий параграф не применяется к Соединенному Королевству или к любой другой стране, где такие положения не совместимы с местным законодательством:
INTERNATIONAL BUSINESS MACHINES ПРЕДОСТАВЛЯЕТЭТУПУБЛИКАЦИЮ“КАК ЕСТЬ” БЕЗ ГАРАНТИИ ЛЮБОГО ВИДА, ВЫРАЖЕННОЙ ИЛИ ПОДРАЗУМЕВАЕМОЙ, ВКЛЮЧАЯ ПОДРАЗУМЕВАЕМЫЕ ГАРАНТИИИ НЕНАРУШЕНИЯ ПРАВ, ТОВАРНОЙ ПРИГОДНОСТИ ИЛИ ПРИГОДНОСТИ ДЛЯ СПЕЦИФИЧЕСКОЙ ЦЕЛИ, НО НЕ ОГРАНИЧИВАЯСЬ ПЕРЕЧИСЛЕННЫМ. В некоторых штатах при определенных соглашениях не допускается отказ от выраженных или подразумеваемых гарантий, поэтому данное заявление может к вам не относиться.
Эта информация может содержать технические неточности и типографские ошибки. В представленную здесь информацию периодически вносятся изменения; эти изменения будут включаться в новые издания данной публикации. Корпорация IBM может в любое время вносить усовершенствования и/или изменения в продукты и программы, описываемые в данной публикации, без уведомления об этом.
© Copyright IBM Corporation 1989, 2011. |
333 |
334
Приложение A
Любые приводимые здесь ссылки на web-сайты, не относящиеся к корпорации IBM, даются исключительно для удобства и ни в коей мере не служат целям поддержки или рекламы этих web-сайтов. Материалы на таких web-сайтах не являются составной частью материалов IBM для данного продукта, и они могут использоваться только на свой страх и риск.
Корпорация IBM может использовать или распространять любую предоставленную Вами информацию любым способом, который сочтет подходящим, не принимая на себя каких-либо обязательств по отношению к Вам.
Держатели лицензии на эту программу, которые хотят иметь информацию о ней, чтобы иметь возможность: (i) обмена информации между независимо созданными программами и другими программами (включая данную) и (ii) совместное использование обмениваемой информации, должны обратиться в:
IBM Software Group, Attention: Licensing, 233 S. Wacker Dr., Chicago, IL 60606, USA.
Такая информация может быть доступна при соответствующих условиях и соглашениях, включая в некоторых случаях взимание платы.
Лицензионная программа, описанная в данном документе, и все лицензионные материалы для нее предоставляются корпорацией IBM при условиях, описываемых IBM Customer Agreement, IBM International Program License Agreement или любых эквивалентных им соглашениях между нами.
Информация о продуктах, не принадлежащих корпорации IBM, была получена от поставщиковэтих продуктов, из ихопубликованных сообщений илидругихобщедоступных источников. Корпорация IBM не тестировала эти продукты и не может подтвердить правильность их работы, совместимость и другие утверждения, касающиеся продуктов, не принадлежащих корпорации IBM. Вопросы о возможностях этих продуктов следует направлять их поставщикам.
Эти сведения содержат примеры данных и отчетов, используемых в повседневных деловых операциях. Чтобы проиллюстрировать их настолько полно, насколько это возможно, данные примеры включают имена индивидуумов, названия компаний, брендов и продуктов. Все эти имена и названия являются вымышленными, и любое совпадения с названиями и адресами, используемыми реально действующими компаниями, является чисто случайными.
При просмотре данного электронного информационного документа фотографии и цветные иллюстрации могут не показываться.
Торговые марки
IBM, логотип IBM, ibm.com и SPSS являются товарными знаками корпорации IBM, зарегистрированными во многих странах мира. Текущий список товарных знаков IBM
имеется в web-сети на http://www.ibm.com/legal/copytrade.shtml.
Adobe, логотип Adobe, PostScript и логотип PostScript являются либо зарегистрированными товарными знаками, либо товарными знаками корпорации Adobe Systems в Соединенных Штатах и/или других странах.
335
Уведомления
Intel, логотип Intel, Intel Inside, логотип Intel Inside, Intel Centrino, логотип Intel Centrino, Celeron, Intel Xeon, Intel SpeedStep, Itanium и Pentium являются товарными знаками или зарегистрированными товарными знаками компании Intel или ее дочерних компаний в Соединенных Штатах и других странах.
Java и все основанные на Java товарные знаки и логотипы являются товарными знаками корпорации Sun Microsystems в Соединенных Штатах и других странах.
Linux является зарегистрированным товарным знаком Linus Torvalds в Соединенных Штатах и других странах.
Microsoft, Windows, Windows NT и логотип Windows являются товарными знаками корпорации Microsoft в Соединенных Штатах и других странах.
UNIX является зарегистрированным товарным знаком The Open Group в Соединенных Штатах и других странах.
В этом продукте используется язык WinWrap Basic, разработанный компанией Polar Engineering and Consulting, http://www.winwrap.com/.
Прочие наименования продуктов и услуг могут быть товарными знаками, принадлежащими IBM или другим компаниям.
Скриншоты продукции Adobe перепечатаны с разрешения корпорации Adobe Systems. Скриншоты продукции Microsoft перепечатаны с разрешения корпорации Microsoft.