- •IBM SPSS Statistics Base 20
- •Содержание
- •1. Информация о данных
- •Вкладка Информация о данных: Вывод
- •Вкладка Информация о данных: Статистики
- •2. Частоты
- •Статистики в процедуре Частоты
- •Диаграммы в процедуре Частоты
- •Частоты: Формат
- •3. Описательные
- •Параметры процедуры Описательные статистики
- •Команда DESCRIPTIVES: дополнительные возможности
- •4. Исследовать
- •Статистики процедуры Исследовать
- •Графики процедуры Исследовать
- •Степенные преобразования в процедуре Исследовать
- •Параметры процедуры Исследовать
- •Команда EXAMINE: дополнительные возможности
- •5. Таблицы сопряженности
- •Слои таблиц сопряженности
- •Кластеризованные столбиковые диаграммы в процедуре Таблицы сопряженности
- •Таблицы сопряженности, выводящие переменные слоев в слоях таблицы
- •Вывод в ячейках для таблиц сопряженности
- •Формат таблиц сопряженности
- •6. Подытожить
- •Параметры процедуры Подытожить наблюдения
- •Статистики процедуры Подытожить наблюдения
- •7. Средние
- •Параметры процедуры Средние
- •8. OLAP Кубы
- •Статистики в процедуре OLAP Кубы
- •OLAP Кубы: Разности
- •OLAP Кубы: Заголовок
- •9. T-критерии
- •T-критерий для независимых выборок
- •Параметры процедуры T-критерий для независимых выборок
- •T-критерий для парных выборок
- •Параметры процедуры Т-критерий для парных выборок
- •Одновыборочный T-критерий
- •Параметры процедуры Одновыборочный T-критерий
- •Команда T-TEST: дополнительные возможности
- •10. Однофакторный дисперсионный анализ
- •Контрасты для однофакторного дисперсионного анализа
- •Апостериорные критерии для однофакторного дисперсионного анализа
- •Параметры процедуры Однофакторный дисперсионный анализ
- •Команда ONEWAY: дополнительные возможности
- •11. Общая линейная модель: одномерный анализ
- •Общая линейная модель (ОЛМ)
- •Создать члены
- •Сумма квадратов
- •Контрасты ОЛМ
- •Типы контрастов
- •Графики профилей в ОЛМ
- •Апостериорные сравнения в ОЛМ
- •Сохранение новых переменных в ОЛМ
- •Параметры процедуры ОЛМ
- •Команда UNIANOVA: дополнительные возможности
- •12. Парные корреляции
- •Параметры процедуры Парные корреляции
- •13. Частные корреляции
- •Параметры процедуры Частные корреляции
- •Команда PARTIAL CORR: дополнительные возможности
- •14. Расстояния
- •Меры различия
- •Меры сходства
- •Команда PROXIMITIES: дополнительные возможности
- •15. Линейные модели
- •Как запустить процедуру построения линейной модели
- •Цели
- •Основные параметры
- •Подбор модели
- •Ансамбли
- •Дополнительные параметры
- •Параметры модели
- •Сводка для модели
- •Автоматическая подготовка данных
- •Важность предикторов
- •Предсказанные против наблюденных
- •Остатки
- •Выбросы
- •Эффекты
- •Коэффициенты
- •Оцененные средние
- •Сводка по построению модели
- •16. Линейная регрессия
- •Методы отбора переменных для линейной регрессии
- •Задание правила отбора наблюдений для линейной регрессии
- •Графики процедуры Линейная регрессия
- •Линейная регрессия: Сохранение новых переменных
- •Статистики процедуры Линейная регрессия
- •Параметры процедуры Линейная регрессия
- •Команда REGRESSION: дополнительные возможности
- •17. Порядковая регрессия
- •Порядковая регрессия: Параметры
- •Порядковая регрессия: Вывод
- •Порядковая регрессия: Модель положения
- •Создать члены
- •Порядковая регрессия: Модель масштаба
- •Команда PLUM: дополнительные возможности
- •18. Подгонка кривых
- •Модели подгонки кривых
- •Подгонка кривых: Сохранить
- •19. Регрессия частично наименьших квадратов
- •Модель
- •Параметры
- •20. Анализ методом ближайших соседей
- •Соседи
- •Показатели
- •Группы
- •Сохранить
- •Вывод
- •Параметры
- •Вид Модель
- •Пространство показателей
- •Важность переменных
- •Соседи
- •Расстояния до ближайших соседей
- •Диаграмма квадрантов
- •Значения ошибок при отборе показателей
- •Значения ошибок при выборе k
- •Значения ошибок при отборе показателей и выборе k
- •Таблица классификации
- •Сводка ошибок
- •21. Дискриминантный анализ
- •Задание диапазона в процедуре Дискриминантный анализ
- •Отбор наблюдений для процедуры дискриминантного анализа
- •Статистики в процедуре Дискриминантный анализ
- •Метод пошагового отбора процедуры Дискриминантный анализ
- •Дискриминантный анализ: Классификация
- •Дискриминантный анализ: Сохранить
- •Команда DISCRIMINANT: дополнительные возможности
- •22. Факторный анализ
- •Отбор наблюдений для факторного анализа
- •Описательные статистики факторного анализа
- •Выделение факторов в процедуре Факторный анализ
- •Вращение факторов для факторного анализа
- •Значения факторов в процедуре факторного анализа
- •Параметры процедуры Факторный анализ
- •Команда FACTOR: дополнительные возможности
- •23. Выбор процедуры кластеризации
- •24. Двухэтапный кластерный анализ
- •Параметры процедуры Двухэтапный кластерный анализ
- •Вывод процедуры Двухэтапный кластерный анализ
- •Средство просмотра кластеров
- •Закладка Средство просмотра кластеров
- •Перемещение по средству просмотра кластеров
- •Фильтрация записей
- •25. Иерархический кластерный анализ
- •Задание метода иерархического кластерного анализа
- •Статистики для процедуры Иерархический кластерный анализ
- •Графики для процедуры Иерархический кластерный анализ
- •Сохранение новых переменных в процедуре Иерархический кластерный анализ
- •Эффективность кластерного анализа методом k-средних
- •Итерации в кластерном анализе методом k-средних
- •Сохранение новых переменных в кластерном анализе методом k-средних
- •Параметры процедуры Кластерный анализ методом К-средних
- •Команда QUICK CLUSTER: дополнительные возможности
- •27. Непараметрические критерии
- •Одновыборочные непараметрические критерии
- •Чтобы получить одновыборочные непараметрические критерии
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для независимых выборок
- •Чтобы получить непараметрические критерии для независимых выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для связанных выборок
- •Чтобы применить непараметрические критерии для связанных выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Представление модель
- •Сводка по проверке гипотез
- •Сводка по доверительным интервалам
- •Одновыборочный критерий
- •Критерии для связанных выборок
- •Критерий для независимых выборок
- •Информация по категориальным полям
- •Информация по количественным полям
- •Парные сравнения
- •Однородные подмножества
- •Команда NPTESTS: дополнительные возможности
- •Устаревшие диалоговые окна
- •Критерий хи-квадрат
- •Биномиальный критерий
- •Критерий серий
- •Одновыборочный критерий Колмогорова-Смирнова
- •Критерии для двух независимых выборок
- •Критерии для двух связанных выборок
- •Критерии для нескольких независимых выборок
- •Критерии для нескольких связанных выборок
- •28. Анализ множественных ответов
- •Задание наборов множественных ответов
- •Частоты для множественных ответов
- •Таблицы сопряженности для множественных ответов
- •Задание диапазонов переменных в таблицах сопряженности для наборов множественных ответов
- •Параметры процедуры Таблицы сопряженности для множественных ответов
- •Команда MULT RESPONSE: дополнительные возможности
- •29. Создание отчетов
- •Итоги по строкам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по строкам
- •Параметры группировки отчета
- •Параметры отчета
- •Компоновка отчета
- •Заголовки отчета
- •Итоги по столбцам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по столбцам
- •Итожащие функции столбцов данных
- •Формат столбцов отчета
- •Параметры группировки отчета с итогами по столбцам
- •Параметры отчета для итогов по столбцам
- •Компоновка отчета с итогами по столбцам
- •Команда REPORT: дополнительные возможности
- •30. Анализ пригодности
- •Статистики процедуры Анализ пригодности
- •Команда RELIABILITY: дополнительные возможности
- •31. Многомерное шкалирование
- •Многомерное шкалирование: Форма данных
- •Создание меры для многомерного шкалирования
- •Модель многомерного шкалирования
- •Параметры процедуры Многомерное шкалирование
- •Команда ALSCAL: дополнительные возможности
- •32. Статистики отношений
- •Статистики отношений
- •33. Кривые ROC
- •Параметры процедуры ROC Кривые
- •Указатель
Глава
Подгонка кривых
18
Процедура Подгонка кривых позволяет вычислять статистики и строить сопутствующие графики для 11 различных регрессионных моделей оценки кривых. Для каждой зависимой переменной будет построена отдельная модель. Вы также можете сохранять предсказанные значения, остатки и интервалы прогноза в виде новых переменных.
Пример. Провайдер услуг Интернета отслеживает во времени процент зараженного вирусом почтового трафика в своих сетях. Диаграмма рассеивания обнаруживает нелинейную зависимость. Вы можете подогнать к данным квадратичную или кубическую модель, а также проверить выполнение предположений модели и степень ее согласия.
Статистики. Для каждой модели: коэффициенты регрессии, множественный коэффициент R, R2, скорректированный R2, стандартная ошибка оценки, таблица дисперсионного анализа, предсказанные значения, остатки и интервалы прогноза. Модели: линейная, логарифмическая, обратная, квадратичная, кубическая, степенная, составная, S-кривая, логистическая, роста и экспоненциальная.
Данные.Зависимая и независимые переменные должны быть количественными. Если в качестве независимой переменной выбрано Время, а не переменная из активного набора данных, процедура Подгонка кривых создаст переменную типа время с одинаковыми временными интервалами между наблюдениями. Если выбрано Время , то зависимая переменная должна представлять собой временной ряд. Для анализа временных рядов необходима такая структура файла данных, в которой каждое наблюдение (строка) представляет набор измерений, сделанных в момент времени, отличный от моментов времени других наблюдений, с одинаковыми интервалами времени между соседними наблюдениями.
Предположения. Данные проверяются в графическом режиме, чтобы определить, как связаны между собой независимая и зависимая переменные (линейно, экспоненциально
ит.д.). Остатки для хорошей модели должны быть распределены случайным образом
иподчиняться нормальному распределению. При использовании линейной модели необходимо выполнение следующих условий: Для каждого значения независимой переменной распределение зависимой переменной должно быть нормальным. Дисперсия распределения зависимой переменной должна быть постоянной для каждого значения независимой переменной. Взаимосвязь между зависимой и независимой переменными должна быть линейной, а все наблюдения должны быть независимыми.
Как запустить процедуру Подгонка кривых
E Выберите в меню:
Анализ > Регрессия > Подгонка кривых...
© Copyright IBM Corporation 1989, 2011. |
128 |
129
Подгонка кривых
Рисунок 18-1
Диалоговое окно Подгонка кривых
EВыберите одну или несколько зависимых переменных. Для каждой зависимой переменной будет построена отдельная модель.
E Выберите независимую переменную (либо переменную из активного набора данных, либо
Время).
EДополнительно можно:
Выбрать переменную, значения которой задают метки наблюдений в диаграммах рассеяния. Для каждой точки на диаграмме рассеяния использовать инструмент Идентификатор точек, чтобы вывести значение переменной, помещенной в поле Метки наблюдений.
Щелкнуть мышью по кнопке Сохранить, чтобы сохранить предсказанные значения, остатки и интервалы прогноза в качестве новых переменных.
Доступны также следующие параметры:
Включить в уравнение константу. Выполняется оценка свободного члена в уравнении регрессии. Свободный член включается в уравнение по умолчанию.
Графики моделей. Для каждой выбранной модели выводится график значений зависимой переменной от значений независимой переменной. Для каждой зависимой переменной выводится отдельный график.
Вывести таблицу дисперсионного анализа. Для каждой выбранной модели выводится сводная таблица дисперсионного анализа.
130
Глава 18
Модели подгонки кривых
Вы можете выбрать одну или несколько регрессионных моделей подгонки кривых. Чтобы определить, какую модель использовать, выведите данные графически. Если окажется, что переменные связаны линейно, используйте простую модель линейной регрессии. Если переменные не являются связанными линейно, попробуйте преобразовать Ваши данные. Если преобразование не поможет, то, возможно, необходимо применение более сложной модели. Посмотрите на диаграмму рассеяния данных. Если диаграмма напоминает известную Вам математическую функцию, используйте модель соответствующего типа для подгонки к данным. Например, если данные на диаграмме напоминают экспоненту, используйте экспоненциальную модель.
Линейная. Модель, задаваемая уравнением Y = b0 + (b1 * t). Значения ряда моделируются линейной функцией времени.
Логарифмическая. Модель с уравнением Y = b0 + (b1 * ln(t)). Обратная. Модель, задаваемая уравнением Y = b0 + (b1 / t).
Квадратичная. Модель, задаваемая уравнением Y = b0 + (b1 * t) + (b2 * t**2). Квадратичная модель может применяться в качестве одной из альтернатив линейной модели, например, когда в ограниченном диапазоне значений наблюдается рост, более быстрый, чем линейный.
Кубическая. Модель, определяемая уравнением Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3). Степень. Модель с уравнением Y = b0 * (t**b1) или ln(Y) = ln(b0) + (b1 * ln(t)). Составная. Модель, задаваемая уравнением Y = b0 * (b1**t) или ln(Y) = ln(b0) + (ln(b1) * t). S-кривая. Модель, задаваемая уравнением Y = e**(b0 + (b1/t)) или ln(Y) = b0 + (b1/t).
Логистическая. Модель с уравнением Y = 1 / (1/u + (b0 * (b1**t))) или ln(1/Y - 1/u) = ln(b0) + (ln(b1) * t)) , где u есть ограничение сверху. Выбрав Логистическая, задайте границу сверху, которая будет использоваться в регрессионном уравнении. Это значение должно быть положительным числом, превышающим максимальное значение зависимой переменной.
Роста. Модель, задаваемая уравнением Y = e**(b0 + (b1 * t)) или ln(Y) = b0 + (b1 * t).
Экспоненциальная. Модель, задаваемая уравнением Y = b0 * (e**(b1 * t)) или ln(Y) = ln(b0) + (b1 * t).
131
Подгонка кривых
Подгонка кривых: Сохранить
Рисунок 18-2
Диалоговое окно Подгонка кривых: Сохранить
Сохранить переменные. Для каждой выбранной модели можно сохранить предсказанные значения, остатки (наблюденное значение зависимой переменной минус значение, предсказанные моделью) и интервалы прогноза (верхние и нижние границы). Имена и описательные метки новых переменных отображаются в таблице в окне вывода.
Прогноз для наблюдений. Если Вы выбрали Время, а не переменную из активного набора данных в качестве независимой переменной, Вы можете задать период прогноза за концом временного ряда. Вы можете выбрать одну из следующих альтернатив:
Прогноз до последнего наблюдения. Предсказывает значения для всех наблюдений в файле по наблюдениям из периода оценивания. Период оценивания, отображаемый внизу диалогового окна, задается при помощи диалогового окна Отобрать наблюдения: Диапазон, вызываемого из диалогового окна Отбор наблюдений (меню Данные, Отбор наблюдений). Если период оценивания не задан, для предсказания значений используются все наблюдения.
Прогноз до. Прогнозирует значения до заданной даты, времени или номера наблюдения, на основании наблюдений за период оценивания. Эта альтернатива позволяет прогнозировать значения после последнего наблюдения временного ряда. То, какие поля доступны для задания конца интервала прогнозирования, зависит от того, какие переменные дат существуют в данных. Если переменные дат не заданы, Вы можете указать номер последнего наблюдения.
Для создания переменных дат используйте пункт Задать данные в меню Данные.