Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
168
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

Глава

Подгонка кривых

18

Процедура Подгонка кривых позволяет вычислять статистики и строить сопутствующие графики для 11 различных регрессионных моделей оценки кривых. Для каждой зависимой переменной будет построена отдельная модель. Вы также можете сохранять предсказанные значения, остатки и интервалы прогноза в виде новых переменных.

Пример. Провайдер услуг Интернета отслеживает во времени процент зараженного вирусом почтового трафика в своих сетях. Диаграмма рассеивания обнаруживает нелинейную зависимость. Вы можете подогнать к данным квадратичную или кубическую модель, а также проверить выполнение предположений модели и степень ее согласия.

Статистики. Для каждой модели: коэффициенты регрессии, множественный коэффициент R, R2, скорректированный R2, стандартная ошибка оценки, таблица дисперсионного анализа, предсказанные значения, остатки и интервалы прогноза. Модели: линейная, логарифмическая, обратная, квадратичная, кубическая, степенная, составная, S-кривая, логистическая, роста и экспоненциальная.

Данные.Зависимая и независимые переменные должны быть количественными. Если в качестве независимой переменной выбрано Время, а не переменная из активного набора данных, процедура Подгонка кривых создаст переменную типа время с одинаковыми временными интервалами между наблюдениями. Если выбрано Время , то зависимая переменная должна представлять собой временной ряд. Для анализа временных рядов необходима такая структура файла данных, в которой каждое наблюдение (строка) представляет набор измерений, сделанных в момент времени, отличный от моментов времени других наблюдений, с одинаковыми интервалами времени между соседними наблюдениями.

Предположения. Данные проверяются в графическом режиме, чтобы определить, как связаны между собой независимая и зависимая переменные (линейно, экспоненциально

ит.д.). Остатки для хорошей модели должны быть распределены случайным образом

иподчиняться нормальному распределению. При использовании линейной модели необходимо выполнение следующих условий: Для каждого значения независимой переменной распределение зависимой переменной должно быть нормальным. Дисперсия распределения зависимой переменной должна быть постоянной для каждого значения независимой переменной. Взаимосвязь между зависимой и независимой переменными должна быть линейной, а все наблюдения должны быть независимыми.

Как запустить процедуру Подгонка кривых

E Выберите в меню:

Анализ > Регрессия > Подгонка кривых...

© Copyright IBM Corporation 1989, 2011.

128

129

Подгонка кривых

Рисунок 18-1

Диалоговое окно Подгонка кривых

EВыберите одну или несколько зависимых переменных. Для каждой зависимой переменной будет построена отдельная модель.

E Выберите независимую переменную (либо переменную из активного набора данных, либо

Время).

EДополнительно можно:

Выбрать переменную, значения которой задают метки наблюдений в диаграммах рассеяния. Для каждой точки на диаграмме рассеяния использовать инструмент Идентификатор точек, чтобы вывести значение переменной, помещенной в поле Метки наблюдений.

Щелкнуть мышью по кнопке Сохранить, чтобы сохранить предсказанные значения, остатки и интервалы прогноза в качестве новых переменных.

Доступны также следующие параметры:

Включить в уравнение константу. Выполняется оценка свободного члена в уравнении регрессии. Свободный член включается в уравнение по умолчанию.

Графики моделей. Для каждой выбранной модели выводится график значений зависимой переменной от значений независимой переменной. Для каждой зависимой переменной выводится отдельный график.

Вывести таблицу дисперсионного анализа. Для каждой выбранной модели выводится сводная таблица дисперсионного анализа.

130

Глава 18

Модели подгонки кривых

Вы можете выбрать одну или несколько регрессионных моделей подгонки кривых. Чтобы определить, какую модель использовать, выведите данные графически. Если окажется, что переменные связаны линейно, используйте простую модель линейной регрессии. Если переменные не являются связанными линейно, попробуйте преобразовать Ваши данные. Если преобразование не поможет, то, возможно, необходимо применение более сложной модели. Посмотрите на диаграмму рассеяния данных. Если диаграмма напоминает известную Вам математическую функцию, используйте модель соответствующего типа для подгонки к данным. Например, если данные на диаграмме напоминают экспоненту, используйте экспоненциальную модель.

Линейная. Модель, задаваемая уравнением Y = b0 + (b1 * t). Значения ряда моделируются линейной функцией времени.

Логарифмическая. Модель с уравнением Y = b0 + (b1 * ln(t)). Обратная. Модель, задаваемая уравнением Y = b0 + (b1 / t).

Квадратичная. Модель, задаваемая уравнением Y = b0 + (b1 * t) + (b2 * t**2). Квадратичная модель может применяться в качестве одной из альтернатив линейной модели, например, когда в ограниченном диапазоне значений наблюдается рост, более быстрый, чем линейный.

Кубическая. Модель, определяемая уравнением Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3). Степень. Модель с уравнением Y = b0 * (t**b1) или ln(Y) = ln(b0) + (b1 * ln(t)). Составная. Модель, задаваемая уравнением Y = b0 * (b1**t) или ln(Y) = ln(b0) + (ln(b1) * t). S-кривая. Модель, задаваемая уравнением Y = e**(b0 + (b1/t)) или ln(Y) = b0 + (b1/t).

Логистическая. Модель с уравнением Y = 1 / (1/u + (b0 * (b1**t))) или ln(1/Y - 1/u) = ln(b0) + (ln(b1) * t)) , где u есть ограничение сверху. Выбрав Логистическая, задайте границу сверху, которая будет использоваться в регрессионном уравнении. Это значение должно быть положительным числом, превышающим максимальное значение зависимой переменной.

Роста. Модель, задаваемая уравнением Y = e**(b0 + (b1 * t)) или ln(Y) = b0 + (b1 * t).

Экспоненциальная. Модель, задаваемая уравнением Y = b0 * (e**(b1 * t)) или ln(Y) = ln(b0) + (b1 * t).

131

Подгонка кривых

Подгонка кривых: Сохранить

Рисунок 18-2

Диалоговое окно Подгонка кривых: Сохранить

Сохранить переменные. Для каждой выбранной модели можно сохранить предсказанные значения, остатки (наблюденное значение зависимой переменной минус значение, предсказанные моделью) и интервалы прогноза (верхние и нижние границы). Имена и описательные метки новых переменных отображаются в таблице в окне вывода.

Прогноз для наблюдений. Если Вы выбрали Время, а не переменную из активного набора данных в качестве независимой переменной, Вы можете задать период прогноза за концом временного ряда. Вы можете выбрать одну из следующих альтернатив:

Прогноз до последнего наблюдения. Предсказывает значения для всех наблюдений в файле по наблюдениям из периода оценивания. Период оценивания, отображаемый внизу диалогового окна, задается при помощи диалогового окна Отобрать наблюдения: Диапазон, вызываемого из диалогового окна Отбор наблюдений (меню Данные, Отбор наблюдений). Если период оценивания не задан, для предсказания значений используются все наблюдения.

Прогноз до. Прогнозирует значения до заданной даты, времени или номера наблюдения, на основании наблюдений за период оценивания. Эта альтернатива позволяет прогнозировать значения после последнего наблюдения временного ряда. То, какие поля доступны для задания конца интервала прогнозирования, зависит от того, какие переменные дат существуют в данных. Если переменные дат не заданы, Вы можете указать номер последнего наблюдения.

Для создания переменных дат используйте пункт Задать данные в меню Данные.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]