Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MC-91(Зуйкова) / IBM_SPSS_Statistics_Core_System_Users_Guide.pdf
Скачиваний:
158
Добавлен:
08.02.2015
Размер:
6.76 Mб
Скачать

Глава

Скоринг данных с использованием прогнозных моделей

15

Процесс применения прогнозной модели к набору данных называется скорингом данных. В IBM® SPSS® Statistics имеются процедуры для построения прогнозных моделей, таких как модели регрессии, кластеризации, деревьев и нейронных сетей. После того как модель построена, спецификации этой модели можно сохранить в файле, который содержит всю информацию, необходимую для реконструирования модели. Затем этот файл модели можно использовать, чтобы сгенерировать предсказанные значения для других наборов данных. (Примечание: Некоторые модели создают XML-файл модели, а некоторые процедуры

- ZIP-файл архива.)

Пример. Отдел прямого маркетинга компании использует результаты пробной рассылки, чтобы приписать значения склонности к совершению покупки субъектам остальной части контактной базы данных, используя при этом различные демографические характеристики, с тем чтобы выявить тех, кто с наибольшей вероятностью откликнется на предложение и совершит покупку.

Скоринг можно рассматривать как преобразование данных. Модель представляет собой числовые преобразования, применяемые к определенным полям (переменным) – предикторам, заданным в модели, чтобы в результате получить прогнозные значения. В

этом отношении процесс скоринга данных для имеющейся модели аналогичен применению какой-либо функции к набору данных, например, функции извлечения квадратного корня.

Процесс скоринга состоит из двух основных этапов:

EПостроение модели и ее сохранение в файле. Модель строится с использованием набора данных, для которого известны значения интересующей переменной (часто называемой целевой). Например, если необходимо построить модель, чтобы предсказать, кто откликнется на кампанию прямой рассылки, нужно начать с набора данных, который уже содержит информацию о том, кто откликнулся, а кто нет. Например, он может быть результатом пробной рассылки небольшой группе клиентов или информацией об откликах для аналогичной кампании, проводившейся ранее.

Примечание: Для некоторых типов моделей целевая переменная отсутствует. Например, модели кластеризации и некоторые модели ближайших соседей не имеют целевой переменной.

EПрименение построенной модели к другому набору данных (для которого неизвестны значения целевой переменной), чтобы получить прогнозные значения целевой переменной. Дополнительную информацию см. данная тема Конструктор скоринга на стр. 324.

© Copyright IBM Corporation 1989, 2011.

323