Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MC-91(Зуйкова) / IBM_SPSS_Statistics_Core_System_Users_Guide.pdf
Скачиваний:
157
Добавлен:
08.02.2015
Размер:
6.76 Mб
Скачать

283

Модели

Рисунок 12-2

Выбор полей на основе важности

Максимальное количество выбираемых переменных. Наиболее важные предикторы включаются и исключаются на основе указанного количества.

важность больше чем. Включает и исключает все предикторы с относительной важностью большей указанного значения.

E После нажатия OK появится диалоговое окно Новый набор данных.

Рисунок 12-3

Выбор полей: Новый набор данных

Имя набора данных: Укажите допустимое имя набора данных. Наборы данных доступны для последующего использования в том же сеансе но не сохраняются как файлы до тех пор, пока они не будут сохранены явно до окончания текущего сеанса. Имена наборов данных должны удовлетворять требованиям к именам переменных. Дополнительную информацию см. данная тема Имена переменных в Данная глава 5 на стр. 79.

Модели для ансамблей

Модель для ансамбля предоставляет информацию о моделях компонентов в ансамбле и эффективности ансамбля как единого целого.

284

Глава 12

Рисунок 12-4

Вид Сводка для модели

Главная (независимая от вида) панель инструментов позволяет выбирать, использовать ли для скоринга ансамбль или опорную модель. Если для скоринга используется ансамбль, то можно также выбрать правило объединения. Эти изменения не требуют повторного выполнения модели, однако эти варианты выбора сохраняются в модели для скоринга и/или нисходящего анализа модели. Они также влияют на PMML, экспортируемый из средства просмотра ансамблей.

Правило объединения. Это правило, которое применяется при скоринге ансамбля, чтобы объединить предсказанные значения для базовых моделей с целью вычисления значения скоринга для ансамбля.

Предсказанные значения для ансамбля в случае категориальных целевых переменных можно объединить, используя голосование, наибольшую вероятность или наибольшую среднюю вероятность. Голосование позволяет выбрать категорию, которая наиболее часто имеет наибольшую вероятность в базовых моделях. Наибольшая вероятность позволяет выбрать категорию, которая имеет наибольшую вероятность среди всех базовых моделей. Наибольшая средняя вероятность позволяет выбрать категорию,

285

Модели

которая имеет наибольшую вероятность при усреднении вероятностей категорий по базовым моделям.

Предсказанные значения для ансамбля в случае непрерывных целевых переменных можно объединить, используя среднее или медиану предсказанных значений для базовых моделей

Выбор по умолчанию основывается на спецификациях заданных во время построения моделей. Изменение правила объединения приводит к пересчету точности моделей и обновлению всех изображений точности моделей. Обновляется также диаграмма

важностей предикторов. Этот элемент управления недоступен, если для скоринга выбрана опорная модель.

Показать все правила объединения. Если выбран этот пункт, то на диаграмме качества модели выводятся результаты для всех имеющихся правил объединения. Также обновляется диаграмма точности моделей компонентов, чтобы показать опорные линии для каждого метода голосования.

286

Глава 12

Сводка для модели

Рисунок 12-5

Вид Сводка для модели

Вид Сводка для модели — это мгновенная визуальная сводка качества и разнородности ансамбля.

Качество. Эта диаграмма выводит точность окончательной модели в сравнении с опорной моделью и наивной моделью. Точность представляется в формате “больше значит лучше”; “наилучшая” модель будет иметь наибольшую точность. Для категориальной целевой переменной точность - это просто процент записей, для которых предсказанное значение совпадает с наблюденным значением. Для непрерывной целевой переменной точность - это 1 минус отношение средней абсолютной ошибки предсказания (среднего абсолютных значений разностей предсказанных и наблюденных значений) к диапазону предсказанных значений (разности максимального и минимального предсказанных значений).