Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MC-91(Зуйкова) / IBM_SPSS_Statistics_Core_System_Users_Guide.pdf
Скачиваний:
158
Добавлен:
08.02.2015
Размер:
6.76 Mб
Скачать

287

Модели

Для ансамблей, созданных с помощью бэггинга, опорная модель - это стандартная модель, построенная по всему обучающему разбиению. Для ансамблей, созданных с помощью бустинга, опорная модель - это первая компонентная модель.

Наивная модель представляет точность в случае, когда модель не была построена, и относит все записи к модальной категории. Наивная модель не вычисляется для непрерывных целевых переменных.

Разнородность. Эта диаграмма выводит “разброс мнений” среди моделей компонент, используемых для построения ансамбля, представленный в формате “больше значит более разнородный”. Это есть мера того, насколько сильно предсказания различаются в базовых моделях. Разнородность недоступна для моделей ансамблей, созданных с помощью бустинга, и также не выводится для непрерывных целевых переменных.

Важность предикторов

Рисунок 12-6

Вид Важность предикторов

Обычно при моделировании сосредотачивают внимание на наиболее важных предикторах и исключают или игнорируют наименее важные. Это помогает сделать диаграмма важности предикторов, показывая относительную важность каждого предиктора при оценке модели. Поскольку значения важности являются относительными, сумма этих значений для всех отображаемых предикторов равна 1,0. Важность переменных не связана с точностью

288

Глава 12

модели. Она лишь связана с важностью каждого предиктора для предсказания, а не с точностью этого предсказания.

Важность предикторов недоступна для всех моделей ансамблей. Набор предикторов может варьироваться по моделям компонентов, но важность может быть вычислена для предикторов, используемых, по крайней мере, в одной модели компонента.

Частота предикторов

Рисунок 12-7

Вид Частота предикторов

Набор предикторов может варьироваться по моделям компонентов в силу выбора метода моделирования или выбора предикторов. Диаграмма частоты предикторов представляет собой точечную диаграмму, показывающую распределение предикторов по моделям компонент в ансамбле. Каждая точка представляет одну или несколько моделей компонент содержащих конкретный предиктор. Предикторы изображаются графически вдоль оси y и сортируются в порядке убывания частоты; таким образом, самый верхний предиктор - это тот, который используется в наибольшем числе моделей компонент, а самый нижний - это тот, который был использован в наименьшем числе моделей. Показываются 10 верхних предикторов.

Предикторы, которые используются наиболее часто, обычно являются наиболее важными. Эта диаграмма бесполезна для методов, в которых набор предикторов не может меняться по моделям компонентов.

289

Модели

Точность моделей компонентов

Рисунок 12-8

Вид Точность моделей компонентов

Данная диаграмма является точечной диаграммой точности предсказания для моделей компонентов. Каждая точка представляет одну или несколько моделей компонентов с уровнем точности, изображенном графически вдоль оси y. Наведите указатель мыши на любую точку, чтобы получить информацию о соответствующей отдельной модели компонента.

Опорные линии. Диаграмма показывает кодированные цветом линии для ансамблей, а также опорную модель и наивные модели. Рядом с линией, соответствующей модели, которая будет использована для скоринга, стоит флажок.

Интерактивность. Диаграмма обновится, если изменить правило объединения.

Ансамбли, созданные с помощью бустинга. Для ансамблей, созданные с помощью бустинга, выводится диаграмма с линиями.

290

Глава 12

Рисунок 12-9

Вид Точность ансамбля; ансамбль,созданный с помощью бустинга