Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Финансовый университет при Правительстве РФ

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Кондрашов ВСЕ.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

11.52 Mб

Скачать

☆

<<< < Предыдущая 9 10 11 12 13 14 15 16 17 18 19 2021 / 5121 22 23 24 25 26 27 28 29 30 31 32 33 > Следующая >>>

Панель Точность и правильность

Панель Точность и правильность (рисунок 152) предоставляет следующие инструменты для измерения качества и точности созданных моделей:

Диаграмма точности - выполняет прогнозы по модели и сравнивает результаты с теми данными, для которых имеются ответы.
Диаграмма роста прибыли - выполняет ту же задачу, что и диаграмма точности, однако она позволяет также указать информацию по издержкам и доходам, чтобы найти точку максимальной прибыли.
Матрица классификации (матрица неточностей) - показывает, сколько раз алгоритм прогнозирует результаты правильно и что он прогнозирует, когда ошибается.

Рисунок 152

Диаграмма точности.

При реальном построении модели (обучении) желательно зарезервировать некоторое количество данных для проверки. Использование для проверки тех же самых данных, которые применялись для обучения модели, может привести к тому, что модель будет вести себя лучше, чем она есть на самом деле.

Чтобы использовать диаграмму точности, необходимо указать некоторые исходные данные, которые будут применяться для проверки.

В общем случае проверочные данные должны быть структурно аналогичны тем данным, которые были использованы для обучения моделей, и должны иметь те же самые статистические свойства, что и обучающие данные. Простейший способ использования диаграммы точности — это применение ее к зарезервированным данным, которые являются часть исходных данных.

Для использования диаграммы точности с другим набором данных (внешним) необходимо выбрать исходные таблицы и привязать их к структуре анализа. Если столбцы таблиц имеют одинаковые названия, то это делается автоматически при выборе таблиц.

После того как выбраны таблицы и произведена привязка, можно также отфильтровать варианты. Это можно сделать в том случае, когда есть специфический столбец, в котором указано, предназначен ли данный вариант для обучения или проверки или просто для тестирования (например, как модель ведет себя для определенных групп населения).

Далее выбирается прогнозируемый параметр, и (не обязательно) значение, на которое проверяется прогнозируемый параметр.

По умолчанию диаграмма точности выбирает один и тот же столбец и значение для каждой модели структуры. Однако можно также одновременно проверять и другие столбцы. Например, если есть разные дискретизации в разных моделях, то возможно проверить, насколько прогнозирование для некоторого атрибута с пятью сегментами отличается от прогнозирования с семью сегментами.

Тип получаемой диаграммы зависит от того, является ли прогнозируемый параметр непрерывным или дискретным, а также от того, выбирается ли конкретное значение прогнозируемого параметра.

Когда выбирается дискретный прогнозируемый параметр и задается его целевое значение, то выдается стандартная диаграмма точности прогнозов. Стандартная диаграмма точности прогнозов всегда содержит одну линию для выбранной модели и две дополнительных линии: идеальную линию и случайную линию.

Верхняя идеальная линия показывает, что идеальная модель соответствовала бы 100 процентам значений при использовании некоторого процента данных (соответствующего процента данных, для которых имеется соответствие значению прогнозируемой переменной).

Нижняя линия — это случайная линия. Эта линия всегда идет по диаграмме под углом в 45 градусов. Это означает, что если бы случайным образом угадывался результат для каждого варианта, то прогнозировали бы 50 процентов значений при помощи 50 процентов данных.

Линия модели проходит в середине (если модель хорошая, то она всегда будет выше случайной линии).

Если линия модели находится близко от случайной линии, то это означает, что в обучающих данных не было достаточно информации для выявления шаблонов задачи.

Наиболее просто интерпретировать стандартную диаграмму точности для конкретного целевого значения можно следующим образом. Предположим, что модель используется для кампании прямого маркетинга. Выдаваемый моделью прогноз для выбранного целевого значения — это прогноз того, что клиент откликнется на маркетинговую кампанию. Поскольку цель моделирования — получить как можно больше откликов, то естественно отсортировать потенциальных клиентов по порядку убывания вероятности, возвращенному моделью. Предположим, что в списке 1000 потенциальных клиентов и известно, что 200 из этих клиентов (20%) реагируют на кампанию позитивно. При сортировке клиентов по вероятности отклика идеальная модель поместит этих 200 клиентов в верхнюю часть списка. Реальная модель даст некоторое количество неверных прогнозов и разместит некоторых плохих клиентов слишком высоко в этом списке.

На первом шаге построения диаграммы точности выбирается модель (рисунок 153). В примере используется модель классификации на основе дерева решений, определяющая предпочтения клиентов к покупке определенного товара.

Рисунок 153

На следующем шаге выбирается прогнозируемый столбец (покупка товара) и прогнозируемое значение (No, рисунок 154).

Рисунок 154

Задается таблица поверочных данных (рис. 155).

Рисунок 155

Производится привязка столбцов таблицы к структуре анализа (рис. 156).

Рисунок 156

Полученная диаграмма точности показана на рисунке .

Рисунок 157

Диаграммы точности можно использовать для сравнения качества различных моделей. На рисунке 158 показана диаграмма точности модели классификации для тех же данных, полученная алгоритмом нейронной сети. Видно, что модель на основе нейронной сети лучше.

Рисунок 158

<<< < Предыдущая 9 10 11 12 13 14 15 16 17 18 19 2021 / 5121 22 23 24 25 26 27 28 29 30 31 32 33 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.03.20161.67 Mб383комплект индивидуальных заданий.docx
#
18.08.2019207.87 Кб36Компьютерные вирусы.doc
#
01.04.202573.73 Кб3кон и рев.doc
#
01.05.202548.34 Кб8КОН – НиН - Тема 11 - Налоговые правонарушения...docx
#
01.07.2025221.3 Кб3Кондратьев.docx
#
01.05.202511.52 Mб8Кондрашов ВСЕ.doc
#
01.03.2025833.02 Кб2конечный вариант курсовой.doc
#
13.03.2015485.49 Кб55Конкуренция.rtf
#
17.09.2019581.12 Кб59Конспект заочники.doc
#
21.07.2019200.7 Кб35конспект для зачета ГП.doc
#
01.07.2025151.13 Кб5Конспект лекций АФО .docx