Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Кондрашов ВСЕ.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
11.52 Mб
Скачать

Упрощенный Метод Байеса

Этот метод вычисляет условную вероятность между входными и прогнозируемыми столбцами в предположении, что столбцы являются независимыми. Это предположение независимости и лежит в основе названия "упрощенный Байес", поскольку предположение является наивным с той точки зрения, что алгоритм не учитывает возможные зависимости.

Данный алгоритм требует меньшего количества вычислений, чем другие алгоритмы анализа данных, и является полезным для быстрого формирования моделей для обнаружения отношений между входными и прогнозируемыми столбцами. Этот алгоритм можно использовать для первоначального исследования данных, а затем применять результаты для создания дополнительных моделей интеллектуального анализа с другими алгоритмами, требующими большего количества вычислений и являющимися более точными.

Упрощенный алгоритм Байеса рассчитывает вероятность состояния каждого входного столбца при каждом возможном состоянии прогнозируемого столбца.

Средство просмотра результатов работы упрощенного алгоритма Байеса содержит список всех входных столбцов в наборе данных и показывает, как распределены значения входных столбцов в зависимости от значений прогнозируемого столбца. Это представление можно использовать для идентификации входных столбцов, важных для дифференциации различных состояний прогнозируемого столбца.

В качестве примера использования метода можно привести следующее. Отдел маркетинга некоторой компании решил разослать рекламные материалы потенциальным клиентам. Чтобы снизить себестоимость, нужно рассылать рекламные материалы только тем клиентам, которые, вероятно, ответят. Компания хранит в базе данных демографические данные и сведения об ответах на предыдущие рассылки рекламных материалов. Необходимо использовать эти данные для определения возможности применения таких демографических показателей, как возраст и место проживания, для прогнозирования ответа на рекламную кампанию путем сравнения потенциальных клиентов с клиентами, которые обладают подобными характеристиками и которые осуществляли покупки в компании в прошлом. Необходимо определить различия между теми клиентами, которые купили продукцию компании, и теми, которые не купили.

Используя упрощенный алгоритм Байеса, отдел маркетинга может быстро спрогнозировать результат для конкретного профиля клиентов и определить, какие клиенты наиболее вероятно ответят на рекламные материалы. Используя средство просмотра результатов работы упрощенного алгоритма Байеса, можно исследовать, какие конкретные входные столбцы способствуют положительному ответу на рекламные материалы.

Исходные данные для использования упрощенного метода Байеса должны содержать ключевой столбец, входные столбцы и один прогнозируемый столбец. Все столбцы должны быть дискретными (в наборе инструментов интеллектуального анализа имеется специальный механизм для дискретизации данных, см. далее).

В таблице перечислены конкретные типы содержимого входных столбцов и прогнозируемых столбцов, поддерживаемые упрощенным алгоритмом Байеса.

Типы содержимого входных столбцов

Циклические, дискретные, дискретизированные, ключевые, табличные и упорядоченные

Типы содержимого прогнозируемых столбцов

Циклические, дискретные, дискретизированные, табличные и упорядоченные