Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
InfIntSys-09Conspect_add.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
3.64 Mб
Скачать

Упрощенный алгоритм Байеса (Microsoft)

Упрощенный алгоритм Байеса Microsoft вычисляет условную вероятность между входными и прогнозируемыми столбцами и предполагает, что столбцы являются независимыми. Это предположение независимости и лежит в основе названия «упрощенный Байес», поскольку предположение является наивным с той точки зрения, что алгоритм не учитывает возможные зависимости.

Данный алгоритм требует меньшего количества вычислений, чем другие алгоритмы Microsoft, и является полезным для быстрого формирования моделей интеллектуального анализа для обнаружения отношений между входными и прогнозируемыми столбцами. Этот алгоритм можно использовать для первоначального исследования данных, а затем применять результаты для создания дополнительных моделей интеллектуального анализа с другими алгоритмами, требующими большего количества вычислений и являющимися более точными.

Пример

Продолжая стратегию продвижения, отдел маркетинга компании Adventure Works Cycle решил разослать листовки потенциальным клиентам. Чтобы снизить себестоимость, было принято решение рассылать листовки только тем клиентам, которые, вероятно, ответят. Компания хранит в базе данных демографические данные и сведения об ответах на предыдущие рассылки. Необходимо использовать эти данные для определения возможности применения таких демографических показателей, как возраст и место проживания, для прогнозирования ответа на рекламную кампанию путем сравнения потенциальных клиентов с клиентами, которые обладают подобными характеристиками и которые осуществляли покупки в компании в прошлом. Необходимо определить различия между теми клиентами, которые купили велосипед, и теми, которые не купили.

Используя упрощенный алгоритм Байеса Microsoft, отдел маркетинга может быстро спрогнозировать результат для конкретного профиля клиентов и определить, какие клиенты наиболее вероятно ответят на листовки. Используя средство просмотра упрощенного алгоритма Байеса Microsoft в среде Business Intelligence Development Studio, они могут визуально исследовать, какие конкретные входные столбцы способствуют положительному ответу на листовки.

Принцип работы алгоритма

Упрощенный алгоритм Байеса Microsoft рассчитывает вероятность состояния каждого входного столбца при каждом возможном состоянии прогнозируемого столбца. Можно использовать средство просмотра упрощенного алгоритма Байеса Microsoft в среде Business Intelligence Development Studio, чтобы просмотреть визуальное представление распределения алгоритмом состояния, как показано на следующем графике.

Рис.7. Результаты применения упрощенного алгоритма Байеса к исследуемым данным.

Средство просмотра упрощенного алгоритма Байеса Microsoft содержит список всех входных столбцов в наборе данных и показывает, как распределены состояния каждого из столбцов при каждом состоянии прогнозируемого столбца. Это представление можно использовать для идентификации входных столбцов, важных для дифференциации различных состояний прогнозируемого столбца. Например, в столбце «Расстояние до работы», показанном здесь, вероятность, что клиент купит велосипед, равна 0,387, если расстояние до его работы составляет от одной до двух миль. В то время как вероятность того, что он не купит велосипед, составляет 0,287, если он добирается до работы. В данном примере алгоритм использует числовые данные, полученные из характеристик клиентов, например расстояния до работы, для прогнозирования того, купит ли клиент велосипед.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]