Алгоритм максимизации ожидания (EM) отдельным модулем / MyEM / EMhelp
.docДанный модуль представляет собой реализацию алгоритма кластеризации Expectation Maximization (EM), предоставляющую пользователю разбить вектора исходных данных по нескольким независимым группам (кластерам). Алгоритм работает только с численными атрибутами и только, если все их значения заданы. В случае если это не так, воспользуйтесь сперва одним из фильтров, предоставляемых системой. В показанной ниже форме:
Вам предоставляется возможность самостоятельно выбрать число кластеров, на которые необходимо разделить данные и количество итераций в процессе. Не выбирайте количество итераций слишком большим: это может вызвать переполнение данных. Даже небольшого значения будет достаточно, так как процесс быстро сходится. Для запуска алгоритма нажмите кнопку start в окне формы. Полученные вероятности отношения каждого вектора к каждому кластеру Вы увидите на экране, а после закрытия формы, номер кластера станет новым атрибутом ваших данных.
В меню поля VIEW можно вызвать графическое представление данных. Оно является лишь наглядной иллюстрацией результатов вывода.