[Править] Подготовка данных

Перед использованием алгоритмов Data Mining необходимо произвести подготовку набора анализируемых данных. Так как ИАД может обнаружить только присутствующие в данных закономерности, исходные данные с одной стороны должны иметь достаточный объем, чтобы эти закономерности в них присутствовали, а с другой — быть достаточно компактными, чтобы анализ занял приемлемое время. Чаще всего в качестве исходных данных выступают хранилища или витрины данных. Подготовка необходима для анализа многомерных данных до кластеризации или интеллектуального анализа данных.

Далее данные очищаются. Очистка удаляет выборки с шумами и пропущенными данными.

Очищенные данные сводятся к векторам признаков, один вектор на выборку. Вектор признаков — это суммарная версия сырых данных выборки. Например, черно-белое изображение лица размером 100×100 пикселей содержит 10 тыс. бит сырых данных. Они могут быть преобразованы в вектор признаков путем обнаружения в изображении глаз и рта. В итоге происходит уменьшение объема данных с 10 тыс. бит до списка кодов положения, значительно уменьшая объем анализируемых данных, а значит и время анализа. Выбор функции будет зависеть от того, что является целью анализа; выбор «правильной» функции имеет основополагающее значение для успешного интеллектуального анализа данных.

Векторы признаков делятся на две категории — обучающий набор и тестовый набор. Обучающий набор используется для «обучения» алгоритма Data Mining, а тестовый набор — для проверки найденных закономерностей.

[Править] См. Также

Анализ формальных понятий
Очистка данных
Прикладная статистика
Искусственная нейронная сеть
Нейронная сеть Кохонена
Метод опорных векторов
Netflix Prize
Вертикальный поиск
ДСМ-метод
Нечёткая логика

<<< < Предыдущая 1 23 / 33

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.11.2019508.42 Кб5CHM_HW12.DOC
#
22.08.2019816.13 Кб53comb_lections.doc
#
10.11.2019206.85 Кб3CRS_AU_2012dn.doc
#
26.09.20194.75 Mб15CSharp Language Specification.doc
#
01.05.2025149.5 Кб1Cистема процессов - основа СМК.doc
#
27.10.201897.79 Кб4daa_min.doc
#
01.07.2025180.74 Кб0DAO new materials and examples.doc
#
01.05.2025244.22 Кб1default.doc
#
01.05.2025250.88 Кб0default.doc
#
01.05.2025305.66 Кб1default.doc
#
01.04.202570.87 Кб5diffury_otred_otdelno.docx