Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпора ит.doc
Скачиваний:
6
Добавлен:
22.09.2019
Размер:
348.67 Кб
Скачать

39. Интеллектуальный анализ данных (Data Mining)

ИАД — проц поддержки принят реш, основ на поиске в дан скрыт законом-ей. При эт накопл свед-я автомат обобщ до инф, кот мб охар-на как знания.

Компьютерн технолог, образующ Data Mining явл-ся:

- статист пакеты, - нейронные сети и их вар-ты, - экспертн сист, - байесовы (вероятностные) сети, - методы эвристической самоорг-ции, - теория игр, - теория хаоса, - многозначные логики, нечеткая логика, логика антонимов, - эволюцион алгоритмы, - деревья решений и алгоритмы классиф-ции, - сист рассужд на основе аналогичн случ. вывод путем сопоставл или вывод, основан на прецедентах, - ассоциат правила. алгор огранич перебора, - кластерный анализ, - иммунные сети, - роевой интеллект, - мет экспертн оценок.

В последнее время оформилось новое направление в аналитических технологиях обработки данных — Data Mining, что переводится как "добыча" или "раскопка данных". Нередко рядом с Data Mining встречаются слова "обнаружение знаний в базах данных" и "интеллектуальный анализ данных". Их можно считать синонимами Data Mining. Возникновение всех указанных терминов связано с новым витком в развитии средств и методов обработки данных.

Цель Data Mining состоит в выявлении скрытых правил и закономерностей в наборах данных. Дело в том, что человеческий разум сам по себе не приспособлен для восприятия больших массивов разнородной информации. Человек к тому же не способен улавливать более двух-трех взаимосвязей даже в небольших выборках. Но и традиционная математическая статистика, долгое время претендовавшая на роль основного инструмента анализа данных, также нередко пасует при решении задач из реальной сложной жизни. Она оперирует усредненными характеристиками выборки, которые часто являются фиктивными величинами (типа средней температуры пациентов по больнице, средней высоты дома на улице, состоящей из дворцов и лачуг и т.п.). Поэтому методы математической статистики оказываются полезными главным образом для проверки заранее сформулированных гипотез.

Современные технологии Data Mining перелопачивают информацию с целью автоматического поиска шаблонов, характерных для каких-либо фрагментов неоднородных многомерных данных. В отличие от оперативной аналитической обработки данных в Data Mining бремя формулировки гипотез и выявления необычных шаблонов переложено с человека на компьютер.