- •Глава 10. Машинное обучение
- •10.1. Компоненты процесса обучения
- •10.2. Индуктивное обучение
- •10.3. Система id3
- •10.4. Система induce
- •Индуктивно сгенерированные правила
- •Переменные, используемые для классификации
- •10.5. Алгоритм обучения понятиям
- •10.6. Неинкрементальное (параллельное) обучение в решетках Галуа
- •10.7. Адаптивная дискретизация непрерывных значений атрибутов
- •10.8. Открытие знаний
- •10.9. Типы закономерностей, выявляемых методами над
- •10.10. Бизнес-приложения методов иад
- •10.11. Классы систем иад Предметно-ориентированные аналитические системы
- •Статистические пакеты
- •Системы рассуждений на основе аналогичных случаев (cbr case based reasoning)
- •Деревья решений (decision trees)
- •Эволюционное программирование
- •Генетические алгоритмы
- •Алгоритмы ограниченного перебора
- •К-ближайший сосед
- •Технология deep data mining
- •10.12. Архитектура систем иад
- •10.13. Применение алгоритмов типа аво (вычисления оценок) для построения итерационных алгоритмов поиска
- •10.14. Алгоритм распознавания типа «Кора»
- •10.15. Обучение машин распознаванию образов
- •10.16. Алгоритмы автоматического построения классификаций
- •Общее описание методов партициальной кластеризации
- •Алгоритм партициальной кластеризации. Метод k-средних (k-means)
- •Алгоритмы иерархической кластеризации
- •Программные средства интеллектуального анализа данных
- •Ibm Visualization Data Explorer
- •Data mining suite
Ibm Visualization Data Explorer
IBM Visualization Data Explorer позволяет визуализировать данные в БД. Разработчик: rsefeck@watson.ibm.com
INLEN
Проект связан с развитием широкомасштабных технологий для извлечения знаний го баз данных. Система помогает пользователю в открытии образов (шаблонов) или трендов, значимых отношений концептуальных или числовых регулярностей или скоплений в больших базах данных.
IRIS
Прототипная система, поддерживающая визуальный анализ. IRIS автоматически производит тематическую карту для статистических данных, выбранных пользователем.
Разработчик: ANP
IXL и IDIS software
IXL была одной из первых коммерческих программ, которые были разработаны вслед за IDIS: Information Discovery System в 1992 году. Эти системы обеспечивают открытие, визуализацию и обнаружение аномалий.
Разработчик Intelligence Ware, Inc
LEVEL 5 QUEST
Level 5 Research разработан как гибрид ИАД с технологиями OLAP. Продукт обеспечивает нечеткий поиск для реляционной базы данных. LEVEL 5 Quest обладает уникальной способностью выдавать ответы даже в том случае, если нет точного совпадения формулировок запроса и записей базы данных.
Mine Set (SGI)
Mine Set (SGI) — новая версия продукта SGI для объяснительного анализа. Комбинирует мощные интегрированные интерактивные средства для доступа к данным, ИАД и визуализации данных. Mine Set позволяет получить более глубокое интуитивное понимание.
Разработчик: Mark Davies (CS/SE III), myd@cs.blam.ac.uk
MLC++ Library/Utilities
MLC++ библиотека программ обучения, разработанных на C++, MLC++— общедоступны и могут быть доступны также коды программ. MLC++ содержит такие известные индуктивные алгоритмы, такие как IDS, ближайшего соседа, наивный байесовский подход, OneR(Holte), Window и таблицы решений. Содержит также алгоритмы, такие как С4.5, PEBLS, IBI-4, OC1,CN2. MLC++ содержит средства препроцессинга данных: оценка точности, обнаружения кризисов, фильтры дискретизации, автоматическую оценку параметров.
Model Quest Enterprise
Высоко автоматизированное прогностическое программное обеспечение, которое включает новую технику моделирования Expert Mining Strategies. Разработчик: Amy B.Edwards, amye@abstech.com.
Nuggels (TM)
Алгоритм поиска Nuggels, называемый Sittagents для разработки правил «если..., то». Эти алгоритмы используют генетические методы и технику обучения интеллектуального поиска справедливых гипотез, которые становятся правилами. Алгоритм производит обучение в процессе поступления данных.
Новые аспекты заключаются в том способе, которым создаются гипотезы и методы поиска. Nuggels также обеспечивает набор средств для использования правил для предсказания новых данных, понимания, классификации, сегментирования данных.
Разработчик Robert A.Geller, rgeller@pipeline.com
Partek
Программное обеспечение для открытия знаний, основанное на статистических методах, визуализации данных, нейронных сетях, различной логике и генетических алгоритмах.
Разработчик: Tom Downey, tjd@partek.com
PolyAnalist
Разработчик: megaputer@glas.apc.org
PolyAnalist 3.0 для Win NT
Разработчик Sergei Ananycn megaputer@glas.apc.org
Q-WHY
Q-why использует эвристический поиск для нахождения возможных объяснений, почему одно множество записей (например, клиенты, которые покупают какой-либо продукт) отличаются от других записей в базе данных. Эта программа имеет большое число применений в области сегментации рынка, целенаправленного маркетинга и т.д. Разработчик: Mike Bell, mbell@qwhy.com
SE-Learn
SE-набор программ для индукции, основанной на деревьях и для классификации. Перечисления деревьев обеспечивает базис для индукции и классификации и обобщает деревья решений. SE — использует несколько методов разработанных для деревьев решений.
SIPINA — W v.20 и Sipina — Pro
SIPINA — W — программное обеспечение для открытия знаний в базах данных. Версия v/20 содержит несколько методов: Card, ID3, С 4.5, ELISEE, Chi2Aid, SIPINA
При помощи SIPINA-W v.20 вы будете в состоянии:
генерировать знания в виде правил продукции и таким образом извлекать знания из баз данных,
тестировать на необработанных данных, полученных ранее;
добавлять знания, генерируемые автоматически SIPINA-W к другим знаниям, которые могут быть даны экспертом;
соединять, оптимизировать базы знаний, которые поставляются экспертом.
Разработчик: zighed@univ-lyon2.fr
Snob
Программа кластеризации на основе байсовской стратегии обучения без учителя. Использует принцип минимальной длины сообщения. Разработчик: David Dowe, ded@ccs.monash.edu-au
SPSS Data Mining Software
Разработчик: aszymans@spss.com
SuperQuery
SuperQuery — программное обеспечение, которое включает машину открытия знаний.
Разработчик: Ashraf Army: ashraf@army.com
Synthetic Classification Data Set prugram (SCDS)
SCDS — создана, чтобы генерировать синтетические наборы данных, которые особенно полезны для тестирования ИАД алгоритмов.