
- •1. Общая теория систем, ее происхождение, место среди других наук
- •2. Понятия «система», «системность»
- •3. Общие свойства систем
- •4. Способы описания свойств систем
- •5. Методологические подходы к исследованию и моделированию систем управления
- •6. Принципы системного подхода
- •1.1. Технология
- •2.2. Информационная технология
- •3.3. Этапы развития информационных технологий
- •4.4. Классификация информационных технологий
- •5.5. Информационная система
- •6.6. Классификация информационных систем
- •1.1. Этапы цикла разработки информационных систем и их целевая продукция
- •2.2. Системные исследования
- •3.3. Системный анализ
- •4.4. Системное проектирование
- •5.5. Внедрение
- •6.6. Сопровождение
- •1. Методология разработки сложных программных систем
- •2.2. Основные принципы организации работы над проектом
- •3.3. Методология Rational Unified Process (rup)
- •4.4. Моделирование и проектирование
- •5.5. Средства разработки по
- •6.6. Тестирование
- •1. Функциональное тестирование
- •2. Нагрузочное тестирование
- •7.7. Управление проектами и портфелями
- •8.8. Управление требованиями
- •9.9. Управление конфигурациями и изменениями
- •10.10. Автоматизированное тестирование
- •11.11. Управление выполнением проекта и документированием
- •Ibm Rational ProjectConsole
- •Ibm Rational SoDa
- •12.12. Ibm Software Development Platform – новый подход к разработке программного обеспечения
- •13.13. Инструментальные средства ibm Rational
- •Ibm Team Unifying Platform. Эффективная организация совместной работы над проектом
- •14.14. Ibm Rational – состав пакетов и краткое описание продуктов
- •6. Знания, виды знаний, базы знаний, банки знаний
- •7.2. Модели представления знаний
- •8.3. Стратегии получения знаний
- •2.2. Нейронные сети
- •3.3. Нечеткая логика
- •4.4. Генетические алгоритмы
- •8.8. Системы поддержки принятия решений
- •9.9. Этапы проектирования системы поддержки принятия решения
- •1.1. Почему растет популярность Data Mining?
- •2.2. Определение Data Mining
- •3.3. Области применения Data Mining
- •3.1.Розничная торговля
- •3.2.Банковское дело
- •3.3.Телекоммуникации
- •3.4.Страхование
- •3.5.Другие приложения в бизнесе
- •3.6.Медицина
- •3.7.Фармацевтика
- •3.8.Молекулярная генетика и генная инженерия
- •5.5. Классы систем Data Mining
- •6.6. Десять мифов интеллектуального анализа данных
- •7.7. Шесть шагов к успеху в интеллектуальном анализе данных
- •8.8. Инструментарий технологии Data Mining
- •1.1. Особенности корпоративных информационных систем
- •2.2. Принципы создания и требования к корпоративной информационной системе
- •3.3. Управление проектами внедрения корпоративной информационной системы
- •4.4. Основные принципы выбора по для построения корпоративной информационной системы
- •5.2. Принципы создания и требования к корпоративной информационной системе
- •6.3. Управление проектами внедрения корпоративной информационной системы
- •7.4. Основные принципы выбора по для построения корпоративной информационной системы
- •8.3. Управление проектами внедрения корпоративной информационной системы
- •9.4. Основные принципы выбора по для построения корпоративной информационной системы
- •10.4. Основные принципы выбора по для построения корпоративной информационной системы
- •11.Корпоративные системы управления
- •12.2. Классические схемы разработки корпоративных систем
- •13.3. Адаптивная организация проектных работ
- •14.4. Организация управления по критериям качества
- •15.2. Классические схемы разработки корпоративных систем
- •16.3. Адаптивная организация проектных работ
- •17.4. Организация управления по критериям качества
- •1.1. Необходимость Workflow
- •2.2. Отражение новых принципов управления
- •3.1. Что такое erp
- •4.2. Управление запасами и производством
- •5.3. Учет и управление финансами
- •6.4. Интеграция erp-систем с системами других классов
- •7.5. Электронный бизнес
- •8.6. Технология и практика проектирования erp-систем
- •9.7. Внедрение erp-систем. Основные ошибки
- •10.8. Технология внедрения корпоративной информационной системы класса erp
- •11.1. Методология baan
- •12.1. Структура корпоративной информационной системы «Галактика», 8.1
- •13.1. Система Галактика-Производство 7.1 как современный инструмент координации деятельности предприятия
- •14.2. Состав системы Галактика-Производство 7.1
- •15.3. Контур Логистики
- •16.4. Контур Управления производством
- •17.5. Контур Бухгалтерского учета
- •18.1. Программы серии "Аналитик"
- •19.2. Этапы развития
2.2. Определение Data Mining
Традиционная математическая статистика, долгое время претендовавшая на роль основного инструмента анализа данных, откровенно не справляется с возникшими проблемами. Главная причина – концепция усреднения по выборке, приводящая к операциям над фиктивными величинами (типа средней температуры пациентов в больнице, средней высоты дома на улице и т.п.).
В основу Data Mining (discovery-driven data mining) положена концепция шаблонов (паттернов), отражающих фрагменты многоаспектных взаимоотношений в данных. Эти шаблоны представляют собой закономерности, свойственные подвыборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборки и виде распределений значений анализируемых показателей.
Примеры заданий на такой поиск при использовании Data Mining приведены в таблице.
Таблица. Примеры формулировок задач при использовании методов OLAP и Data Mining
OLAP |
Data Mining |
Каковы средние показатели травматизма для курящих и некурящих |
Встречаются ли точные шаблоны в описаниях людей, подверженных повышенному травматизму |
Каковы средние размеры телефонных счетов существующих клиентов в сравнении со счетами бывших клиентов (отказавшихся от услуг телефонной компании) |
Имеются ли характерные портреты клиентов, которые, по всей вероятности, собираются отказаться от услуг телефонной компании |
Какова средняя величина ежегодных покупок по украденной и не украденной кредитной карточке |
Существуют ли стереотипные схемы покупок для случаев мошенничества с кредитными картами |
Сформулируем еще несколько вопросов, на которые способная дать ответ технология Data Mining:
Какие товары предлагать данному покупателю?
Какова вероятность того, что данный сектор потенциальных клиентов отреагирует на рекламную кампанию?
Можно ли выработать оптимальную стратегию игры на бирже?
Можно ли выдать кредит данному клиенту банка?
Какой диагноз поставить данному пациенту?
Как прогнозировать пиковые нагрузки в телефонных или энергетических сетях?
В чем причины брака в производственной продукции?
Важное положение Data Mining – нетривиальность разыскиваемых шаблонов. Это означает, что найденные шаблоны должны отражать неочевидные, неожиданные (unexpected) регулярности в данных, составляющих так называемые скрытые знания (hidden knowledge). К обществу пришло понимание того, что сырые данные (raw data) содержат глубинные пласт знаний, при грамотной раскопке которого могут быть обнаружены настоящие самородки.
Существует множество определений Data Mining, но в целом они совпадают в выделении 4-х основных признаков. Вот определение, которое дал Григорий Пиатецкий-Шапиро (G. Piatetsky-Shapiro, GTE Labs.), один из ведущих мировых экспертов в области Data Mining:
Data Mining - это процесс обнаружения в сырых данных
ранее неизвестных,
нетривиальных,
практически полезных,
доступных интерпретации знаний (закономерностей), необходимых для принятия решений в различных сферах человеческой деятельности.
Нахождение скрытых закономерностей в данных, взаимосвязей между различными переменными в базах данных, моделирование и изучение сложных систем на основе истории их поведения - вот предмет и задачи Data Mining.
Результаты Data Mining - эмпирические модели, классификационные правила, выделенные кластеры и т.д. - можно затем инкорпорировать в существующие системы поддержки принятия решений и использовать их для прогноза будущих ситуаций.