
- •Предмет и содержание дисциплины «Технология баз данных»..
- •Экономическая информация, ее виды, структурные единицы.
- •Экономические информационные системы, их функции, классификация.
- •Информационное обеспечение эис. Внутримашинная и внемашинная части информационной базы эис.
- •Документы, их виды, структура.
- •6. Понятие классификации информации. Системы классификации.
- •7. Понятие кодирования информации. Методы кодирования.
- •8. Классификаторы информации, их значение и виды.
- •9. Файловая организация данных в автоматизированных информационных системах, ее недостатки.
- •10. Понятие базы данных. Преимущества базы данных.
- •11. Приложения базы данных. Компоненты базы данных.
- •12. Трехуровневая модель организации баз данных.
- •13. Понятие модели данных. Иерархическая модель, ее достоинства и недостатки.
- •14. Сетевая модель, ее достоинства и недостатки.
- •15. Реляционная модель. Ее базовые понятия (отношения, домен, кортеж, степень отношения), достоинства и недостатки.
- •16. Связь между таблицами в реляционной модели данных. Первичный и внешний ключи, их отличия.
- •17. Реляционная целостность: целостность отношений, ссылочная целостность.
- •18. Операции реляционной алгебры: объединение, пересечение, декартово произведение, разность, проекция, выборка, соединение, деление.
- •19. Постреляционная модель, ее достоинства и недостатки.
- •20. Объектно – ориентированная модель данных. Ее базовые понятия (объекты, классы, методы, наследование, инкапсулирование, расширяемость, полифоризм), достоинства и недостатки.
- •26. Технология хеширования
- •27. Сжатие данных на основе различий
- •28. Иерархическое сжатие
- •29. Кодирование Хаффмана
- •30. Понятие проектирования бд. Требования, предъявляемые к бд
- •31.Этапы жизненного цикла базы данных.
- •32.Модель «сущность-связь»,ее понятия:сущность,атрибут,экземпляр сущности,связь,мощность связи.Представление сущности и связи на er-диаграмме.
- •33.Типы связи,их представление на er-диаграмме.
- •34.Класс принадлежности сущности,его представление на er-диаграмме.
- •35.Правила преобразования er-диаграмм в реляционные таблицы в случае связи 1:1.
- •Функциональные возможности и производительность субд.
- •Классификация субд. Режимы работы пользователя с субд.
- •По степени универсальности:
- •По принципу обработки запросов к бд :
- •Направления развития субд: расширение множества типов обрабатываемых данных, интеграция технологий баз данных и Web-технологий, превращение субд в системы управления базами знаний.
- •Знания, их виды. Базы знаний. Экспертные системы.
- •56. Назначение форм, их виды и способы создания.
- •57. Назначение отчетов и способы их создания.
- •58. Типы Web – страниц для публикации базы данных в Интернет.
- •59. Элементы управления, используемые при конструировании форм, отчетов, страниц доступа к данным.
- •60. Понятие макроса. Классификация макрокоманд.
- •81. Распределенные субд. Двенадцать правил к.Дейта.
- •82.Обработка распределенных запросов. Преимущества и недостатки РаСубд.
- •83.Хранилища данных.Olap-технологии.
- •84.Метод интеллектуальной обработки данных data mining.
- •85.Пользователи базы данных. Администратор базы данных и его функции.
84.Метод интеллектуальной обработки данных data mining.
В настоящее время для интеллектуальной обработки данных интенсивно разрабатываются методы, получившие общее название Data Mining (добыча, извлечение знаний). Современные системы добычи знаний используют представления и интерпретации, основанные на методах искусственного интеллекта, и позволяют обнаруживать растворенную в терабайтных хранилищах не очевидную, но весьма ценную информацию.
Data Mining - это новая технология интеллектуального анализа данных с целью выявления скрытых закономерностей в виде значимых особенностей, зависимостей, тенденций и шаблонов. В ее основу положена концепция шаблонов (patterns). Шаблоны представляют собой закономерности, свойственные выборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных (заранее известных) предположений о структуре выборки и виде распределений значений анализируемых показателей.
Другими словами, Data Mining - это исследование и обнаружение алгоритмами и средствами искусственного интеллекта в данных шаблонов, которые:
o ранее не были известны;
o нетривиальны;
o практически полезны;
o доступны для интерпретации человеком и необходимы для принятия решений в различных сферах деятельности. Такие шаблоны должны отражать неочевидные, неожиданные закономерности, так называемые скрытые знания.
Выделяют следующие типы закономерностей:
o классификация. Это наиболее распространенная задача Data Mining. Она позволяет выявить признаки, характеризующие однотипные группы объектов, для того чтобы по известным значениям этих характеристик можно было отнести новый объект к тому или иному классу. Ключевым моментом выполнения этой задачи является анализ множества классифицированных объектов;
o кластеризация. Логически продолжает идею классификации на более сложный случай, когда сами классы еще не определены. Результатом использования метода, выполняющего кластеризацию, является определение (посредством свободного поиска) классов. Так, например, можно выделить группы клиентов или покупателей, схожих по каким-то признакам, чтобы в отношении их вести дифференцированную политику;
o ассоциация. В отличие от двух предыдущих типов определяется не на основе значений свойств одного объекта или события, а выявляет связи
между двумя или несколькими одновременно наступающими событиями. При этом указывается на то, что при наступлении одного события с той или иной степенью вероятности наступает другое. С помощью ассоциации можно выполнить анализ покупательской корзины, портфеля ценных бумаг, набора финансовых услуг и др.;
o последовательность. Также выявляет связи между событиями, но наступающими не одновременно, а с некоторым определенным разрывом во времени. Таким образом, ассоциация есть частный случай последовательности с нулевым временным интервалом. С помощью последовательности можно ответить, например, на вопрос, покупки каких товаров предшествуют покупке данного вида продукции;
o прогнозирование. Представляет собой особую форму предсказания, которая на основе особенностей поведения текущих и исторических данных оценивает будущие значения определенных показателей. В задачах подобного типа наиболее часто используются традиционные методы математической статистики (в частности, регрессия), а также нейронные сети.
При выявлении перечисленных закономерностей Data Mining использует большое число различных методов анализа или их комбинации.
Лидерами на рынке систем интеллектуальной обработки данных являются компании Business Objects, Cognos, Information Builders, а также корпорации Microsoft и Oracle.