
- •Управление данными
- •1. Базы и банки данных
- •Информация, данные, знания ?
- •1.3. Банки данных
- •1.4. Преимущества Банка данных
- •1.6. Классификация языковых средств
- •1.8. Пользователи банков данных
- •1.9. Администраторы банка данных
- •2. Модели и структуры баз данных
- •2.1. Инфологическая модель
- •2.2. Понятие модели данных
- •2.3. Иерархическая структура и модель данных
- •2.4. Сетевая структура бд
- •2.5. Реляционные базы данных
- •Должен использоваться единый язык для взаимодействия с субд.
- •2.6. Диаграмма «сущность-связь» Чена
- •2.7. Объектно-ориентированные базы даных
- •2.8. Нормализация бд
- •2.9. Об эволюции и многообразии моделей данных
- •3... Технология «хранилище данных»
- •3. 1 Концепция хранилища данных
- •3.2. Витрины данных
- •3.3. Категории данных в хд
- •3.4. Метаданные
- •3.5. Потоки данных
- •3.7. Преобразование данных.
- •3.8. Загрузка данных и очистка данных
- •3.9. Выявление проблем в данных
- •4. Технологии управления данными
- •4.1. Oltp-системы
- •4.2. Многомерная модель данных
- •4.3. Olap-системы
- •12 Основных требований е. Кодда
- •5. Технологии интеллектуального анализа данных
- •5.1.Методология анализа данных
- •5.2. Технология Data Mining
- •5.3. Технология kdd
- •Лабораторные работы
1. Базы и банки данных
Информация, данные, знания ?
Понятия "информация", «данные», «знания» достаточно широко используются в обычной жизни современного человека, поэтому каждый имеет интуитивное представление, что это такое. Но когда наука начинает применять общеизвестные понятия, она уточняет их, приспосабливая к своим целям, ограничивает использование термина строгими рамками его применения в конкретной научной области.
Существует множество подходов к определению понятия "информация"1. Так, например, наиболее общее определение звучит следующим образом: "Информация есть отражение реального мира. Информация - отраженное разнообразие, то есть нарушение однообразия. Информация является одним из основных универсальных свойств материи." [Информатика. Энциклопедический словарь для начинающих. Под ред. Д.А.Поспелова - Москва.: Педагогика-Пресс, 1994]. Данное определение дается с позиции философского подхода к понятия информация. Другое определение отражает практический аспект в определении понятия "информация" и формулируется так: "Информация есть все сведения, являющееся объектом хранения, передачи и преобразования" [Я.Л.Шрайберг , М.В.Гончаров - Справочное руководство по основам информатики и вычислительной техники -Москва: Финансы и статистика, 1995].
Все разнообразие взглядов на информацию более или менее четко укладывается в две ведущие модели, одна из которых трактует информацию как неотъемлемое свойство материи, ее атрибут ("атрибутивная концепция"), а другая - как неотъемлемый элемент самоуправляемых (технических, биологических, социальных) систем, как функцию этих систем ("функционально-кибернетическая концепция").
Рассмотрим некоторые из основных существующих точек зрения на понятие "информация". Так, согласно определениям, приведенным в толковых словарях, термин "информация" означает следующее:
Информация ( Information )- содержание сообщения или сигнала; сведения, рассматриваемые в процессе их передачи или восприятия, позволяющие расширить знания об интересующем объекте [Терминологический словарь по основам информатики и вычислительной техники. Под ред. А.П.Ершова, Н.М.Шанского.Москва .: Просвещение, 1991.-159 с.].
1.2. Базы данных
Для решения задач управления данными необходимо накопление и хранение и преобразование достаточно больших объемов данных. Этим целям служат базы данных (БД), банки данных и базы знаний. Ниже дадим наиболее популярные и используемые определения этих понятий.
База данных — организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.
База данных — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных.
База данных — некоторый набор перманентных (постоянно хранимых) данных, используемых прикладными программными системами какого-либо предприятия.
База данных— совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации.
Наиболее общим на наш взгляд определением является определение, приведенное в Гражданском кодексе РФ, ст. 1260:
«Ба́за да́нных — представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ)».
Под базой данных (БД) обычно понимается именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной области. Характерной чертой баз данных является постоянство: данные постоянно накапливаются и используются; состав и структура данных, необходимых для решения тех или иных прикладных задач, обычно постоянны и стабильны во времени; отдельные или даже все элементы данных могут меняться – но это и есть проявление постоянства – постоянная актуальность. базы данных (БД) создаются обычно для многоцелевого использования. БД отражают определенную часть реального мира. Эта информация должна по возможности фиксироваться в базе данных однократно, и все пользователи, которым эта информация нужна, должны иметь возможность работать с ней.
База данных — централизованное хранилище в ЭВМ определенным образом организованной информации