Лекции / Л-1 - Понятие и функции СУБД
.pdfСистема разработчика и система времени выполнения
В СУБД выделяются:
Подсистема разработчика – компоненты СУБД, которые используются на этапе создания приложения БД (средства описания схем и подсхем БД, генераторы форм и кода, средства визуальной разработки приложения).
Подсистема времени выполнения – часть СУБД, необхо-
димая при работе с базой данных. В основном ее назначение состоит в обработке запросов к БД и в поддержании ее целостности.
Классификация СУБД по модели данных (1)
Иерархические СУБД – основаны на иерархической модели. Первые СУБД, 1950-60 гг. (Information Management System фирмы IBM).
Сетевые СУБД – основаны на сетевой модели. Первая сетевая СУБД разработана Чарльзом Бахманом в 1960 г.
(IDS – Integrated Data Store корп. General Electric).
Реляционные СУБД – управляют реляционными базами данных. Практически все разработчики современных приложений баз данных ориентируются на РСУБД.
Классификация СУБД по модели данных (2)
Объектно-ориентированные СУБД – основаны на объектной модели данных (данные – объекты, наделенные свойствами и использующие методы взаимодействия с другими объектами.
Объектно-реляционные СУБД (ОРСУБД) –
реляционные СУБД, поддерживающая некоторые технологии, реализующие объектно-ориентированный подход (объекты, классы и наследование реализованы в структуре БД и языке запросов). ОРСУБД являются широко известные Oracle Database, Informix, DB2, PostgreSQL.
Реляционные СУБД (1)
1974 г. – компания IBM начала исследовательский проект по разработке РСУБД, получивший название System R. Первый коммерческий продукт – IBM SQL/DS (1982 г.)
Первая коммерчески успешная РСУБД Oracle выпущена в 1979 г. компанией Relational Software (впоследствии –
Oracle Corporation).
К концу 1980-х гг. реляционные СУБД заняли на мировом рынке СУБД доминирующее положение.
В 1980-х гг. многие компании стали позиционировать свои СУБД как «реляционные», вследствие чего Эдгар Кодд в 1985 г. опубликовал свои «12 правил Кодда».
Реляционные СУБД (2)
2010 г. – РСУБД используются в абсолютном большинстве крупных проектов по разработке ИС.
По данным компании IDC в 2009 г. всего около 7 % составляют проекты, использующие нереляционные СУБД.
В 2013 г. рынок РСУБД составлял 26 млрд долларов с годовым приростом около 9 %, а к 2018 г. достигнет 40 млрд долларов.
Абсолютными лидерами рынка СУБД являются Oracle, IBM и Microsoft (общая доля рынка около 90%).
«Большие данные» (1)
Большие данные (Big Data) – совокупность подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объемов и многообразия для получения воспринимаемых результатов, в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети.
Сформировались в конце 2000-х гг., альтернативны традиционным СУБД и решениям класса Business Intelligence.
Cоциально-экономический феномен – появление технологических возможностей анализировать огромные массивы данных в проблемных областях и вытекающих из этого трансформационных последствий.
«Большие данные» (2)
Определяющие характеристики больших данных
(«три V»):
объем (Volume) – в смысле физического объема;
скорость (Velocity) – в смысле скорости прироста и необ-ходимости высокоскоростной обработки и получения результатов);
многообразие (Variety) – в смысле возможности одновременной обработки различных типов структурированных и полуструктурированных данных.
«Большие данные» (3)
С точки зрения ИТ в технологию больших данных изначально включались средства массово-параллельной обработки неопределенно структурированных данных:
СУБД NoSQL;
алгоритмы MapReduce:
реализующие их программные каркасы и библиотеки проекта Hadoop.
В дальнейшем к серии технологий больших данных стали относить разнообразные информационно-технологические решения, обеспечивающие сходные возможности по обработке сверхбольших массивов данных.
СУБД NoSQL (1)
Имеют существенные отличия от моделей, используемых в традиционных РСУБД с доступом к данным средствами языка SQL.
Применяются к БД, в которых делается попытка решить проблемы масштабируемости и доступности за счет атомарности и согласованности данных.
Изначально слово NoSQL имело смысл «отрицающий SQL». Позднее было придумано объяснение «Not Only SQL» («не только SQL»). NoSQL стал общим термином для различных баз данных и хранилищ. Он не обозначает какую-либо одну конкретную технологию или продукт.
NoSQL (2)
Использование нереляционных хранилищ началось еще во времена первых компьютеров.
Появление нереляционных СУБД нового поколения произошло из-за необходимости создания параллельных распределенных систем для высокомасштабируемых интернет-приложений (поисковые системы).
В начале 2000-х гг. Google построил свою высокомасштабируемую поисковую систему и приложения, решая проблемы масштабируемости и параллельной обработки больших объемов данных.