Вкладка 8
Базы данных 6(05.11.2025)
Встраиваемые или внедряемые субд - это локальная субд, которая встраивается в приложение как отдельный модуль и используется для управления данными только внутри этого модуля.
Классификация субд по языку запросов:
1. Субд с поддержкой SQL(структурированный язык запросов)
2. NoSQL нереляционная субд, которая поддерживает языки запросов основанные на языках программирования отличных от SQL.(пример Javascript) Используется там, где нужно работать с большими объёмами данных. Используется схема ключ-значение.(Знать что такое хэш и привести пример
хэш функции)
3. NewSQL середина между SQL и NoSQL. Архитектура сохраняет строгий sql
интерфейс, но имеет скорость работы сравнимую с NoSQL. В ряде NewSQL
субд подразумевается отказ от ресурсоёмких функций SQL в пользу производительности приложения.(Знать что такое ресурсоёмкость -
характеризуется использованием оперативной памяти и времени.) В NewSQL
архитектуре используются распределённые транзакции, позволяющие данным автоматически распределяться между серверами без потерь.Многие NewSQL решения применяют колоночные схемы хранения данных. Распределённая архитектура и расширенные функции NewSQL субд могут усложнить настройку, обслуживание и устранение неполадок по сравнению с традиционными реляционными субд.
4. NXD(native, xml, database) - архитектура, заточенная под обработку xml документов. Эти субд работают с XML как с основной структурой данных, а не просто поддерживают xml как тип данных.
5. Векторные базы данных используются в машинном обучении, часто
используются в рекомендательных системах типа faq, чат ботах. Векторные базы данных - это контейнеры, с данными из которых работа выполняется ни
как с обычными числами или текстом, а в векторном формате, то есть в
формате набора чисел представляющего данные в числовой форме. При этом данные и запрос пользователя в векторную форму переводит нейросеть. Суть векторных баз данных это быстрый поиск по смыслу или семантический поиск, то есть поиск по схожим векторам, а не по точному их совпадению. Векторные базы данных хороши для неструктурированных данных, которые трудно представить в виде таблицы и обеспечивают высокую масштабируемость.
6. Базы данных временных рядов - эти базы данных хранят информацию записываемую в хронологическом порядке. Система хорошо справляется с непрерывными потоками информации или если есть необходимость в непрерывной регистрации данных.
7. Поисковые базы созданы для быстрого поиска больших объемов неструктурированных данных с поддержкой технологии индексирования, когда каждое слово или фраза получает уникальный индекс. Эти системы используются для обнаружения плагиата
.
8. Оперативные базы данных эти базы данных хранят всю информацию в оперативной памяти без обращения ко вторичной памяти.
Нейросеть имитирует приём и обработку данных в человеческом мышлении. Мозг человека состоит из большого количества нейронов, то есть специальных клеток способных распространять электрохимические сигналы. Нейроны имеют разветвлённую структуру входных каналов информации,
которые называются они дендриты, ядро, аксон. Аксоны соединяются с дендритами других нейронов с помощью синапсов. Нейрон активируется когда
суммарный уровень сигналов поступивших в его ядро из дендритов превышает
определённый уровень называемый порогом активации. Нейронная сеть может
быть как с учителем так и без учителя. Учитель подразумевает, что мы точно
знаем результаты, которые хотим получить и эти данные выступают как образец.
Сложность это порядок зависимости времени и памяти необходимый для выполнения приложения от размерности входных данных. Сложность рассчитывается от количества элементарных операций. Это количество вычисляется как поленом. Надо знать кароче!! Понял, спасибо уээээээээээээээ
Наиболее популярные субд.
1.Самая распространённая субд это MySQL. Это реляционная субд с открытым исходным кодом главными плюсами которой являются её бесплатность, простота настройки, скорость и гибкость. Гибкость обеспечена поддержкой большого количества различных видов таблиц. Система имеет простой интерфейс, возможность синхронизации с другими бд,но при этом функциональные возможности MySQL сильно уступают возможностям PostgreSQL по работе с большими и сложными базами данных.
2.Microsoft SQL server - реляционная субд, бесплатная версия которой подходит для небольших объемов до 10ГБ. Работает как с виндой так и с линуксом. Минусы: дорогая лицензия, повышенная ресурсоёмкость. Её преимущество это возможность импорта данных из других программ Microsoft.
3.PostgreSQL это бесплатная объектно реляционная субд со встроенной функцией наследуемых таблиц, которые представлены здесь как отдельные объекты, действия с которыми выполняются с помощью объектно-ориентированных функций. Это позволяет создавать более сложную
структуру данных по сравнению со стандартной реляционной моделью. Например это позволяет обрабатывать данные NoSQL, включая такие форматы как XML и JSON. Субд поддерживает расширение языка SQL на базе таких языков программирования таких как python, java и тд. К плюсам относится отсутствие ограничений по размеру базы данных и числу записей в таблицах. В ряде PostgreSQL используется для хранения данных объёмом до нескольких Петабайт.
4.Oracle существенным минусом данной субд является высокая стоимость лицензии, которая приводит к тому что эту объектно-реляционную субд используют крупные компании и корпорации, которые работают с огромными объёмами данных.
5.SQLite - компактная субд, которая подходит для реализации
небольших сайтов и приложений с ограниченным трафиком и ограниченным
объёмом данных. Эта субд работает на компьютерах, смартфонах, телевизорах и беспилотниках(СВО ГОЙДА ZZZ). Не требует администрирования и поддержки. Состоит из одного файла, встраивается в инфраструктуру в виде
библиотеки с сохранением всех данных на одном устройстве. В качестве языка
запросов используется язык C.
MongoDB - документо-ориентированная субд в которой данные хранятся в виде json файлов. Вместо языка SQL используется собственный язык запросов, который базируется на синтаксисе JavaScript. Вместо таблиц данные хранятся в виде коллекции. Эта субд подходит для работы с большими объёмами данных разных типов, причём данные автоматически распределяются между разными базами, так чтобы оптимизировать нагрузку и
ускорить обработку запросов.
