Концепции МРР и параллельных систем БД
Параллельные системы БД альтернативный подход к управлении очень большими базами данных по сравнению с централизованными БД. Основная идея систем обработки данных с МРР –декомпозиция вычислительных задач на большое количество параллельно выполняемых операций. Архитектура МРР масштабируема до
тысяч процессоров, в ней исключены узкие места за счет более совершенных межпроцессорных коммуникаций и схем доступа к памяти.
Каждый оператор порождает новое отношение.
Множество операторов может быть представлено в виде сильно распараллеленного графа потоков данных.
При конвейерном параллелизме, результат выполнения оператора А направляется на вход оператору В, где В выполняется вслед за А.
Параллельные системы БД:
Для реализации параллелизма с фрагментацией, должны быть фрагментированы исходные данные.
Фрагментация данных является НЕОБХОДИМОЙ предпосылкой для применения параллельных систем БД.
Параллельные системы подразделяются:
Системы с разделяемой памятью – все процессы имеют непосредственный доступ к общей глобальной памяти и ко всем дискам;
Системы с разделяемыми дисками – каждый процессор имеет собственную память, и может обращаться ко всем системным дискам;
Системы без разделения ресурсов – ни диски, ни память не разделяются, процессоры взаимодействуют посредством межпроцессорных сетей.
Схемы фрагментации
•Фрагментация по диапазонам
•Карусельная фрагментация
•Фрагментация хешированием