Консолидация данных

Добавил:

Medi Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

История информатики

Файл:

Конспект и план / конспект.doc

Скачиваний:

Добавлен:

03.06.2014

Размер:

1.88 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 3233 / 3633 34 35 36 > Следующая >>>

Консолидация данных

Идея "вычислительного облака" состоит в объединении множества компьютеров и серверов в единую среду, предназначенную для решения определённого рода задач, например, научных проблем или сложных расчётов. Со временем в такой структуре накапливается множество данных, распределенных по вычислительным узлам и хранилищам. Обычно приложения, исполняемые в распределенной вычислительной среде, обращаются только к одному из источников данных. Однако, при возникновении необходимости в одновременном доступе к нескольким источникам, возникают трудности, так как эти источники могут содержать разнородные данные и методы доступа к ним, а также располагаться на удалении друг от друга. Кроме того, пользователям, осуществляющим анализ накопленных данных, удобно обращаться к единому источнику информации, формируя запросы и получая результаты в одинаковом формате.

Таким образом, главной проблемой подхода к хранению информации в распределенных вычислительных системах является разнородность и удаленность источников данных. Решением проблемы является создание точки централизованного доступа, обеспечивающей единый интерфейс обращения ко всем источникам данных вычислительного облака в режиме реального времени. Необходимо выбрать наиболее подходящий подход и соответствующую платформу, обеспечивающую такую консолидацию.

Существующие подходы к консолидации

Все существующие подходы к консолидации распределенных источников данных можно разделить на два вида:

Централизованный подход

Данные из всех внешних источников переносятся в центральное хранилище и периодически обновляются. Все пользователи работают напрямую с центральным хранилищем.

Федеративный подход

Данные хранятся непосредственно в источниках, центральное звено обеспечивает прозрачное перенаправление запросов пользователей и формирование результатов. В данном случае все пользователи также обращаются только к центральному узлу, который транслирует запросы далее к источникам данных.

Каждый из этих подходов обладает своими преимуществами, необходимо рассмотреть каждый и выявить наиболее подходящий для консолидации данных в вычислительном облаке.

Архитектура централизованных баз данных

Централизованный подход к консолидации распределенных источников данных, заключается дублировании данных из всех источников в центральной БД. Такие БД называются хранилищами данных.

Обычно в качестве хранилища данных используются реляционные СУБД с расширенными средствами для интеграции с внешними источниками.

Наличие данных, объединенных в одном источнике, данных ускоряет пользовательский доступ к данным и упрощает нормализацию и другие подобные процессы по сравнению с данными, разбросанными по разным системам. Однако объединение информации в централизованном источнике требует, чтобы данные, которые часто бывают в разных форматах, были приведены к единому формату, а этот процесс может привести к ошибкам.

Также для хранилища может быть трудным работать с новыми источниками данных в незнакомых форматах. Более того, стоимость обработки часто повышается из-за необходимости дублировать данные и обрабатывать два набора данных.

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 3233 / 3633 34 35 36 > Следующая >>>

Соседние файлы в папке Конспект и план

#
03.06.20141.88 Mб85конспект.doc
#
03.06.201411.26 Кб11План_курса.doc

Консолидация данных

Существующие подходы к консолидации

Архитектура централизованных баз данных