Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дополнительно_ГИС_Шипулин

.pdf
Скачиваний:
32
Добавлен:
21.02.2016
Размер:
4.94 Mб
Скачать

5)установление дополнительных связей между геоданными на основе ихинтеграции;

6)унификация исходных данных и создание возможности обработки и анализа данных, измеренных в разных шкалах и с разными размерностями, в единой системе;

7)создание базы для решения основной задачи геоинформатики - установления пространственных отношений между пространственными процессами, объектами, явлениями и их характеристиками.

4.1.2 Уровни организации данных в ГИС

Организацию пространственных данных в ГИС определяют особенности информации об объектах реального мира, с которыми мы имеем дело. Информация о реальном мире частично относится к индивидуализированным объектам, частично к некоторому непрерывно распределенному в пространстве свойству, то есть пространственному полю каких-либо характеристик. Организация пространственных данных в ГИС зависит также от того, как разные лица и организации воспринимают реальный мир. Ощущение структуры (умственной модели) в реальном мире зависит от образования, ответственности, цели организации, где человек работает, от того, что некоторые части мира имеют большую значимость по сравнению с другими частями.

Уровни организации данных соотносятся по степени абстракции в виде последовательности, показанной на Рис. 4.1.1.

Реальный Мир

Концептуальный уровень

Логический уровень 1

Логический уровень 2

Физический уровень

Рис. 4.1.1 – Последовательность уровней организации данных

221

Концептуальный уровень

Организация данных начинается с трансляции представления пользователя (аналитика) о структуре реального Мира в модели, которые могут быть выполнены на компьютере. Для этого осуществляются следующие мероприятия:

обследование предметной области, изучение ее информационной структуры;

выявление всех фрагментов, каждый из которых характеризуется пользовательским представлением, информационными объектами и связями между ними, процессами над информационными объектами;

моделирование и интеграция всех представлений.

Пи этом определяют: какие географические объекты представляют область изучения, какие отношения между ними существуют, в каких процессахони участвуют.

На этом уровне организации данных получают концептуальную модель данных, инвариантную к структуре базы данных. Часто она представляется в виде модели "сущность-связь".

Рис. 4.1.2 – Пример диаграммы "сущность-связь".

Модели данных описывают пространственные сущности и

атрибуты, их взаимоотношения друг с другом, как они используются людьми, процессы, которые используются для управления ими, и как данные перемещаются во время использования. Модель данных

включает:

пространственные сущности, которые являются компьютерным представлением пространственных объектов от восприятия

222

структуры (например, земельный участок, лес, участок трубы, нефтяная скважина),

описательные данные пространственных сущностей, обычно

называемые атрибутами.

Взаимоотношения сущностей выражаются связями (Relationships). Различают классы связей и экземпляры связей. Классы связей это взаимоотношения между классами сущностей, а экземпляры связи взаимоотношения между экземплярами сущностей. Класс связей может затрагивать несколько классов сущностей. Число классов сущностей, участвующих в связи, называется степенью связи n = 2,3,… При n = 2 связь называется бинарной.

В зависимости от того, сколько экземпляров сущности одного класса связаны со сколькими экземплярами сущности другого класса, различают следующие типы связей:

связь 1:1 - единичный экземпляр сущности одного класса связан с единичным экземпляром сущности другого класса.

связь 1:M - единичный экземпляр сущности одного класса связан со многими экземплярами сущности другого класса.

связь M:N - несколько экземпляров сущности одного класса связаны с несколькими экземплярами сущности другого класса.

Числа, описывающие типы бинарных связей 1:1, 1:M, M:N, обозначают максимальное количество сущностей на каждой стороне связи. Эти числа называются максимальными кардинальными числами, а соответствующая пара чисел называется максимальной кардинальностью.

К этому уровню относятся термины типа полигон, полилиния, дуга, идентификатор, таблица, слой, тема, способ индексирования. Это уровень больше пользователя и администратора базы данных, а также разработчика систем. Все это касается не столько программирования, сколько некоторых разделов математики, с одной стороны, и соотношения элементов модели данных с действительными объектами реального мира, с другой. Основной решаемый на этом уровне вопрос - это вопрос степени адекватности модели данных решаемой задаче. Достаточно ли точно, с сохранением всех ли нужных связей выбранная модель данных позволит смоделировать в компьютере реальную ситуацию?

223

Логический уровень 1

На более детальном логическом уровне 1 организации данных выполняется преобразование требований к данным в структуры данных безотносительно к конкретной СУБД. Для представления структур данных используются записи, элементы данных, связи между записями. Здесь уже фигурируют и математические и программистские термины, такие, как матрицы, списки, системы ссылок, указатели, механизмы сжатия информации. Основные вопросы, которые рассматриваются на этом уровне, это вопросы эффективности в смысле экономии места и быстродействия, то есть уже чисто внутренние компьютерные вопросы эффективности. Логический уровень 1 – это представление программиста.

Логический уровень 2

На следующем по детальности логическом уровне 2 организации данных мы уже имеем дело со структурой файлов и их форматами применительно к конкретной СУБД. Это размещения информации в файле - что вынесено в его заголовок, и как он организован, что в какой последовательности и какими формами представления чисел записано в этих файлах. Это уровень уже чисто программистский. Рядовому конечному пользователю полезно знать назначение конкретных файлов в определенных структурах данных, возможности и ограничения по использования конкретных форматов файлов.

Физический уровень

На физическом уровне организации данных создается структура конкретной базы данных ГИС. Здесь определяются особенности хранения данных, методов доступа, какие объекты вносятся в базу данных, как они распределены между слоями, какие используются классификаторы и т.д. Для описания структуры используются группировки данных, индексы, методы доступа. Уровень организации конкретной структуры базы данных ГИС уникальный для каждого конкретного проекта.

На основании изложенного, основные характеристи уровней организации данных в ГИС могут быть представлены таблицей 4.1.1.

224

Табл. 4.1.1 – Характеристики уровней организации данных

Уровень

Информационная

Компоненты модели

 

модель

 

Концептуальный

Модель данных

Сущности,

уровень

 

атрибуты, связи

Логический

Структура данных

Записи, элементы

уровень 1

 

данных,

 

 

связи между

 

 

записями

Логический

Структура файлов,

Конкретные файлы,

уровень 2

форматы

форматы

Физический

Структура

Группировки

уровень

конкретной базы

данных, индексы,

 

данных

методы доступа

Инструментарий

Приведенным уровням моделирования при разработке базирующейся на использовании СУБД прикладной системы соответствует достаточно обширный языковый инструментарий, позволяющий организовать работу с соответствующими моделями. Пример применения современных средств при разработке моделей данных в АО " СПАЭРО Плюс":

Логические модели предметной области и структуры геобаз данных разрабатываются с помощью CaseTools, поставляемых ESRI в составе ArcGIS. Логическая модель строится в виде набора UML-диаграмм с помощью программного пакета Visio™. При этом используются модифицированнные шаблоны ESRI. UML- модель является с одной стороны средством документирования и наглядного представления будующей базы геоданных, а с другой стороны исходным материалом для описания структуры базы геоданных на языке XML.

Физическая структура базы геоданных генерируется из XML описания с помощью инструментов ArcCatalog и, при необходимости, дорабатывается с их же использованием.

Преимуществами применяемой технологии является: полное документирование разработки; наглядность представления структуры базы геоданных, включая все объектные и пространственные классы, их наборы и классы отношений между ними; возможность легко и быстро модифицировать структуру

225

базы геоданных с полным документированием вносимых изменений.

4.1.3 Принципы организации данных в ГИС

Существует множество структур данных, используемых для представления географических объектов, в зависимости от потребностей в данных и их последующего использования. Наибольшее распространение получили два общепринятых принципа организации моделей пространственных данных [27]:

принцип послойной организации информации (его часто называют классическим),

объектно-ориентированный принцип организации данных.

Послойный принцип организации информации

Реальный мир состоит из множества географических объектов. Декомпозиция реального мира может быть выполнена путем стратификации - процедуры, которая разбивает множество географических объектов на страты или слои, удобные для обработки и анализа. В результате изучаемая область реального мира представляется набором слоев взаимосвязанных данных.

Послойный принцип организации информации заключается в том, что данные о территории организуются (расслаиваются) в виде набора тематических слоев. Слой состоит из однородных данных, объединяемых общей тематикой. Например, в один слой выносятся все объекты гидрографии, или все шоссейные дороги, или все, относящееся к растительному покрову (Рис.4.1.3).

226

Рис. 4.1.3 - Иллюстрация концепции вертикального расслоения объектов земной поверхности.

Послойный принцип организации информации очень нагляден и хорошо соотносится с приемами традиционной картографии.

Объектно-ориентированный принцип организации данных

Другой принцип появился относительно недавно и связан с объектно-ориентированным подходом, типовым для современного программирования. При этом группировка объектов соответствует их логическим взаимосвязям. Объектно-ориентированный принцип организации данных в ГИС фокусирует внимание не столько на общих свойствах объектов (моделируемых через деление на слои в предыдущем подходе), сколько на их положении в какой-либо сложной иерархической схеме классификации и на взаимоотношениях между объектами. В силу этого удобно отображаются различные родственные и генетические отношения между объектами, отношения соподчиненности, функциональные связи между объектами.

Такой подход ближе к структуре человеческого мышления. Он эффективен, когда необходимо использование логических взаимосвязей объектов, но мало полезен при непрерывном распределении в пространстве признаков (рельеф, удельное содержание полезного ископаемого, загрязнение почвы тяжелыми металлами).

227

Комбинации принципов организации данных

При комбинации принципов организации данных используются и слои, и отдельные объекты, каждый из которых представляется как отдельный слой. Слои могут быть интегрированы.

4.1.4 Виды моделей организации данных

Принципы организации данных определяют соответствующие модели организации данных:

1)геореляционная модель организации данных;

2)объектно-ориентированная модель организации данных;

3)объектно-реляционная модель организации данных.

Широкое распространение получили модели данных ESRI: а) геореляционная модель организации данных в виде модели данных "Шейпфайл" и модели данных "Покрытие", б) объектно- ориентированная модель организации данных в виде модели данных "База геоданных". На рис.4.1.4 представлена иерархия моделей данных ESRI от общего верхнего уровня моделей географических объектов до нижнего специального уровня организации данных.

Рис. 4.1.4 – Модели данних ESRI [47]

На рис. 4.1.4 модель данных "База геоданных" представлена как ветвь векторной объектно-ориентированной модели, которая в ней играет ведущую роль. Фактически база геоданных содержит модели данных "шейпфайл" и "покрытие", растровые и триангуляционные модели данных.

228

4.1.5 Контрольные вопросы и задания для самостоятельной работы

1)Что понимается под системной организацией данных?

2)Приведите характеристику уровней организации данных.

3)Какие принципы организации моделей пространственных данных получили наибольшее распространение?

4)Представьте иерархию моделей организации данных.

229

Раздел 4.2

ГЕОРЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ

4.2.1 Сущность геореляционной модели данных

В базе данных, спроектированной как реляционная модель данных, данные хранятся как наборы таблиц (называемых отношениями), которые логически ассоциированы друг с другом с помощью общих атрибутов. Отдельные записи хранятся как строки таблиц, в то время как атрибуты хранятся в виде колонок. Каждая колонка может содержать атрибутивные данные только одного типа: дату, текстовую строку, числовые данные и т.п. Таблицы обычно стандартизуются для минимизации дублирования.

ГИС содержит два типа данных пространственные и семантические.

Пространственные даные географических объектов хранятся в отдельных таблицах пространственных данных в виде последовательности координатных пар Х,У.

Атрибутивные данные географических объектов

организовываются в таблицы атрибутивных данных. Число записей в таблицах атрибутов равно числу графическихобъектов в двоичных файлах.

Отношения между географическими объектами делаются явными с помощью топологии, которая также представляется соответствующими таблицами.

ВГИС, ориентированных на работу с базами данных (в частности,

вARC/INFO) [28], успешно применяется геореляционная модель данных (Georelational Data Model). Сущность этой модели заключается

враздельном хранении значений координат и атрибутивных данных. Эта модель основана на геометрическом типе объекта и отображает мир в виде наборов точек, линий и полигонов. Координаты каждого

объекта с уникальным идентификационным номером, хранятся в двоичных "arc"-файлах. Атрибутивные значения и описание топологии хранятся в таблицах реляционной СУБД (изначально в INFO таблице). Записи связаны с геометрией посредством идентификационного номера объекта (Identifier – ID). Модель географических данных представляет географические объекты как набор взаимосвязанных пространственных и атрибутивных данных. При этом ГИС осуществляет совместное согласованное управление целостной

230