Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4 курс / 1 семестр / ГИС / Лурье И.К. - Геоинформационное картографирование - М., КДУ - 2008.pdf
Скачиваний:
1432
Добавлен:
23.07.2018
Размер:
14.5 Mб
Скачать

5Л. Методы пространстве

1НЯ

207

подробно в курсе математики, а анализ пространственных моделей входит в задачи курса «Математико-картографическое моделирование» [Тикунов, 1997]. В ГИС-пакетах и других специализированных графических пакетах программ обычно предлагается несколько способов интерполяции, из которых пользователь выбирает наиболее подходящий для моделируемой поверхности и существующего набора точек (обычно экспериментально). Рассмотрим некоторые особенности разных методов интерполяции, знание которых необходимо для выбора лучшего для поставленной задачи способа.

5.2.3. Интерполяция по дискретно расположенным точкам

Общая задача интерполяции по точкам формулируется так: дан ряд точек (узлов интерполяции), положение и значения характеристик в которых известны, необходимо определить значения характеристик для других точек, для которых известно только положение. При этом различают методы глобальной и локальной интерполяции, и среди них точные и аппроксимирующие.

При глобальной интерполяции для всей территории одновременно используется единая функция вычисления z = F(x, у). В этом случае изменение одного значения (х, у) на входе сказывается на всей результирующей ЦМР. При локальной интерполяции многократно применяют алгоритм вычисления для некоторых выборок из общего набора точек, как правило, близко расположенных. Тогда изменение выбора точек сказывается лишь на результатах обработки небольшого участка территории. Алгоритмы глобальной интерполяции создают сглаженные поверхности с небольшим числом резких перепадов; они применяются в случаях, если предположительно известна форма поверхности, например, тренд. При включении в процесс локальной интерполяции большой доли общего набора данных она, по сути, становится глобальной.

Точные методы интерполяции воспроизводят данные в точках (узлах), на которых базируется интерполяция, и поверхность проходит через все точки с известными значениями.

При точной интерполяции необходимо решить два вопроса: как выбирать точки из сети и как представлять поверхность между ними. Проще всего они решаются для регулярной сети точек, и вместе с тем применяются для построения такой сети и ее сгущения. Наиболее часто используемые методы основаны на линейной интерполяции,

208

Глава 5. Географический анализ и пространственное моделирование

выполняемой от точки к точке: каждая пара точек сети соединяется отрезками прямых линий.

Локальная кусочно-линейная интерполяция поверхности.

В этом методе аппроксимируемая поверхность представляется совокупностью плоских треугольников с вершинами в трех соседних точках (х, уг г.). Эта плоскость, уравнение которой, очевидно, есть

х-

i

У- У\

z- zt

 

-

X 1

У2- У\

z\ = 0

 

*3"-

X"i

Уз- У\

21

(5.9)

или

 

 

 

 

У2 ~1/1*2-21

 

Х2~ xl Z2~ zl

 

Уъ~У\ гз~

 

 

х \ 23" zi

 

х2~ Х\ У2 ~У\

хх ) +Х2~ Х1 У2~У\

(У~У\)>

х3~ х\Уз~

У\

 

х3 ~ х\Уз~ У\

(5.10)

проходит через высоты г. всех трех выбранных точек. Таким образом, получается мозаичная поверхность, состоящая из треугольников, прилегающих друг к другу смежными сторонами (рис. 5.5).

Рис. 5.5. Кусочно-линейная интерполяция поверхности

Таким способом представляют поверхность в TIN-моделях Поскольку для каждого треугольника она задается высотами трех его вершин, то в общей мозаичной поверхности треугольники для смежных участков точно прилегают по сторонам; образуемая поверх-

$ J. Методы пространственного моделирования

209

ность непрерывна. Однако если на поверхности проведены горизонтали, то в этом случае они будут прямолинейны и параллельны

впределах треугольников, а на границах будет происходить резкое изменение их направления. Поэтому для некоторых приложений TIN

впределах каждого треугольника строится математическая поверхность, характеризующаяся плавным изменением углов наклона на границах треугольников.

Другой метод — анализ соседства, в котором все значения моделируемых характеристик принимаются равными значениям в ближайшей известной точке. В результате образуются полигоны Тиссена с резкой сменой значений на границах. Такой метод применяется в экологических исследованиях, при оценке зон воздействия, и больше подходит для номинальных данных.

Аппроксимационные методы интерполяции применяются в тех случаях, когда существует некоторая неопределенность в отношении имеющихся данных о поверхности; в их основе лежит соображение о том, что во многих наборах данных отображается медленно изменяющийся тренд поверхности, на который накладываются местные, быстро меняющиеся отклонения, приводящие к неточностям или ошибкам в данных. В таких случаях сглаживание за счет аппроксимации поверхности позволяет уменьшить влияние ошибочных данных на характер результирующей поверхности.

В аппроксимационных методах интерполяции осуществляется подбор некоторой функции, такой что z ~ F(x, у). Обычно функция отыскивается в виде полиномов заданной степени т вида

mm

 

1=0 ;=0

(5.11)

где z — моделируемый показатель, а.. — коэффициенты полинома, х, у — координаты точек сети. Коэффициенты обычно определяют методом минимизации среднеквадратических отклоненийJ поверхности z(x, у) от заданных высот zs:

 

 

2

Z5

-XXatJX^S

mm,

5 = 1

1=0>=0

(5.12)

для чего необходимо, чтобы число точек было больше величины (т + 1 )(т + 2)/2. Для определения неизвестных коэффициентов

210

Глава 5. Географический анализ и пространственное моделирование

аппроксимации а., необходимо решить систему линейных уравнений

dav

(5.13)

Множество аналитических средств географического анализа и моделирования, наиболее востребованных в ГИС и доступных в той или иной форме в современных ГИС-пакетах, представляют методы:

построения и анализа статистических поверхностей;

определения местоположения и оптимального размещения;

моделирования пространственных распределений.

5.2.4. Построение статистических поверхностей

Поверхности, представляемые математическим соотношением 2 = F(x,y), принято считать «статистическими», поскольку в общем случае2 представляет статистическое распределение характеристик рассматриваемых явлений [Robinson et al, 1995]. Значения z могут быть либо непрерывны в области исследования, либо считаться непрерывными в целях моделирования и картографирования. Пространственное моделирование на основе информации о реальных и так называемых расчетных объектах и процессах, в том числе социально-экономических, базируется на методах пространственной интерполяции.

Получаемые поверхности могут быть непрерывными или дискретными. Непрерывные поверхности представляются матрицами значений, TIN-моделями или изолиниями. Дискретные поверхности создают по данным о дискретных по своей природе объектах, а методы их изображения и анализа основаны на построении карт плотности точек или картограмм, которые, как правило, отражают области сбора данных.

Наиболее развиты методы представления географических полей — непрерывных поверхностей, определяемых набором пространственных координат и скалярными значениями характеристик в точках с этими координатами, например, создание карт рельефа на основе его цифровых моделей (ЦМР). Подобные процедуры имеются во многих растровых пакетах программ (ERDAS. Idrisi, Ilwis), векторных (Arclnfo, Spatial Analyst), в пакете программ

$J.Методы пространственного моделирования

211

моделирования поверхностей Surfer и др. Для

моделирования

и анализа географической информации на кафедре картографии и геоинформатики МГУ создан пакет программ МАГ, хорошо зарекомендовавший себя во многих прикладных исследованиях, но не имеющий статуса коммерческого ГИС-пакета.

Непрерывные статистические поверхности, создаваемые на основе отдельных точек с известными значениями моделируемого показателя (высот, концентраций, загрязнений и т. п.), представля- ются в растровом формате. Задача выбранного метода моделиро- вания — присвоить каждой ячейке растра (прямоугольной сетки или GRID'a) рассчитанное в результате интерполяции значение.

Используются четыре основные класса методов моделирования статистических поверхностей, отличающиеся разными математическими подходами.

1.Методы обратных взвешенных расстояний, основанные на предположении, что каждая измеренная точка имеет влияние, убывающее с расстоянием.

2.Методы сплайнов, исходящие из условия минимальной кривизны поверхности, проведенной через исходные точки.

3.Методы кригинга, в основе которых лежит предположение, что расстояние и направление изменений между точками указы- вает на пространственную корреляцию, помогающую описанию поверхности.

4.Методы выявления тренда, базирующиеся на вычислении полиномиальной математической функции для всех исходных точек методом наименьших квадратов, тем самым минимизируется откло- нение от исходных точек.

Большая часть других разработок представляет различные модификации этих методов, использующие математические либо полуэмпирические приемы для их усовершенствования и улучшения компьютерной реализации.

Выбор одного из методов, эффективного для конкретного практического применения — довольно сложная экспертная процедура. Она, как правило, осуществляется экспериментальным путем, в результате чего может быть сделан вывод о необходимости использования разных способов для разных участков территории и «склейки» результирующих моделей. Часто достаточно хорошего знания методов и используемых данных.

212 Глава 5. Географический анализ и пространственное моделирование

Метод обратно взвешенных расстояний (ОВР) используется наиболее широко, особенно для моделирования плавно меняющихся поверхностей. Он основан на главном принципе географии — чем ближе расположены объекты, тем более они похожи. Для ячейки сетки, значение которой не измерено, в пределах заданной окрестности (или расстояния) ведется поиск измеренных значений. Поскольку более близкие значения должны быть более похожи, на расчет значения ячейки они окажут больше влияния, чем дальние значения. Отсюда название «вес, обратно пропорциональный расстоянию» — чем больше расстояние до известной точки, тем меньше вес (вклад) ее измеренного значения в интерполированном. Процедура поиска выполняется для каждой ячейки сетки, построенной для исследуемой территории.

Интерполированные значения представляют собой среднюю величину значений для п известных точек, либо среднее, полученное по интерполируемым точкам, и в общем случае представляются формулой

пп

М

;=i

(5.14)

где w— некоторая функция

расстояния

d, например: w = 1 /d~

или w = e~fl. Можно использовать почти

неограниченное число

алгоритмов, влияющих на характеристики интерполируемой поверхности, различающихся по характеру функции расстояния, количеству исходных точек, способу их отбора. Обычно выбирают либо заданное число ближайших точек, либо точки, лежащие в окрестности заданного радиуса. При задании необходимого для интерполяции числа ближайших точек радиус поиска будет переменным, зависящим от разброса измеренных точек. Фиксированный радиус задает одинаковые круговые окрестности для всех интерполируемых ячеек, и если измеренные точки расположены неравномерно, то интерполяция будет выполнена с использованием разного количества точек. Может возникнуть ситуация, когда в заданной окрестности число точек будет недостаточным для выполнения интерполяции.

Рассмотрим способ, основанный на вычислении расстояний между точками, получивший название мультиквадриковой интерполяции, который описывается уравнением

$ J. Методы пространственного моделирования

213

Z(x, у)= i c j ( ( X j - х)2+ (у J-

у)2)2.

 

(5.15)

Коэффициенты с. играют роль весовых коэффициентов и вычисляются через значения, измеренные в точках, как произведение обратной матрицы расстояний между известными п точками гу), 1=1,..., п на вектор измеренных значений z в этих точках:

(5.16)

элементы матрицы определяются как

((*,- Xj)2+ (у,- y j f f 2 .

Подставляя с. в уравнение (5.15), определяют z в произвольной

точке (х, у).

Точки для этого способа находят следующим образом. Сначала строят прямоугольник, содержащий все опорные точки. Затем он разбивается линиями, параллельными сторонам, на более мелкие квадраты (или прямоугольники) таким образом, чтобы в них входило число точек, достаточное для обеспечения точности аппроксимации поверхности в пределах каждого квадрата. Точки, лежащие на границах двух смежных квадратов, участвуют в обработке дважды, а четырех — четырежды. Таким образом, связующие точки (известные и построенные узловые) «склеивают» поверхности соприкасающихся квадратов в единую непрерывную поверхность.

Преимуществом метода ОВР является его локальность: на значения моделируемой функции в любой точке практически не оказывают влияния опорные точки, далеко отстоящие от нее. Этот метод дает хорошие результаты в случае плотно расположенных известных точек.

Метод Кригинга, известный как кригинг, получил широкое распространение для интерполяции физических и абстрактных поверхностей, особенно при редких или разбросанных данных. Применение

1 Разработан Дж. Матероном как «метод регионализированных переменных» и Д. С. Кригом как способ интерполяции данных в горной индустрии.

214 Глава 5. Географический анализ и пространственное моделирование

метода базируется на том факте, что географические данные пространственно коррелированны. Метод схож с методом ОВР, поскольку также учитывает вес измеренных значений в окружающих точках при расчете значения для ячейки, в которой нет измерений. Но метод ОВР относится к детерминистическим методам интерполяции, поскольку он опирается только на окружающие измеренные значения, а кригинг относится к методам геостатистической интерполяции, учитывающим также статистическую взаимосвязь между точками измерений. Основа кригинга — определение закономерностей изменения разброса значений моделируемого показателя (дисперсии) между точками в пространстве и подчеркивание существенных различий в значениях данных, используя весовые коэффициенты. Это статистический метол вычисления корреляции точек измерений с помощью вариографии — структурного анализа путем построения экспериментальной кривой, называемой вариограммой. При расчете неизвестного значения ячейки ближайшим точкам измерений присваивается вес, зависящий от их распределения вокруг рассчитываемой ячейки. Метод позволяет оптимизировать интерполяцию путем подразделения пространственных вариаций на три компоненты: 1) детерминированную вариацию (тренд); 2) пространственно автокоррелированную, зависящую от соседних значений данных, но физически трудно объяснимую вариацию; 3) некоррелированный шум.

Рассмотрим метод на примере одномерной

функции z(x)

Значения г в точке х может быть представлено как

 

z{x) = т(х) + е\х) + в",

(5.17)

где т(х), е\х), е" — три описанные компоненты.

Различают ординарный и универсальный кригинг. В ординарном кригинге тренд т(х) предполагается постоянным, но неизвестным и рассматривается как константа, эквивалентная среднему значению данных. При универсальном кригинге предполагается, что в данных имеется тенденция к доминированию определенных значений, и т(х) можно смоделировать с помощью полиномиальной функции; обычно используют полиномы первой или второй степени.

В обоих случаях необходимо определить компоненту е\х) которая отражает закономерность возрастания дисперсии значений: (полудисперсии), представленных неупорядоченной выборкой точек, в зависимости от расстояния. Определяют ее экспериментально.

$J. Методы пространственного моделирования

215

представляя результаты в виде графика — вариограммы (рис. 5.6). Вариограмма имеет три характерные составляющие, позволяющие оценить параметры модели: верхний предел роста вариограммы — асимптота d(h) или «пласт» (sill); расстояние, на котором этот предел достигается, — предельный радиус корреляции или диапазон (range); отрезок от начала координат до пересечения с осью d(h) — эффект самородка или остаточная дисперсия (nugget variance).

Рис. 5.6. Вариограмма

Вариограмма показывает, насколько в каждом случае верно предположение (соответствующее определению пространственной автокорреляции), что пары точек, расположенные ближе, должны иметь меньшую разницу в измеренных значениях.

Для ускорения построения вариограммы при вычислении расстояний между всеми парами точек их объединяют в интервальные группы (лаги). Один из способов может быть таким. Сначала весь диапазон расстояний разбивается на ряд равных интервалов, например, на 10, от 0 до максимального значения расстояния между точками на изучаемой территории; тем самым задается размер интер- вала А. Для каждой пары точек вычисляется расстояние и квадрат разности значений г. Эта пара точек включается в соответствующий интервал расстояний, а для каждого из них накапливается общая дисперсия. После обработки всех пар точек (или выборки пар при большом массиве данных) для каждого интервала расстояний подсчитывается средняя дисперсия

216 Глава 5. Географический анализ и пространственное моделирование

представляющая среднее различие между значениями в двух любых точках, находящихся на расстоянии h друг от друга. Эта величина отмечается на графике в средней точке соответствующего интервала (см. рис. 5.6).

Положительное значение d(h) при h—>0 или «эффект самородка* служит оценкой е". Если «эффект самородка» отличен от нуля, это означает, что повторные измерения в одной и той же точке дали разные результаты. Нужно помнить, что кривая является оценочной, поэтому разница между нулевой дисперсией при нулевом шаге и предсказываемым положительным значением является пространственно некоррелированной шумовой дисперсией. Как указывает П. А. Бэрроу [Burrough, 1998], остаточная дисперсия «объединяет дисперсию ошибок измерения с дисперсией, которая имеет место на расстояниях, меньших, чем интервалы снятия отсчетов, и которые не могут быть устранены».

Эмпирическая вариограмма предоставляет информацию о пространственной автокорреляции наборов измеренных данных, но не дает информацию для всех возможных направлений и расстояний. Поэтому необходимо подобрать модель автокорреляции к точкам вариограммы — непрерывную кривую (аналогично регрессивному анализу). Для построения кривой используют метод наименьших квадратов и разные функции: круговую, сферическую, экспоненциальную, линейную. Выбор модели влияет на вычисление неизвестных значений точек. Чем круче кривая вблизи точки начала отсчета, тем больше влияние ближайших точек измерений на вычисление. В результате полученная поверхность будет менее гладкой.

Модель вариограммы и пространственное распределение ближайших точек используют для расчета весовых коэффициентов при интерполяции и построения поверхности. Интерполированное значение — это сумма взвешенных значений некоторого числа известных точек, причем веса зависят от расстояний между ними и точкой, для которой производится интерполяция. Весовые коэффициенты выбираются таким образом, чтобы минимизировать вариации оцениваемых показателей.

Метод кригинга гибок и эффективен для многих произвольных наборов данных, даже если не делаются предположения, что вариограмма имеет асимптоту (вариограмма линейна); он позволяет не только получить расчетную поверхность, но также определить

$J.Методы пространственного моделирования

217

значение точности или достоверности расчета. Кроме ГИС-пакетов, процедуры кригинга имеются, например, в пакете Surfer (Golden

Software).

Метод кригинга применяют для оценки статистических свойств самих исходных данных, таких как изменчивость пространственных данных, их распределение, репрезентативность, зависимость (взаимосвязи) и глобальные тренды. При решении подобных задач, которые называют «исследовательский анализ данных», в ArcGIS используют модуль Geostatistical Analyst.

Для интерполяции и аппроксимации различных поверхностей используют также полиномы Фурье, анализ автокорреляции, кусочно-полиномиальную интерполяцию с заданием степени полинома и прямоугольника, включающего все точки сети. Этот прямоугольник разбивают на сеть более мелких, для каждого из которых и строится свой полином известной степени.

Метод полиномиального тренда строит поверхность, аппрок-

симируемую многочленом, и структура выходных данных имеет вид алгебраической функции, которую можно использовать для расчета значений в точках растра или в любой точке поверхности. Функция подбирается так, чтобы наилучшим образом пройти через все точки, т. е. минимизировать отклонение от точек измерений. Для нахождения коэффициентов полинома применяют метод наименьших квадратов. Полином позволяет рассчитать глобальный тренд поверхности, а локальные вариации показывают отклонения

от тренда.

Линейное уравнение, например, z = a + bx+cy описывает наклонную плоскую поверхность, а квадратичное z = а + Ьх +су + (be1 + еху + fу1простой холм или долину. Вообще говоря, любое сечение поверхности ш-го порядка имеет не более ( т - 1) чередующихся максимумов и минимумов. Например, кубическая поверхность может иметь в любом сечении один максимум и один минимум. Возможны значительные краевые эффекты, поскольку полиномиальная модель дает выпуклую поверхность. Для сложных поверхностей создают множества локальных полиномов.

Метод целесообразно применять в случаях, когда интерес представляют общие тенденции изменения поверхности, а не точное моделирование ее мелких деталей. Он полезен в тех случаях, когда есть некоторая неопределенность в отношении имеющихся данных