
- •Лекция 1 Задачи анализа пространственных данных
- •1. Проблемы пространственного моделирования
- •2. Постановка задачи пространственного анализа
- •3. Подходы к анализу пространственно распределенных данных
- •1.4. Основные этапы анализа и моделирования пространственных данных
- •1.4. Основные этапы анализа и моделирования пространственных данных
- •Вопросы, возникающие при пространственном моделировании
- •Библиография по геостатистике
Лекция 1 Задачи анализа пространственных данных
Вопросы для обсуждения:
1. Проблемы пространственного моделирования
2. Постановка задачи
3. Подходы к анализу пространственно распределенных данных
4. Основные этапы анализа и моделирования пространственных данных
1. Проблемы пространственного моделирования
Существует огромное количество пространственно распределенной информации, собранной в базы и банки данных по окружающей среде. Задача ее интерпретации, анализа и дальнейшего использования представляется чрезвычайно важной и требует комплексного системного подхода. Статистическое моделирование пространственных явлений позволяет обобщить имеющиеся измерения и получить модель их распределения в пространстве.
Анализ и моделирование пространственных данных с использованием статистических методов позволяет ответить на ряд вопросов:
1). Как построить карту загрязнения?
2). Можно ли обойтись простыми методами интерполяции?
3). Можно ли дать однозначный ответ о том, где проходит граница повышенного уровня загрязнения?
Наиболее распространенной проблемой при работе с пространственно распределенными данными является получение пространственной оценки. При этом, также важен вопрос о качестве и точности получаемых карт, неопределенности оценки, чувствительности использованных методов интерполяции и т.п.
Пространственное моделирование применяется во многих сферах человеческой деятельности. Так, при климатическом моделировании анализируются измерения температуры, осадков, скорости ветра и т. д. в различных точках пространства. При моделировании загрязнения окружающей среды используются измерения (пробы грунта, воды, воздуха, дистанционное зондирование) в различных местах. В задачах геологии моделируются свойства пород в промежутке между скважинами, где делаются измерения. В медицинской географии анализируются факторы, влияющие на уровень заболеваний, и моделируется распространение эпидемий. Пространственно распределенные данные используются при моделировании запасов полезных ископаемых и рыбных ресурсов, социально-экономической, криминогенной ситуации и природных катастроф (оползней, лавин и пр.).
Глубокий анализ и моделирование пространственных данных требуют применения комплексного подхода и различных методов, характеризующих ту или иную особенность явления. Сложность такого анализа обусловлена несколькими факторами: наличием больших объемов количественной и качественной информации по исследуемому явлению, многомасштабностью и многопеременностью, наличием различных факторов влияния.
2. Постановка задачи пространственного анализа
При работе с пространственными данными обычно имеется некоторое количество измерений изучаемой переменной в различных точках, число которых ограниченно. Итак, есть область, на которой проведен ряд измерений некоторой величины Z. Эти измерения проведены в произвольно распределенном по области наборе точек (х, у), которые мы будем называть сетью мониторинга (рис. 1). Но есть и участки области, не покрытые измерениями, о значениях величины Z в которых хотелось бы получить информацию. Наиболее часто требуется оценить значение наблюдаемой величины в непромеренной точке X на основе имеющихся данных, т. е. решить задачу интерполяции.
Рис. 1 Постановка задачи пространственного оценивания
Данные измерений, как правило, дискретны и пространственно неоднородно распределены. Анализ данных и его результаты зависят от качества и количества исходных данных, от методов и моделей обработки данных.
Перечень конкретных задач, для решения которых необходимо применение комплекса исследований с помощью методов геостатистики - т.е. статистики пространственно распределенной информации:
оценить значение в точке, где измерение не проводилось;
нарисовать карту, построить изолинии (определить значения на плотной сетке);
оценить ошибку интерполяционной оценки;
оценить значение переменной, по которой мало измерений, используя значения другой коррелированной с ней переменной, по которой проведено много измерений;
определить вероятность того, что значения наблюдаемой переменной превысят заданный уровень в интересующей нас области;
получить набор равновероятных стохастических пространственных реализаций распределения наблюдаемой переменной.
Первые три задачи — примеры задач регрессии или классификации (в зависимости от типа исходных значений). Две последние задачи относятся к вероятностному анализу и связаны с оценками риска.