Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция.10docx.doc
Скачиваний:
7
Добавлен:
02.12.2018
Размер:
835.58 Кб
Скачать

6. Методы районирования.

Алгоритмы формального районирования направлены на получение терри­ториально нерасчлененных районов, выделяемых по критерию их несхожести в признаковом пространстве с учетом выбранной метрики или матрицы близостей ОТЕ-ОТЕ. Районирование является классической задачей географии, где оно выполняется по логическим правилам и кроме признака несхожести и террито­риальной нерасчлененности районов зачастую, как, например, в социально-экономической географии, требуется дополнительно наличие ядра районообра-зования, районообразующих связей и др. Ряд алгоритмов формального райони­рования, с одной стороны, практически полностью дублирует алгоритмы клас­сификации с добавлением дополнительной процедуры проверки условия на на­личие смежности у объединяемых в районы территориальных единиц. С другой стороны, существуют специфические алгоритмы районирования, для которых отсутствуют аналоги в классификации (например, метод барьеров максималь­ных различий, классические примеры физико-географического районирования).

Для систематизации методов районирования, по аналогии с обычными классификациями, используют несколько оснований.

По сфере применения выделяют природное и социально-экономическое районирование. Именно в этих сферах важна территориальная нерасчленен­ность районов. Природные признаки априорно распределены непрерывно по

20

территории, а социально-экономическая география является основой террито­риального управления.

По интерпретации расстояний между объектами в пространстве при­знаков многие авторы выделяют узловое и однородное районирование. Узловое районирование позволяет формировать районы на основе силы связей между ОТЕ, однородное - на основе «похожести» значений их показателей. С содержа­тельной точки зрения это разные группы методов. С математической точки зре­ния разница между ними сводится только к различию способов выбора метрики и функционалов расстояний и качества.

По степени охвата районирование можно подразделить на интегральное и отраслевое [В.И.Блануца, 1993. - С. 3]. Например, в случае экологического интегрального районирования оценивается экологическая ситуация в целом, а в случае отраслевого экологического районирования - какой-либо аспект эколо­гической ситуации (состояние воздушной среды, почв, растительного покрова и т.д.). Отраслевое районирование отличается от интегрального только подбором признаков и способом их предварительной обработки.

По динамике изменения характеристик классов ОТЕ в одном из про­странств методы районирования подразделяются на нацеленные на выявление районов с разными трендами атрибутивных признаков и на определение тен­денции изменения сетки районов.

Методы районирования, основанные на описании районов ядрами. Основ­ной проблемой этого класса методов является выбор ядер районов, которые обязаны быть реальными ОТЕ. После того как ядра районообразования получе­ны, начинается последовательное присоединение к ним максимально «похо­жих» смежных ОТЕ.

В экологических и географических исследованиях часто применяют для районирования стандартные методы классификации, а после получения классов анализируют их пространственную структуру. Затем, выделив в каждом классе несколько ОТЕ, образующих пространственно-целостный район, полагают их

21

ядрами районов. После этого выделенные ядра расширяются путем докласси-фикации оставшихся ОТЕ по приведенному выше алгоритму.

Методы районирования, основанные на модели смеси распределений. Па­раметрические методы классификации на основе модели смеси распределений играют важнейшую роль в прикладной статистике. На основе этих методов раз­работаны эффективные алгоритмы, которые могут применяться для классифи­кации и экологических, и географических данных.

В работе [С. Ambroise, G. Govaert, 1996] описана модификация ЫУ1-алгоритма, которую авторы назвали NEM-алгоритмом (Neighborhood ЕМ-алгоритм). Этот метод позволяет учитывать помимо атрибутивного признако­вого пространства и любое другое пространство, заданное матрицей близостей ОТЕ-ОТЕ. В данном случае дополнительным пространством будет географиче­ское, а матрица близостей может быть как бинарной таблицей смежности, так и заданной пространственными расстояниями между парами ОТЕ.

По аналогии с ЕМ-алгоритмом, NEM-алгоритм итерационно находит оценки всех параметров, на каждом шаге улучшая их. Оценки апостериорных вероятностей р^ используются для районирования (или нечеткого районирова­ния) точно так же, как и в классическом ЕМ-алгоритме. Недостатком алгоритма является необходимость подбора параметра веса пространства, от значений ко­торого сильно зависит результат районирования.

Иерархические методы районирования. Отличие агломеративных алго­ритмов районирования от соответствующих алгоритмов классификации состо­ит в формировании матрицы пространственной смежности и проверке на каж­дом шаге граничности объединяемых районов. При этом классические агломе-ративные алгоритмы классификации можно использовать для районирования при условии, что минимум расстояния между районами (или максимум функ­ции качества при объединении) ищется только для пространственно-смежных районов.

Быстрый агломеративный алгоритм районирования полностью соответст­вует быстрому агломеративному алгоритму классификации с добавлением эта-

па проверки на шаге п граничности объединяемых районов, расстояния между которыми в признаковом пространстве меньше константы сп.

Большинство дивизимных алгоритмов районирования, по аналогии с «ядерными» и агломеративными, получается путем естественной модификации классических методов классификации. Дивизизимному алгоритму классифика­ции, основанному на методе 2-средних, соответствует полностью повторяющий его метод районирования на основе алгоритма 2-медоидов. Дивизимному алго­ритму, основанному на расчленении графа, соответствует давно описанный в стандартной литературе по прикладной статистике [С. А. Айвазян и др., 1989] метод классификации при ограничениях. Ограничения накладываются на ис­пользуемую в дивизимном алгоритме матрицу близостей А признакового про­странства матрицей пространственной смежности G в соответствии с формулой

Это условие соответствует удалению из графа расстояний признакового атрибутивного пространства (соответствующего матрице А) ребер, соединяю­щих пространственно несмежные ОТЕ. После удаления ребер к полученному графу применяют дивизимный алгоритм на основе расчленения графа, описан­ный выше.

Помимо стандартных методов разработаны и широко используются спе­циализированные для экологии и географии процедуры районирования, для ко­торых отсутствуют аналоги в классификации. Речь в первую очередь идет о ме­тоде барьеров максимальных различий, предложенном М. С. Монмонье [M.S.Monmonier, 1973]. Этот метод применим только к ОТЕ полигонального типа.

Значением барьера для заданного района (содержащего более одной ОТЕ) будем называть максимальное расстояние между двумя пространственно смеж­ными ОТЕ этого района в пространстве показателей, барьером - границу между

23

двумя соответствующими ОТЕ. Обозначать значение барьера /-го района будем символом B(Sj):

Для районирования методом барьеров максимальных различий вычисля­ются расстояния только между пространственно смежными ОТЕ, а все ОТЕ при инициализации алгоритма относятся к одному единственному району. После этого на каждом шаге происходит деление одного из полученных районов на два (необязательно равных по площади) района. Начинается деление с опреде­ления в каждом из уже полученных районов по одному значению барьеров. среди которых отыскивается максимальный. Район, имеющий в своем составе барьер с максимальным значением, подлежит делению. По обе стороны от барьера итеративно проводится граница - до тех пор, пока она не разделит те­кущий район. Очередная итерация расширяет границу за счет присоединения следующего барьера (который вычисляется без учета пар ОТЕ, уже поучаство­вавших в образовании предыдущих барьеров), примыкающего к границе.

Можно ограничить количество итераций алгоритма, либо заранее задавая искомое число классов К, либо вводя некоторый порог с. Поскольку значения барьера максимальных различий уменьшаются с каждым шагом алгоритма, критерием остановки алгоритма является условие

Большое разнообразие примеров и методик классификации экологии и географии, среди которых типологические, оценочные и комплексные класси­фикации, классификации «нечетких» систем, проблемы взвешивания показате­лей, оценка надежности классификаций и другие можно найти в книге [B.C. Ти-кунов, 1997

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]