Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методичка

.doc
Скачиваний:
18
Добавлен:
15.04.2015
Размер:
345.09 Кб
Скачать

Существуют гибридные модели, сочетающие векторную и растровую структуры - “вастерные модели”.

Преобразование типа “вектор-растр” - типичная задача растровых ГИС с поддержкой векторного ввода данных (IDRISI). Она должна решаться и в случае необходимости непосредственного вывода векторных данных на устройства печати дискретного типа (матричные и лазерные принтеры), подготовки данных к визуализации средствами графических редакторов и при визуализации на растровых видеоэкранах вообще. Векторно-растровое преобразование может использоваться для генерализации изображения. Идеология преобразования типа “вектор-растр”: а) на набор векторных данных в виде полигонов с их номерами (идентификаторами) “накладывается” (совмещается) регулярная сеть с необходимым размером ячеек, б) принадлежность ячейки полигону определяется положением ее геометрического центра, в) ячейка получает номер того полигона, к которому принадлежит. Результаты совершенно однозначны. Для точек: ячейка получает номер точечного объекта, если он в ней находится, для линий: если линия проходит через ячейку, то она получает признак этой линии.

Обратная задача - растрово-векторное преобразование используется в приложениях, связанных с интерпретацией цифровых (например, аэрокосмических) изображений и вообще векторизации отсканированных картографических изображений. Его идеология такова: а) классификация растрового изображения - присвоение ко всем ячейкам сети номеров классов, б) выделение границ разных классов, в) выделение полигонов, описываемых номером класса и последовательностью координат его границ. Однако реализация сталкивается с большими трудностями и поэтому ее эффективность в значительной мере зависит от того, насколько успешно чисто автоматизированные методы векторизации сочетаются с интерактивными возможностями контроля процесса преобразования. К счастью, наиболее трудо- и времяемкие стадии этого процесса поддаются автомаизации: фильтрация исходного растрового изображения, подавление шумов, определение и устранение разрывов линий, утоньшение линий, “скелетизация” изображения путем выделения каркасных линий (линии должны бать представлены одним рядом ячеек, не должно быть их удвоения, утроения). Некоторые из побочных эффектов опрерации растрового-векторного преобразования приводят к появлению небольших по размерам “паразитных” полигонов. Для их удаления используется ценз отбора, связанный с его размером (исп. в ARC/INFO). Путем использования экспертных систем можно добиться удаления некоторых ложных полигонов, связывая ценз отбора с их формой.

Вопросы для самопроверки:

33. Примитивы векторных и растровых представлений пространственных объектов.

34. Различия между растровыми и векторными моделями, их преимущества и недостатки.

35. Собственно растровое представление или растровая модель данных.

36. Регулярно-ячеистое представление.

37. Что такое TIN-модель?

38. Что такое полигоны Тиссена и триангуляция Делоне?

39. Применение лексиграфического кода.

40. Применение пирамидальных структур на примере квадротомического дерева.

41. Что такое дуги и сегменты?

42. Виды векторных форматов.

43. Различия между векторными топологическими и векторными нетопологическими форматами.

44. Понятие графа.

45. Что такое покрытие?

46. Модель «спагетти».

47. Линейно-узловое топологическое представление.

48. Преобразование «вектор-растр».

49. Преобразование «растр-вектор».

Литература:

Кошкарев А.В., Тикунов В.С. Геоинформатика. С.47-58, 63-69.

Коновалова Н.В., Капралов Е.Г. Введение в ГИС. С. 58-59.

5. “Интеллектуализация” ГИС.

Хотя хранящаяся в ГИС информация представляет собой исключительную ценность, она приносит практическую пользу только при решении прикладных задач. Каждая ГИС кроме модулей, производящих ввод и вывод информации, обязательно комплектуется средствами, предназначенными для решения специфических задач пользователя. Без этих средств это уже не ГИС, а CAD-система (Computer-Aided Design - САПР - система автоматизированного проектирования) или AM - Automated Mapping -система автоматизированного картографирования. Но и этого уже мало. В технологию ГИС широко внедряются экспертные системы. Это - системы искусственного интеллекта, использующие знания из сравнительно узкой предметной области для решения возникающих в ней задач, причем так, как это делал бы эксперт-человек, то есть в процессе диалога с заинтересованным лицом, поставляющим необходимые сведения по конкретному вопросу. Вспомним отличие данных от знаний: данные - формализованные факты, знания - отражение семантических аспектов реальности в сознании человека или технической системе. Если ранее в задачи обработки данных на ЭВМ входило только оперирование с данными, причем смысл манипуляций понимал пользователь, то теперь разрабатываются программы, способные анализировать семантику (смысл) используемых данных. При этом необходимо обращаться к базам знаний. Такие программы способны производить логические цепочки на основе ранее полученных выводов, сравнивать выводы с имеющимися знаниями, проверять их логичность, уточнять и строить новые логические конструкции. Если полученный результат явно противоречит здравому смыслу, то при традиционном алгоритмическом построении программы это безразлично компьютеру, но в экспертной системе такое не должно остаться незамеченным.

Знания делятся на предметные или общедоступные и индивидуальные или эмпирические. К общедоступным относятся наборы сведений в учебниках или другой научной литературе, а индивидуальные знания часто носят эмпирический характер, основанный на правилах и подходах, которые эксперт не может четко или однозначно сформулировать - такие правила и подходы называются эвристиками.

Для экспертных систем необходимы три компоненты: факты, правила (процедурные знания) и управляющие структуры. Фактические знания сообщаются экспертной системе экспертом-специалистом в процессе диалога и отражают его взгляды на момент работы. Процедурные знания или правила тесно связаны с фактическим и являются накопленными знаниями, на основе которых в свою очередь разрабатывались правила, определяющие функционирование системы. Управляющие знания позволяют подбирать наилучшую стратегию в работе системы. Существуют интеллектуальные системы, способные самообучаться на основе накопленного опыта анализа, контроля и принятия решений. В них появляются знания второго уровня, знания о знаниях или метазнания.

Экспертная система, как правило, состоит из 4 компонент: базы знаний, машины вывода, системы накопления метазнаний (т.е. знаний второго уровня для самообучения системы), системы объяснений и общения с пользователем. Реальные системы могут содержать лишь некоторые из этих элементов. Знания в базе знаний в отличие от данных требуют иного представления, для чего используются семантические сети с произвольной структурой, а также более регуляризованные сети - фреймы. Фреймы выражают общие понятия, а слоты или ячейки дают их детализацию, что приводит к типичной иерархической структуре. Например, в экспертной системе по оценке состояния природной среды фрейму “состояние природной среды” в качестве его слотов соответствуют “степень загрязненности атмосферы”, “загрязнение поверхностных вод”, “загрязнение подземных вод”, “состояние почв”, “состояние растительных сообществ”, “состояние животного населения” и т.д. Каждый слот кроме имени может иметь одно или несколько значений, качественных или количественных, например: “выбросы вредных веществ предприятием в атмосферу” ® “изобутилен”, “200”, “600”, “400”, “600”; “этиленгликоль”, “40”, “70”, “60”, “80” и т.д. При характеристике выбросов изобутилена, этиленгликоля и т.д. первое числовое значение может определять фоновые, второе - максимальные концентрации, третье - реальные средние, 4 - ПДК. В качестве слота могут использоваться сложные структуры, включающие иерархию слотов более низкого порядка. Так, в слот “выбросы вредных веществ предприятием в атмосферу” можно включить слот “состояние атмосферы”, который в свою очередь будет характеризоваться “ скоростью ветра”, “распределением температур”, “стратификацией атмосферы” и т.д. При изменении содержания слотов преобразуется вся семантическая структура в зависимости от конкретных целей.

Большое распрстранение получили “продукции”. Их можно представить в виде выражения “если - то” (ядра), например: “если содержание углеводородов в выбросе в атмосферу првысит ПДК в 100 раз, то это может привести к экологической катастрофе”. Для получения выводов “продукции” могут образовывать сложные цепочки. Кроме ядра “продукции” допускают использование пред- и постусловий, разрешающих или запрещающих применять данное условие, а также определяющих, необходимо ли изменять что-либо в базе знаний в зависимости от результата выполнения процедуры “если - то”.

Например, поставим условие, что химический комбинат А намерен увеличить выпуск каучука из изопентана на 10%, то увеличение объема выброса в атмосферу изопрена приведет к превышению ПДК. Тогда постусловие должно изменить объем увеличения продукции или сделать предположение о возможности увеличения производства каучука на предприятии Б. Если поставить условие о пересмотре ПДК, тогда “продукция” будет описывать уже другую ситуацию.

Другая задача. Необходимо выбрать место для размещения нового завода (А) по производству алюминия с определенным объемом производства - 100 тыс. т в год). Желательно выполнение следующих условий: Р1 - залежи бокситов удалены не боле чем на 500 км; Р2 - добыча бокситов не менее 400 тыс. т в год; производство из бокситов не менее 200 тыс. т. глинозема; Р4 - наличие значительных энергоресурсов; Р5 - район размещения завода - конкретный регион для обеспечения занятости населения; Р6 - город для размещения завода должен полностью укомплектовать его персоналом в 700 человек, чтобы не было расходов по привлечению рабочей силы со стороны. “Продукция”, описывющая ситуацию для места (Б) такова: (Б) Р, Р6 (N>700), A ®B, (Б), Q, где Р определяет выполнение первых пяти условий размещения предприятия А, т.е. Р = Р1 ÇР2 ÇР3 ÇР4 ÇР5 ; Р6 определяет, достаточно ли свободных трудовых ресурсов (более 700 человек), В фиксирует пригодность пункта для размещения завода, Q определяет состояние окружающей среды после строительства завода.

Применение “продукции” упрощает диалог и объяснения пользователю, почему принято то или иное решение. Возможен синтез фреймов и “продукций”, например, использование “продукций” в качестве слотов во фреймах.

Важной особенностью экспертных систем является возможность работы с нечеткими данными и самое главное, нечеткими знаниями. Используя комбинации элементов знаний, можно придти к вполне определенным заключениям, т.е. даже на основе ненадежных данных можно получать правдоподобные выводы. Для характеристики фактов используется нечеткая логика, разработаны коэффициенты уверенности для измерения степени доверия к любому заключению.

Другим важным элементом экспертной системы является машина логического вывода - универсальная думающая машина, база знаний - это то, над чем ей необходимо думать. В ответ на запрос экспертная система должна быть способна строить логические выводы и на их основе приходить к заключениям. Здесь проверяется выполнимость задачи при конкретных условиях по отношению к имеющимся правилам и подбирается путь ее решения. При этом в отличие от традиционных алгоритмов, осуществляющих механический перебор всех правил, в экспертной системе пространство поиска сужается за счет того, что компьютер должен представлять, что же ему встретится. Например, в экспертной системе оценки воздействий техногенных атмосферных выбросов на окружающую среду в зависимости от места размещения предприятия система должна перебирать не всю имеющуюся в памяти информацию о характеристиках и правилах воздействия загрязнения на растительные организмы, включая пальмы, мангры и ягель, при условии, что предприятие размещается в средней полосе России, а четко выбрать входящие в зону влияния предприятия сообщества (расчет этой зоны - дело входящей в ГИС модели). При этом она должна не останавливаться, если по данному растению нет данных, а грамотно подобрать аналог. Так, если нет данных по березе, то нужно в качестве аналога подобрать параметры другой мелколиственной породы, а не сибирской кедровой сосны. Если нет данных по лиственнице, то нельзя брать правила для ели, поскольку лиственница сбрасывает хвою каждую осень, а у ели она многолетняя. Подобная система должна знать видовой сообществ той территории, которую она призвана обслуживать, уметь оперировать с понятиями доминантов, эдификаторов, второстепенных и третьестепенных видов, эндемиков, уметь определять устойчивость экологических систем по Ляпунову и Лагранжу, оценивать предельно допустимое воздействие на природную среду и т.д.

Процедура получения выводов путем анализа фреймов или “продукций” называется прямой стратегией. Возможна и обратная стратегия, когда человек выдвигает гипотезы, а компьютер их проверяет. Используются и смешанные стратегии, когда машина выдает ряд вариантов решения, из их выбирается одно, которое затем анализируется при помощи обратной стратегии. Естественно, этот путь неоднозначен.

Блок накопления метазнаний проверяет непротиворечивость вновь поступающих сведений имеющимся правилам. Это достигается путем проверки семантической непротиворечивости, а также автоматическим тестированием. Проверка семантической непротиворечивости состоит в согласовании вносимых изменений правилам базы знаний, а автоматическое тестирование проверяет нововведения на большом количестве задач, чтобы оценить их положительное влияние на работу экспертной системы. В случае конфликтной ситуации может оказаться необходимым пересмотр правил.

Экспертная система, проводя классификацию, сравнивает объекты с идеальными моделями. При этом она не ограничивается алгоритмической классификацией и учитывает семантику. Так например, эвристическая программа должна суметь сгруппировать объекты Москва, Орел, Брянск в класс “города”, а Лена, Москва, Волга - в класс “реки”. Экспертная система должна обладать аппаратом многокритериальных оценок, выводить одни правила из других.

Так как правила, разработанные одним специалистом, часто сильно отличаются от разработанных другим, то экспертная система становится “вторым я” автора, копируя его стиль работы.

Система объяснений используется для разъяснения пользователю того, как экспертная система пришла к тому или иному конкретному выводу. Причем в процессе работы пользователь может задавать дополнительные вопросы о получении промежуточных результатов, уточнять цели, инспектировать правила с точки зрения их согласования между собой и соответствия поставленным целям и т.д. Метод рассуждения, который не может быть объяснен человеку, является неудовлетворительным, даже если с ним система работает лучше, чем специалист.

Как правило, система объяснений делает трассировку хода проведения рассуждений в обратном порядке от того места, к которому относится вопрос, или от конечного результата. Каждый шаг рассуждения подкрепляется выводами из правил базы знаний. Экспертная система, объясняет также, почему она не пошла другим путем, какие правила базы знаний этот путь заблокировали. Объяснения экспертной системы помогают совершенствовать базу знаний, показывая ее слабые места, которые ведут к неправильным выводам.

Система общения пользователя с экспертной системой должна быть максимально удобна для человека. Существуют проекты экспертных систем, которые смогут на слух воспринимать естественную человеческую речь на ограниченном английском языке, графические изображения, карты, фотографии.

Экспертные системы могут сильно различаться своей конфигурацией в зависимости от задач, технических средств, объемов данных и знаний. Важной является возможность комбинирования экспертных систем с математическими моделями, выполняющими алгоритмические вычисления. Такие системы называются интегрированными. Они подразделяются на несколько типов: интерпретирующие, позволяющие на основе наблюденных фактов делать описания и выводы; прогнозирующие - выводящие следствия из совокупности состояний исследуемых явлений, например прогноз погоды, урожайность и т.д.; диагностирующие - прежде всего в медицине; проектирующие - в строительстве; планирующие; мониторинговые; ремонтные; обучающие и др.

Включение экспертных систем в ГИС позволяет сделать последние более эффективными и легче используемыми, обучать малоопытных пользователей работе с ними, совершенствовать поиск информации в больших массивах данных.

Одно из интересных приложений экспертных систем в геоэкологии может состоять в их применении не только для обучения отдельным географическим и экологическим дисциплинам, но и в качестве “интеллектуального интерфейса” для связи с пакетами вычислительных программ, с которыми пользователь мало знаком. Здесь экспертные системы смыкаются с обучающими системами. С развитием экспертных систем роль специальных знаний все более возрастает, облегчается их передача от учителя к ученику, улучшается сохранность накопленных знаний и возможность их дальнейшего пополнения и совершенствования. Экспертные системы могут рассматриваться как одно из самых мощных средств геоэкологических исследований на ближайшую перспективу.

Вопросы для самопроверки:

50. Обоснуйте необходимость включения в ГИС блока экспертной системы.

51. Структура экспертной системы.

52. Что такое эвристики?

53. Что такое базы знаний?

54. Приведите собственный пример фрейма и слотов.

55. Приведите собственный пример продукции.

56. Машина логического вывода.

57. В каких случаях при работе с экспертной системой применяются прямая и обратная стратегии?

58. Для чего нужны система объяснений и система общения?

Литература:

Кошкарев А.В., Тикунов В.С. Геоинформатика. С.97-102.

6. Анализ данных.

Существует перечень обязательных функций, наличие которых требуется от любой ГИС. Это: арифметические и геометрические функции, сетевой анализ, анализ наложений, выделение объектов в новый слой и утилиты работы с полями баз данных. Можно выделить следующие группы элементарных операций аналитического характера: 1. Операции переструктуризации данных (предпроцессорные операции); 2. Трансформация проекций и изменение систем координат; 3. Операции вычислительной геометрии. 4. Оверлейные операции (наложение разноименных и разнотипных слоев данных); 5. Общие аналитические, графо-аналитические и моделирующие функции.

Переструктуризация данных. Пространственные данные, введенные в среду ГИС, зачастую нуждаются в некоторых предварительных операциях, позволяющих адаптировать эти данные к дальнейшей обработке. Наиболее важными операциями являются операции преобразования данных из векторного в растровые представления и обратно. В блок трансформации проекций и изменения систем координат входят и операции пересчета координат пространственных объектов (опрерации ротации - поворота, сдвига,масштабирования осей) и более сложные трансформации, связанные, например, с "укладкой" объектов в систему опорных точек с точно известными координатами (например, привязка спутникового снимка), и трансформация картографических проекций как наиболее сложная подгруппа операций. Картометрические (арифметические) операции включают в себя: расчет площадей, длин ломаных линий, периметров, площадей склонов, объемов, заключенных между поверхностями, координат центров полигонов. К ним принадлежат также операции определения принадлежности точки внутренней области полигона, описание геометрических и топологических отношений точечных, линейных и полигональных объектов двух разноименных слоев в целом при их наложении (оверлее). Геометрические утилиты используются для анализа пространственных данных и связей между ними. Очень часто создается буферная зона - район, граница которого отстоит на заданном или высчитанном расстоянии от границы исходного объекта, например, водоохранные зоны. Оверлейные операции являются средством анализа множества разноименных и разнотипных по характеру локализации объектов. Суть их состоит в наложении двух разноименных слоев (или множества слоев, больше двух, при многократном повторении операции наложения) с созданием производных объектов, возникающих при их геометрическом наслоении и с наследованием их семантики (атрибутов). В этих операциях можно выделить: 1) Определение перекрытий. (Распознание перекрывающихся площадей разных полигонов);

2) Определение внутренних областей. Эта операция распознает площади (полигоны), целиком лежащие внутри какой-либо области (другого полигона или объединения полигонов); 3) Объединение площадей; 4) Определение линии пересечения полигонов; 5) Создание буферной зоны нескольких объектов; 6) Поиск точки касания (пересечения) линейного объекта; 6) Поиск ближайшего объекта расчетом расстояний до объектов зоны; 7) Поиск объектов, попадающих в определенный район; 8) Определение центра прямоугольника, охватывающего объект.

Основное назначение функций зонирования состоит в построении новых объектов - зон, т.е. участков территорий, однородных в смысле выбранного критерия или целой группы критериев. Границы зон могут либо совпадать с границами ранее существовавших объектов (задача “нарезки избироательных округов по сетке квартального деления), либо строится в результате различных видов моделирования (зоны экологического риска). Типичные задачи этого типа: выделение зон градостроительной ценности территорий, зон экологического риска, зонирование урбанизированных территорий по транспортной доступности, построение зон обслуживания поликлиник и т.д.

Сетевой анализ позволяет проанализировать пространственные сети связных линейных объектов (дороги, водопроводы, линии электропередач, гидрографическая сеть). В классическом представлении сеть считается набранной из линий, которые могут иметь не более двух общих точек касания с другими линиями - начало и конец. Другим важным фактором, определяющим сеть, является способ соединения ее элементов. Во всех типах сетей встречаются два типа соединений: “из/в” и “из/через”. Первый тип соединения прост. Второй тип означает, что объект А соединяется с В через С. Такой тип соединения встречается в электрических сетях. Например, серия кабелей подходит к узлу, серия кабелей выходит из него, однако не все кабели соединяются со всеми. Математически сети описываются теорией графов. Обычно сетевой анализ служит для задач определения ближайшего, наиболее выгодного пути, для определения зон влияния на объекты сети других объектов. Типичной задачей сетевого анализа является определение адреса. С картой дорог связывается файл БД, содержащий необходимую информацию. С участками сети обычно связывают понятие направления движения. Другими данными, относящимися к сети, могут быть мощность потока, его временные интервалы и т.д. Для гидрографической сети это может быть средний расход на данном участке.

Утилиты работы с полями баз данных включают в себя поиск имени поля и его значения, поиск по маске, создание, редактирование и удаление поля, калькуляцию, кассификацию и перегруппировку. Калькуляция - создание нового поля и расчет его значений по значениям старых полей согласно введенной формуле. Например, расчет площади земельного участка по масштабу карты и координатам с сохранением полученного значения в новом поле с именем “площадь”. Классификация - создание нового значения в новом поле по классификационным правилам. Пример: классификация земельных участков по трем градациям - крупные, средние и мелкие по численным значениям поля “площадь” и сохранение результата в новом поле “размер”. Перегруппировка - создание нового значения по группам подобных значений. Например, сгруппировать земельные участки по типу: селитебная территория, пашня, сад, огород, свалка, лес и т.п. и подсчитать общую площадь земель каждого класса. В результате образуется новая таблица, которую можно записать в файл базы данных.

Операции с трехмерными объектами. В отличие от цифровых представлений точечных, линейных и площадных объектов трехмерные объекты: поверхности, рельефы требуют особых форм представления, поскольку их пространственное положение должно описываться не только плановыми (географическими или геодезическими), но и высотными координатами (аппликатами). Следует различать цифровые модели картографического изображения рельефа (изолинии, отметки высот, знаки оврагов и т.п.) и собственно цифровые модели рельефа. Модели топографических поверхностей подразделяются на: 1) регулярная (геометрически упорядоченная) модель с заданием высотных отметок в вершинах правильных геометрических фигур; 2) геометрически упорядоченная (аналоговая) модель с расположением точек на горизонталях, структурных линиях и в характерных точках поверхности; 3) полурегулярная как комбинация первых двух типов; 4) хаотическая (случайная) модель с произвольным расположением точек дисретизации поверхности. TIN-модель можно рассматривать как частный случаем второго типа. Кроме создания моделей собственно рельефа в класс задач создания моделей поверхностей входят и трехмерные визуализации, например построение панорамы города. Моделироваться могут как изображение действительного рельефа или непрерывного поля (статически или динамически), так и воображаемые поверхности, построенные по одному или нескольким показателям, например, поверхность цен на землю, поверхность экологического риска и т.д.

Анализ растровых изображений. В качестве таких изображений в ГИС обычно выступают снимки. Преимущество снимков - в их современности и достоверности, поэтому достаточно часто встречающийся вид анализа - временной. Сравниваются и ищутся различия между снимками различной давности, таким образом оценивается динамика произошедших изменений. Часто анализируются пространственные взаимосвязи нескольких явлений. К снимкам может также быть применен кластерный анализ, на основе которого выделяются области лесов, рек, полей и т.д. С растровыми образами производятся картометрические вычисления: длин, площадей, объемов. Существует специальная область анализа, которую иногда называют картографической алгеброй (map algebra).

Специализированный анализ. Обычно ГИС не снабжены возможностями специализированного анализа, например, экологического и т.д. Это связано с тем, что единой схемы такого анализа не существует, производители стандартных ГИС не могут соответственно, включить их в программное обеспечение ГИС. Различные пользователи производят такой анализ по собственным методикам и правилам. Поэтому возможности специализированного анализа в ГИС реализуются средствами создания приложений самими пользователями. Однако некоторые фирмы (INTERGRAPH, ESRI) предоставляют пользователям возможность укомплектовывать систему фирменными модулями, реализующими специализированные анализы.