Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Класифікація якості растрів.doc
Скачиваний:
4
Добавлен:
24.11.2019
Размер:
6.56 Mб
Скачать

4.6.2. Методи класифікації в гіс

Класифікації надзвичайно важливі для правильного сприйняття дійсності, без них ми б просто потонули б в деталях. Існують обмеження в можливій кількості класів, котрі без проблем може сприймати людина. Зазвичай, це 7±2 класи в ієрархічній системі. Класифікації з кількістю класів понад 10 складні для сприйняття і роботи.

Прості класифікації як правило використовуються для відображення безперервно змінюваних просторових властивостей, таких, як щільність населення, рівень забруднення повітряного басейну тощо, у вигляді легкодоступних карт хороплет або картодіаграм. Для наочності карти дуже важливо, якими способами визначаються інтервали класифікації. Докладні дослідження в цій області проведені Евансом (Evans, 1977)1, який запропонував класифікацію систем інтервалів.

Усі класифікаційні інтервали поділяються на екзогенні, умовні, ідеографічні та періодичні. Екзогенні інтервали вибирають згідно граничних значень, що відносяться до наборів даних, але не витікають з них. Вони широко використовуються в класифікаціях ґрунтів і оцінці земель. До їх переваг відноситься те, що вони універсальні у використанні, а до недоліків - те, що в деяких випадках вони не охоплюють всіх змін характеристики в досліджуваному районі.

Умовні інтервали мають нерегулярний характер, вибираються без якого-небудь чіткого плану і часто навіть без попереднього аналізу даних. Якщо співвіднести їх з яким-небудь періодом часу, то утвориться екзогенна шкала інтервалів.

Ідеографічні інтервали вибираються з урахуванням специфічних аспектів набора даних. Вони включають методи розбивки даних на багатомодальні групування.

Періодичні інтервали мають межі, котрі знаходяться в прямому математичному зв'язку один з одним. Якщо ці межі обираються незалежно від характеристик окремого набору даних, то то­ді отримувані по різним зразкам або наборам даних результати є цілком порівнянні.

Одне з основних питань - чи достатньо точно передає усе різноманіття даних система екзогенних інтервалів. Широко використовується спосіб перевірки, який полягає у тому, що дані розбивають на класи екзогенних інтервалів і потім застосовують одноваріантний аналіз для розрахунку по відповідним формулам, який об'єм загального набора даних охоплює зазначена класифікація.

Простим способом визначення ефективності класифікації є розрахунок відношення Swz/Stz, де Swz - коефіцієнт варіації усередині класу, який часто називають відносним коефіцієнтом варіації; Stz - загальний коефіцієнт варіації.

Класифікації з екзогенним способом визначення інтервалів можна порівнювати через відносний коефіцієнт, і кращою буде та, де його значення мінімальне. Успішне застосування таких класифікацій у більшому ступені залежить від самих даних, від досліджуваних районів і від співвідношення між видом властивостей і використовуваних диференційних критеріїв.

Багатоваріантний аналіз і класифікації. В природних дослідженнях досить часто доводиться мати справу з багатьма властивостями об'єктів, і відповідно встає задача скорочення даних з метою їх кращого сприйняття. Це можна зробити при урахуванні тісних взаємозв'язків і взаємозалежностей між властивостями природних об'єктів і знаходженням комплексних взаємозалежних змінних. Зазвичай для цих цілей використовується компонентний аналіз.

Компонентний аналіз, або метод головних компонент, представляє собою математичну операцію для визначення взаємозв'язку між рядом об'єктів п, кожний з яких характеризується набором харак­теристик т. Початкові дані перетворяться в набір нових параметрів, що називаються головними компонентами і котрі є лінійними комбінаціями первісних змінних.

Головні компоненти орто­гональні, тобто є незалежними одна від одної. Значення їх для кожного об'єкта - це набір змінних, що представляють початкові дані в стиснутому вигляді, котрі можна відображати у вигляді карт розподілу, що характеризують основні аспекти набору вихідних даних.

Подальше стиснення вихідних даних здійснюється за допомогою кластерного аналізу, коли значення головних ком­понент відображаються не в географічному просторі, а в просторі, обмеженому осями головних компонент. В цьому випадку показуються групи об'єктів, що мають схожі значення по обом осях. Якщо співвіднести ці кластерні угруповання з одиницями класифікаційних систем, то можна досягти ще більшого стиснення вихідної інформації. Більш того, отримана з аналізу первісних даних групування є „природним” формуванням на відміну від екзогенних і ідеографічних класифікацій, виведених буквально з нічого.

Існує багато способів проведення кластерного аналізу з метою складання карт хороплет. При цьому використовуються системи двох видів: розділові і агломераційні. В розділювальних системах використовують увесь масив вихідних даних і потім шукають найкращий спосіб його розбивки на класи. В агломераційних системах досліджують подібність між окремими об'єктами, перед тим як поєднувати їх в групи.

Зазвичай для визначення схожості об'єктів застосовуються методи, засновані на розрахунку відстаней у варіаційному просторі як міри подібності: евклідова відстань розраховується по формулі:

де X - значення властивості К об'єктів i та j .

Евклідова відстань має той недолік, що вона залежить від масшта­бів, в яких виміряються змінні. Тому її зазвичай використовують для обробки даних, перетворених за допомогою метода головних компонент.

Крім евклідової відстані користуються також й іншими форму­лами розрахунку.

За допомогою того або іншого метода будується матриця подібності або розбіжності розміром:

де N - число пунктів в наборі даних. Потім об'єднують об'єкти в групи, відштовхуючись від знаходження пари точок, найближчих одна до одної у просторі, визначеному змінними. Подальше приєднання об'єктів до груп мож­на виконувати різними способами.

В методі одного можливого зв’язку, точка приєднується до тієї групи, до якої належить її найближче сусідство. В центроїдному мето­ді об'єкт приєднується до тієї групи, відстань до центра якої від нього мінімальна; в методі Варда - до тієї, котра приводить до найменшого збільшення суми середньоквадратичного відхилення між об'єктами в групі і середнього значення груп.

Способи приєднання об'єктів до груп графічно можна зобразити у вигляді дендрограми, або дерева зв'язків.

Якщо дані мають чітку структуру, то теоретично використання різних методів розрахунку подібності і формування взаємозв'язків між об'єктами повинно зумовлювати до схожих результатів, що не завжди виходить на практиці.

При використанні кластерного аналізу виникає проблема складання карт, що показує, як розташовуються різні класи. Ряд авторів проводив подібні дослідження, однак отримані кар­ти залишають бажати багато кращого.

До недоліків методів кластер­ного аналізу відноситься те, що вони ідеографічні, тобто отримувані результати залежать від точності характеристик набору вихідних даних. Отже, класифікації, отримані для сусідніх територій, є непорівняними.

Р ис.6.2. Приклад багатофакторного аналізу

Статистичні карти. Дрібномасштабні статистичні карти заслуговують особливого розгляду через їх зростаюче значення. Ці карти зазвичай ґрунтуються на джерелах, що містять кількісну інформацію, наприклад на даних переписів. Серед способів передачі інформації необхідно зазначити точковий, методи ізоплет, хороплет (картограм) і картодіаграм. Все ці способи можуть використовуватися для одних і тих же даних. Точкові значки однакового розміру, кожний з яких позначає однакову кількість одиниць зображуваного явища, наносяться на карту відповідно фактичному розміщенню явища; скупчення або розрідженість точок показує розподіл (щільність) картографованого явища. Ізоплети представляють собою ізолінії, що з’єднують точки з однаковими значеннями якогось відносного показника, обчисленого на підставі інших показників (а не безпосередньо виміряного). Прикладом можуть слугувати ізолінії середніх місячних температур (розрахунковий показник). В системі хороплет конкретна територіальна статистична одиниця (наприклад, адміністративний округ) розглядається як однорідна по даному статистичному показнику; просторова диференціація досягається тим, що виділені одиниці поділяються на класи по величині картографованої ознаки і кожному класу присвоюється певний колір. На картодіаграмах площі, статистично однорідні по відношенню до обраної ознаці, показуються безвідносно до границь територіальних одиниць, дані по яким покладені в основу карти.

Ще два способи, котрі часто застосовуються для статистичних карт, – це знаки, розмір яких залежить від кількісної характеристики зображуваного явища, і знаки, що вказують напрямок переміщення. У першому способі, застосовуваному у випадку точно локалізованих явищ, наприклад міського населення, точкові знаки мають різні вагові значення; розмір знаків вибирається пропорційним їх вазі і має декілька градацій (наприклад, по числу мешканців міст). Знаки переміщення можуть включати і кількісну характеристику (наприклад, об'єми морських перевезень). Такий ефект досягається зміною товщини ліній.

Районування. Якщо розглядати район як певну однорідність (єдність, сукупність), яка складає систему елементів з взаємодіючими процесами, то саме районування можна вважати специфічною формою класифікації в широкому розумінні.

Районування – система територіального розподілу на райони: адміністративні, економічні, природні, тощо.

Районування в ГІС - процедура обчислення цілісних територіальних систем на різниці між ними, а при топології та кількісній оцінці – однорідності виділюваних таксонів2.

Районування може провадитися по комплексу ознак, котрі охоплюють всі або майже всі компоненти природного середовища (комплексне фізико-географічне, або ландшафтне, районування), і по якимось окремим признакам - рельєфу, клімату, ґрунтам і т. ін. (часткове, або галузеве, природне районування).

Нормалізація. В класифікації також застосовують нормалізацію (від фр. normalization – упорядкування) – процес перетворення бази даних до вигляду, що відповідає нормальним формам. При нормалізації атрибутів відбувається поділ кожного значення атрибута на певне число, щоб утворилось співвідношення. Нормалізувати атрибути можна за:

відношенням до суми значень атрибутів так, що б отримані відносні значення були відсотком від суми;

значеннями інших атрибутів, беручи до уваги просторові відмінності іншого явища, які можуть вплинути на атрибути, за якими здійснюється класифікація.

Анаморфози. Для відтворення результатів класифікації зручно використовувати анаморфози3 - графічні зображення, похідні від традиційних карт, масштаб яких трансформується і варіює в залежності від величини характеристики явищ (кількість населення, рівень економічного розвитку тощо) на вихідній карті.

Процес створення анаморфоз будемо називати анаморфуванням.

В англомовному світі для позначення анаморфоз використовуються терміни „transformed map”, „pseudo-cartograms”, „cartograms”, „topological cartograms” та інші.

Серед анаморфованих зображень можна виділити лінійні, площинні та об’ємні.

Лінійні анаморфози нагадують зображення графів, довжина ребер яких дозволяє змінювати взаємну віддаленість відображуваних одиниць, залежно від величин характеристик явищ, які закладені в основу анаморфоз. При цьому, необхідно дотримуватися просторових відношень, бо в протилежному випадку, зображення не може бути віднесено до анаморфоз (наприклад, статистичні графіки об’ємів експортно-імпортних зв’язків, що виражені у вигляді стовпчиків різної висоти і т. ін.).

В якості прикладу, на рис. 6.1.а. зображені лінійні анаморфози зовнішньоторговельних зв’язків колишнього СРСР з країнами Європи.

Рис. 6.1. Приклад анаморфоз

Площинні анаморфози дозволяють вирівнювати у просторі будь-які характеристики, наприклад, щільність населення, компактність територіального розподілу прибутків і т. ін. У цьому випадку, площі зображуваних територіальних одиниць стають пропорційними до відповідних їм величин показника, який закладається в основу анаморфози, при максимально можливому збереженні взаємного розташування територіальних одиниць, їх форми, тощо. На рис. 6.1.б. зображена анаморфоза країн світу в залежності від чисельності населення.

Об’ємні анаморфози дозволяють отримувати наочне ефектне зображення великої кількості характеристик (понад 30) (стр 326 Тикунов).

Генералізація. Генералізація - формалізований відбір, згладжування (спрощення) або фільтрація зображення просторових об’єктів у відповідності до певних критеріїв (рис. 6.2.).

а б

Рис. 6.2. Приклад здійснення генералізації при відборі просторових даних

Відбір здійснюється на основі узагальнення позиційних і атрибутивних даних, виділення головних типових якісних і кількісних рис об’єкта.

Серед основних завдань генералізації в ГІС реалізуються:

розріджування - усунення надмірних вершин у межах лінії;

згладжування - спрощує обрис звивистих контурів на основі певного допуску;

спрощення – спрощення форми просторового об’єкта;

відбір – відбір за заданим критерієм;

рекласифікація (декласифікація) – перекласифікація однієї множини об’єктів в іншу за певними критеріями і т. ін.

Рекласифікація є поширеною на практиці операцією аналізу, сутність якої полягає в зміні змісту растрової карти або на основі характерис­тик, які містяться в іншій карті (чи картах) з наявної бази, даних, або отриманих в результаті просторового аналізу, або, наре­шті, на основі сформульованої умови. Операція застосовується для створення нових шарів просторових даних для даної терито­рії на основі вже наявної цифрової картографічної бази.

Шля­хом рекласифікації можуть бути побудовані тематичні карти, що мають самостійне наукове або прикладне значення, напри­клад, карти еколого-технологічних груп земель, побудовані на основі карти крутизни схилів за методикою Українського НДІ землеробства (Тараріко, 1990), або карти оцінки умов життя лю­дей для гірських територій, побудовані шляхом рекласифікації цифрової моделі рельєфу тощо.

Ще більше поширення має вживання цієї процедури для побудови карт просторового розподілу характеристик компонентів природно-господарських або соціально-економічних терито­ріальних систем або параметрів їх математичних моделей на основі так званої інтерполяції з використанням додаткової ін­формації. Додатковою інформацією при цьому мо­жуть бути карти контурів природних або антропогенних компо­нентів природно-господарських або соціально-економічних тери­торіальних систем. Даний спосіб просторової інтерполяції застосовується за відсутності або крайньої обмеженості даних спосте­режень або вимірювань просторової мінливості відповідної хара­ктеристики. Як приклад можна навести завдання побудови карти просторової мінливості протиерозійної стійкості поверхневого шару ґрунту на основі ґрунтової карти і таблиці співвідношення показ­ника протиерозійної стійкості і генетичних різновидів ґрунту.

Сучасні інструментальні ГІС надають різні засоби щодо зміни змісту (рекласифікації) наявних карт. Це можуть бути або інте­рактивні процедури з використанням „майстрів” або робочих панелей (як, наприклад, в пакеті IDRISI), або мовні і програмні засоби (як в пакеті PCRaster).

Генералізація може застосовуватися глобально (до цілого шару), або локально (до якого-небудь певного об’єкта), обслуговувати графічні чи структурні перетворення даних.

Власне, при зменшенні чи збільшенні масштабу електронної карти, відбувається генералізація. Через складність формалізації операцій генералізації, на практиці доречно поєднувати автоматичний та інтерактивний режими обробки інформації. В автоматичному режимі виконується класифікація об’єктів, їх цензовий і нормативний відбір, узагальнення зображення об’єктів, інтерполювання горизонталей, нарізка, зшивка і зведення зображень.

Інтерактивний режим застосовується для обробки додаткової інформації, доопрацювання й контролю результатів автоматичного складання.

Найперспективнішим вирішенням проблем генералізації картографічного зображення є використання експертних систем, побудованих на матеріалах аналізу карт, що є в наявності, і формалізованих правилах, взятих з інструкцій по складанню цих же карт. Також одним із завдань, що вирішує генералізація, є агрегування даних.

Агрегування. Агрегування даних передбачає перехід до збірних, узагальнених характеристик об’єктів, згрупованих по різним критеріям.

Агрегування – форма абстракції, за допомогою якої взаємозв’язок між об’єктами розглядається як об’єкт (агрегат) більш високого рівня.

Агрегування даних - це об’єднання й підсумування статистичної інформації.

На рівні агрегату пригнічуються специфічні деталі складових елементів. Кожний екземпляр агрегату може бути розкладений на екземпляри компонентних об’єктів, що забезпечує становлення між об’єктами зв’язку типу „частина чого-небудь”. Синонімом до агрегування може служити термін „складається з”. Наприклад, „місто” складається з „районів”, „райони” з „кварталів”, а „квартали” можуть бути „житловими”, „індустріальними” і т. ін. В свою чергу, „квартали” складаються з „будинків”, „зелених насаджень” тощо.