Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекція 7. Атрибутивні дані та аналіз їх розподілу.doc
Скачиваний:
16
Добавлен:
28.06.2022
Размер:
3.29 Mб
Скачать

Лекція 7-8 Тема: аналіз розподілу атрибутивних даних

Ніколи не бійся робити те, чого ти не вмієш.

Пам’ятай, ковчег був побудований аматором.

Професіонали будували "Титанік"…

  1. Атрибутивні дані.

  2. Шкали виміру атрибутивних даних та їх загальні характеристики.

  3. Номінальні (категоріальні) шкали виміру атрибутивних даних.

  4. Порядкові (рангові) шкали виміру атрибутивних даних.

  5. Інтервальні шкали виміру атрибутивних даних.

  6. Основні операції обробки атрибутивної інформації.

  7. Властивості змінних.

1. Атрибутивні дані

Геопростір, що розглядається в ГІС як модель реальної геосистеми, заповнений просторовими об’єктами (процесами, явищами). На етапі геоінформаційної обробки важливим моментом є аналіз як просторового розподілу цих об’єктів, так і їх атрибутивних даних.

Дані в ГІС поділяються на позиційні та атрибутивні.

Позиційні дані описують просторові характеристики різних об'єктів, таких як дороги, будівлі, водойми, лісові масиви. Реальні об'єкти можна розділити на дві абстрактні категорії: дискретні (будинки, територіальні зони) і безперервні (рельєф, рівень опадів, середньорічна температура).

Існує два способи представлення позиційної інформації — векторний та растровий.

До атрибутивної відносять ту інформацію, що або не має просторової прив’язки, або характеризує просторові об’єкти без явної вказівки на їх місце розміщення, наприклад, порядкові номери просторових об’єктів, їхні власні імена, числові кількісні або якісні значення. Блок атрибутивної інформації, прив’язаної до певного просторового об’єкта, може містити від одного до багатьох сотень окремих атрибутивних значень різного типу, що характеризують різні параметри цього об’єкта.

У ГІС до векторних об'єктів можуть бути прив'язані семантичні дані. Наприклад, на карті територіального зонування до просторових об'єктів, які становлять зони, може бути прив'язана характеристика типу зони. Структуру і типи даних визначає користувач. На основі атрибутивних значень, присвоєних векторним об'єктам на карті, може будуватися тематична карта, на якій ці значення позначені кольорами відповідно до шкали кольорів або різного роду штрихуванням чи точками. Найчастіше атрибутивні дані зберігаються у таблицях реляційної бази даних та є прив'язаними до певних векторних об'єктів. У випадку використання растрового способу позиційна та атрибутивна інформація поєднуються — колір піксела передає одночасно і розташування і характеристику.

2. Шкали виміру атрибутивних даних та їх загальні характеристики

Як відомо, просторові об’єкти, що використовуються у ГІС, наділені не тільки геометричними характеристиками, але й містять інформацію про свою сутність, тобто мають непросторові характеристики у вигляді набору атрибутів.

Для кожного типу просторових об’єктів вибирається набір атрибутів, який дозволяє ідентифікувати конкретний тип об’єкта серед інших і з максимальною повнотою описати його властивості. Після визначення списку атрибутів вибираються методи їхньої формалізації.

Процес аналізу атрибутивних даних у ГІС полягає у їх вимірі [79]. Для використання в середовищі ГІС атрибутивна інформація підлягає систематизації, структуризації і формалізації, що дозволяє використовувати для подальшого її введення та обробки різні засоби автоматизованого пошуку, обчислень і візуалізації. У процесі формалізації атрибутивні дані відображають за допомогою змінних.

В ГІС використовується чотири шкали вимірів атрибутивних даних:

  • номінальна (найменувань),

  • порядкова (або рангова),

  • інтервальна

  • числова.

Шкала вимірювання (англ. scale of measure) – відображення множини різних проявів якісної чи кількісної властивості на прийняту за угодою впорядковану множину чисел чи іншу систему логічно пов’язаних знаків.

Рис. 1. Шкала вимірів просторових об'єктів

Такою системою знаків може бути, наприклад, множина назв кольорів, сукупність класифікаційних символів чи понять, множина балів оцінки стану об’єкта, множина дійсних чисел тощо.

Визначаючи основні завдання просторового аналізу розподілу просторових даних, треба мати на увазі, що атрибутивні властивості й просторові характеристики об’єктів не є однорідними, а поділяються на якісні й кількісні.

З кількісними характеристиками можна виконувати різноманітні операції, якісні характеристики можна головним чином порівнювати. При порівнянні намагаються відповісти на два питання: "Чи збігаються порівнювані характеристики або об’єкти?" "Чи можна визначити порядок цих характеристик або об’єктів?" Якщо можна дати відповідь тільки на перше питання, то кажуть, що об’єкти описані номінальною шкалою, або шкалою категорій, якщо можна відповісти і на друге питання, то кажуть, що об’єкти описані ранговою шкалою.

Шкала найменувань (номінальна шкала). Одним із найбільш поширених атрибутів просторових об’єктів є їхні власні назви – назви населених пунктів, адміністративних одиниць, ділянок рельєфу, рік, водойм, природних урочищ, об’єктів дослідження або господарювання тощо. Власне вимірів у шкалі найменувань не виробляється. Тут мова йде про угруповання об’єктів, ідентичних за визначеною ознакою, і про присвоєння їм позначень.

Цей тип атрибута ідентифікує об’єкт, виділяє його серед інших однотипних об’єктів, дозволяє звернутися саме до цього об’єкта. Такий спосіб опису атрибута об’єкта називається номінальним (від латинського слова nome – ім’я). Об’єкт просто отримує своє окреме ім’я, він абсолютно рівнозначний у списку таких самих об’єктів. До таких атрибутів можна віднести:

"м. Київ", "Святошинський район", "школа № 13", "Фермерське господарство Вікторія" тощо.

Порядкові шкали. Атрибути, що показують місце розміщення об’єкта в ряді інших аналогічних об’єктів, їхню взаємну ієрархію, пріоритет, розходження у якості називаються порядковими або ранговими атрибутами.

Порядкова шкала використовується там, де неможливі якісні виміри у прийнятій системі одиниць. Таким способом описуються ієрархія ділянок дорожньої мережі (автостради, шосе, дороги з удосконаленим покриттям, ґрунтові дороги), елементів річкової мережі (припливи І, ІІ чи ІІІ порядку); ієрархічні рівні ландшафтних одиниць, ранги населених пунктів тощо. У більшості випадків такі атрибути описуються порядковим номером деякої рангової шкали. Наприклад, усі ліси на топографічних картах діляться на три категорії: хвойні, листяні та змішані. Будівлі поділяються на дві категорії: вогнестійкі і невогнестійкі, залізниці – на електрифіковані і неелектрифіковані. Тут відсутнє ранжування. Для кожного об’єкта на карті вказується, чи відноситься він до обраної категорії, чи ні. Між категоріями не встановлюється ніяких порядкових відношень, тому важко сказати, яка з них краща або більша.

Інтервальна шкала. Виміри в цій шкалі не тільки упорядковані за рангом, але і розділені визначеними інтервалами. В інтервальній шкалі встановлені одиниці виміру (градус, секунда тощо). Вимірюваному об’єкту тут надається число, яке дорівнює кількості одиниць виміру, що він містить.

Якщо характеристики задані ранговою шкалою, то з’являється можливість порівнювати об’єкти, наприклад, якщо екологічна ситуація у різних містах або частинах міста визначається за шкалою якості (гарна, задовільна, погана), то порядок переваг з точки зору проживання або рангу якості буде визначений однозначно.

Числова шкала. Для кількісних даних (температура, тиск, вміст забруднювачів у повітрі, воді чи ґрунті, висота над рівнем моря, кількість рослин на квадратний метр, вміст гумусу тощо) використовуються розімкнені чи замкнені числові шкали. Ці величини можна порівнювати одну з одною, над ними можна виконувати різні математичні операції.

При використанні універсальної розімкненої шкали числа можуть набувати значень від "мінус нескінченність" до "плюс нескінченність", замкнута числова шкала обмежена двома крайніми величинами, що характеризують набір припустимих значень для якоїсь предметної сфери (наприклад, 0–100 %; 0–1 безрозмірних одиниць; 0–360 компасних градусів; 0–90 градусів ухилу тощо).

Кількісні характеристики також не є рівноцінними. Для визначення кількісної характеристики повинна задаватись шкала, яка б дозволяла виражати значення характеристики в одиницях певного еталонного значення (метрах, грамах, гектарах тощо).

Кількісні характеристики задаються шкалами двох типів. У шкалі першого типу положення початку відліку (нульова позначка шкали) умовне, у шкалі другого типу нуль відповідає найменшому значенню характеристики (абсолютний нуль). Приклади таких шкал – шкали температур Цельсія і Кельвіна. Варто зазначити, що для картографії і геоінформатики є типовим перехід від шкал, у яких були визначені вихідні дані, до шкал, що використовуються в картографічному відображенні. Цей перехід пов’язаний із потребою відображення кількісних і якісних характеристик графічними змінними, що використовуються в різних способах картографічного відображення.

Різні системи класифікації і кодування дозволяють скоротити описи різноманітних просторових об’єктів до одного чи декількох десятків символів.

На сьогодні розроблено системи буквено-цифрових кодувань для геологічних, ґрунтових, ландшафтних, геоботанічних карт. Для цифрових топографічних карт і архітектурно-містобудівних планів розроблено відомчі позиційні коди – класифікатори. Весь перелік об’єктів, що картографуються, розбивається на окремі тематичні групи, розділи яких перебувають в ієрархічному підпорядкуванні. Наприклад, "Класифікатор інформації, яка відображується на топографічних картах масштабів 1:10 000, 1:25 000, 1:50 000, 1:100 000, 1:200 000, 1:500 000, 1:1 000 000" передбачає виділення дев’яти основних класифікаційних груп, кожна з яких розбита на стандартні підрозділи.

Після визначеної обробки атрибутивна інформація може бути організована у вигляді бази даних визначеного формату.

Вибір шкали виміру даних визначається:

– типом класифікації;

– необхідною інформацією;

– можливостями здійснення вимірювання при заданому масштабі спостереження.

Усі атрибутивні дані порівнюються між собою за перерахованими шкалами, однак потрібно зазначити, що порівняння атрибутивних даних коректне тільки всередині однієї шкали вимірів.

Крім несумісності між собою, шкали вимірів мають фундаментальні розбіжності за властивостями, вивченням яких займається абстрактна алгебра. Особливістю шкал є відповідний набір припустимих операцій з їх значеннями.

Розподіл шкал не має нічого спільного з формою запису або кодуванням значень, оскільки навіть атрибутивні дані, подані номінальною шкалою, можуть бути представлені числом. Однак це число не є числовим значенням, це просто код класу, що підміняє назву об’єкта.

Атрибутивною локалізацією називається локалізація, яка здійснюється на основі класифікації властивостей об’єкта або його місця розташування в заданій системі класифікаторів. Прикладом такого підходу можуть слугувати класифікатори, що використовуються в офіційній статистиці. Дані, відображені за допомогою певних змінних, відрізняються тим, наскільки точно і в якому діапазоні вони можуть бути виміряні або яку кількість вимірюваної інформації забезпечує шкала їх вимірів.

Кожний просторовий об’єкт має щонайменше хоча б один атрибут, який ідентифікує даний об’єкт, описує його або представляє певну кількісну величину, пов’язану з об’єктом. Вибір методу аналізу частково залежить і від типу атрибутів, що використовуються.

Будь-якій методиці вимірів притаманна певна похибка, що визначає межі "кількості інформації", яку можна отримати в процесі виміру.

Фактором, який визначає кількість інформації, що міститься у змінній, є тип шкали вимірів.