Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекція 7. Атрибутивні дані та аналіз їх розподілу.doc
Скачиваний:
16
Добавлен:
28.06.2022
Размер:
3.29 Mб
Скачать

3. Номінальні (категоріальні) шкали виміру атрибутивних даних

Номінальні змінні використовуються для класифікації даних, якщо останні можна розділити на окремі групи за певною ознакою. Номінальні змінні бувають двох типів: бульові (логічні) та категоріальні.

Бульові (логічні) змінні приймають тільки два значення ("так" або "ні"). Вони використовуються у випадках, коли атрибутивні дані потрібно класифікувати, наприклад, населенні пункти за наявністю і відсутністю в них метро або розділити усі міста на ті, де є аеропорт, і ті, де аеропорти відсутні, тощо.

Категоріальні змінні використовуються для розподілу даних на декілька категорій без будь-якого впорядкування. Наприклад, можна ввести такі категорії використання земель, як житловий район, рекреаційна зона або зона промислово-торгового використання. Іншим прикладом категоріальної змінної може слугувати порода дерев: ялина, сосна, тополя, осика тощо.

Одним із найбільш поширених атрибутів просторових об’єктів є їхні власні назви (назви населених пунктів, адміністративних одиниць, ділянок рельєфу, рік, водойм, природних урочищ, об’єктів господарювання тощо).

Згідно з номінальною шкалою (рис. 5.2), об’єкти відрізняються за назвами (луг, болото, рілля, міська територія тощо).

Ця класифікація означає, що дані визначаються тільки в термінах належності до певних класів.

В атрибутивній таблиці баз даних номінальні змінні зазвичай утворюють заголовки стовпчик.

Ідентифікація об’єктів за номінальною шкалою дозволяє зробити висновки про те, як називається об’єкт, але унеможливлює пряме порівняння одного об’єкта з іншим, за винятком визначення тотожності.

Для більш детального порівняння об’єктів потрібно використовувати більш високу шкалу вимірів даних. Номінальні або якісні змінні використовуються тільки для якісної класифікації.

Категорії – групи схожих об’єктів, які допомагають краще відобразити сутності досліджуваних даних.

Рис. 2. Приклад застосування номінальної шкали на карті ґрунтів України

Об’єкти одного класу завжди певним чином подібні і мають характерні особливості, які відрізняються їх від об’єктів іншого класу. Наприклад, до

категорії доріг відносять автостради, шосе або ґрунтові дороги. До категорій злочинів – крадіжки зі зломом, напади, злодійство (рис. 3).

Рис. 3. Розподіл атрибутивних характеристик за номінальною шкалою на карті криміногенності

Значення категорій можуть бути подані у вигляді числового коду, символу, кольору або тексту. Текстові значення часто наводяться у скороченому вигляді з метою економії місця в таблиці.

4. Порядкові (рангові) шкали виміру атрибутивних даних

Атрибути, які показують місце розташування об’єкта серед інших аналогічних об’єктів, їх взаємну ієрархію, пріоритет, називаються порядковими або ранговими атрибутами.

Ранги – рівні в ієрархічно організованій системі, місце в рейтингу, ступінь, клас.

Ранги використовуються для опису дискретних класів даних, що упорядковані за певною ознакою. Зазвичай, це систематизація атрибутів за зростанням або зменшенням використовуваної величини, коли безпосередня оцінка величини ускладнена або визначається комбінацією факторів. У більшості випадків такі атрибути описуються порядковим номером визначеної рангової шкали. За їх допомогою описуються ієрархії ділянок дорожньої мережі (автостради, шосе, дороги з удосконаленим покриттям, ґрунтові дороги), елементів річкової мережі, ієрархічні рівні ландшафтних одиниць, ранги населених пунктів тощо (рис. 4).

Рис. 4. Аналіз розподілу атрибутивних характеристик за ранговою шкалою

Прикладами рангів можуть слугувати і рівні освіти: початкова, середня, середня спеціальна та вища.

Ранжування є відносною оцінкою, оскільки свідчить тільки про місце певного об’єкта в заданому порядку певних характеристик. За допомогою рангів досить складно кількісно оцінити, наприклад, таку характеристику водотоку, як бурхливість потоку (рис. 4а). Можна тільки стверджувати, що потік, який протікає гірською ущелиною, має більш високий ранг, на відміну від струмка, що протікає рівниною. Порядкова шкала використовується для того, щоб з’ясувати, наскільки один об’єкт відрізняється від іншого, тобто показує спектр значень "від найкращого до найгіршого", наприклад, дороги державного, обласного, місцевого рівнів.

Порядкові змінні дозволяють ранжувати (упорядкувати) дані всередині одного класу. Вони вказують, які дані в більшому або меншому ступені мають якість, притаманну даній групі вимірюваних величин. Однак вони не дозволяють визначити "на скільки більше" або "на скільки менше". Порядкові змінні іноді називають ординальними. Типовий приклад порядкової змінної – ключове значення (ключовий стовпчик) у базі даних.

Крім того, можна визначити ранги на основі інших атрибутів об’єкта. Наприклад, можна надати певний тип, який визначає їх придатність для вирощування зернових культур (рис. 4б).

Якщо потрібна більш висока точність у вимірах атрибутивних даних, потрібно скористатися інтервальною шкалою виміру, або шкалою відношень, у якій вимірюваним величинам приписуються числові значення (рис. 4в).

Як і у випадку порядкової шкали, тут також можна порівнювати об’єкти, але порівняння виконуються з більш точною оцінкою різниць.