Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекція 7. Атрибутивні дані та аналіз їх розподілу.doc
Скачиваний:
16
Добавлен:
28.06.2022
Размер:
3.29 Mб
Скачать

6. Основні операції обробки атрибутивної інформації

Як відомо, атрибутивною інформацією називається набір даних, асоційований з графічними об’єктами. Атрибутивна інформація зазвичай подається у вигляді записів декількох атрибутивних таблиць, що зберігаються в базі даних.

Робота з атрибутивними таблицями даних є важливою складовою частиною будь-якої ГІТ. Основними операціями з атрибутивною інформацією є такі:

– вибірка;

– обчислення;

– статистична обробка.

Вибірки призначені для роботи тільки з потрібною частиною інформації, яка міститься в таблиці атрибутивних даних, та надання можливості визначення нових атрибутивних характеристик певним об’єктам. Здійснити вибірку – означає обрати лише ті рядки атрибутивної таблиці певного шару даних, які відповідають заданим умовам. Вибір даних проводиться з використанням запиту, який має форму логічного виразу.

Обчислення призначені для визначення нових атрибутивних характеристик на основі вже існуючих в атрибутивній таблиці. При обчисленні спочатку створюється нове поле в атрибутивній таблиці, а потім задається вираз (правило) обчислення.

Статистична обробка – це розрахунок статистичних характеристик на основі атрибутивних даних як вибірки.

Можна виділити два принципово різні варіанти взаємодії просторової та атрибутивної інформації об’єктів.

Перший варіант заснований на інтерактивній взаємодії користувача з ГІС за допомогою графічної оболонки, які включають основні засоби селекції даних за географічними властивостями (наприклад, за допомогою візуального пошуку об’єктів на електронній карті) і перехід до атрибутивних даних знайдених об’єктів, і навпаки, селекцію по атрибутах і перехід до графіки. Цей варіант є більш простим, але й більш обмеженим за своїми можливостями.

Більш функціональний варіант передбачає використання мови SQL для побудови вибірок довільного виду за атрибутивними даними та, відповідно, перехід від цих значень запитів до просторової складової об’єктів. Для реалізації цієї можливості в ГІС потрібно розв’язати два питання – яким чином дані із значень довільних SQL-вибірок будуть інтерпретовані системою з точки зору зв’язків з росторовими об’єктами і яким чином довільні вирази мови SQL будуть вбудовуватись у систему. Для розв’язку цих задач доцільно використовувати спеціалізовані вбудовані мови програмування, що й робиться в сучасних ГІС.

  1. Властивості змінних

При дослідженні реальних об’єктів і явищ змінні, що їх описують, відносять до двох класів:

залежних;

незалежних.

У статистиці ці змінні називають ендогенними та екзогенними.

Незалежними називаються змінні, які впливають на об’єкт або явище і можуть варіюватися дослідником.

Залежні змінні – це змінні, які відображають результат дії залежних змінних.

Залежність проявляється у відповідній реакції досліджуваного об’єкта на вплив, якого він зазнає. Кінцевою метою будь-якого дослідження або аналізу є знаходження зв’язків (залежностей) між досліджуваними даними або змінними.

Незалежно від типу дві або більше змінних пов’язані (залежні) між собою, якщо спостережувані значення цих змінних розподілені певним чином.

Експериментальні дані дозволяють виявити й обґрунтувати причинний зв’язок між змінними. Наприклад, при виявленні відповідностей у змінах змінних А і В можна зробити висновок (висунути гіпотезу), що між змінними А і В існує причинна залежність. Кореляційне дослідження залежності може з певною достовірністю підтвердити або спростувати наявність такого зв’язку. Однак воно не визначає, яка із змінних залежна, а яка незалежна.

Можна стверджувати, що змінні залежні, якщо їхні значення пов’язані одне з одним в наявних вимірах.

Один з основних способів дослідження – знаходження залежностей між якісними змінними, які подані у вигляді числових мір або функцій. При цьому виділяють величину залежності і надійність (достовірність) залежності.

Величина залежності визначається за допомогою статистичної обробки даних шляхом отримання певної числової міри, яка дозволяє оцінити цю залежність.

Достовірність залежності – імовірнісна оцінка наявності залежності. Достовірність залежності безпосередньо пов’язана з репрезентативністю певної вибірки, на підставі якої будуються висновки.

Статистична значущість результату (р-рівень) є оцінкою його "істинності".

Р-рівень – це показник, що залежить від надійності результату. Більш високий р-рівень відповідає більш низькому рівню довіри до знайденої у вибірці залежності між змінними. Такий р-рівень являє собою імовірність похибки, пов’язаної з поширенням спостережуваного результату на всю вибірку.

Наприклад, р-рівень = 0,05 (тобто 1/20) свідчить, що є 5 % імовірності, що знайдений у вибірці зв’язок між змінними є лише випадковою особливістю даної вибірки.

Чим більша величина залежності (зв’язку) між змінними у вибірці звичайного об’єму, тим вона надійніша.

Статистична значущість показує імовірність того, що схожий результат був би отриманий при перевірці усієї вибірки в цілому.

Таким чином, все, що отримано після тестування усієї вибірки, було б, за визначенням, значущим на найвищому можливому рівні. Це стосується всіх результатів, отриманих у процесі дослідження.