Капралов Е.Г., Кошкарев А.В., Тикунов В.С. и др. - Геоинформатика (Классический университетский учебник) - М., ИЦ Академия - 2005
.pdf2. Представление исходных ОТЕ в виде матрицы ОТЕ-ОТЕ, отражающей результат сопоставления ОТЕ в признаковом или географическом пространстве между собой и содержащей по А^ строк и столбцов:
( |
aU |
a |
|
||
|
а2 j |
aiN |
А = |
|
(2.15) |
|
a(N-\) 1 |
a(N-\)N |
|
вю |
aNN |
где ai} — результат сопоставления /-й и j-й |
ОТЕ; /, у е { 1 , T V } . |
Обычно ау означает меру различия (или сходства) ОТЕ. В случае интерпретации в качестве мер различия матрица А симметричная с нулями на главной диагонали. Переход от матрицы ОТЕпризнак к матрице ОТЕ-ОТЕ осуществляется с помощью задания метрики d (или расстояния между ОТЕ).
Рассмотрим пример представления ОТЕ с помощью матриц объект-признак и объект-объект.
Допустим, анализируется электоральная статистика в разрезе субъектов Российской Федерации, TV = 89, М = 6. Признаками или показателями электоральной географии могут являться название субъекта (0), процент голосов, отданный за какого-либо кандидата (1), явка избирателей (2), количество недействительных бюллетеней (3), уровень образования в регионе — низкий, средний или высокий (4), статус субъекта Российской Федера-
Название субъекта РФ
Москва
Калужская
обл.
Омская
обл.
Якутия
Фрагмент матрицы объект-признак
Число голо- |
Явка |
Количество |
Уровень |
|
сов, отдан- |
недействи- |
|||
избирате- |
образова- |
|||
ных за кан- |
лей, % |
тельных |
ния |
|
дидата X |
бюллетеней |
|||
|
|
|||
1 030479 |
46 |
97 085 |
Высокий |
|
62 400 |
71 |
2006 |
Средний |
57 003 |
54 |
4330 |
Средний |
Т а б л и ц а 2.2
Статус субъекта РФ
Город
Область
Область
30 211 |
68 |
7045 |
Низкий Республика |
Т а б л и ц а 2.3
Фрагмент матрицы объект-объект
Название субъекта РФ Москва Калужская обл. Омская обл. Якутия
Москва |
— |
— |
— |
— |
— |
Калужская обл. |
1,6 |
— |
— |
— |
— |
|
|
|
— |
— |
— |
Омская обл. |
1,4 |
0,9 |
|
— |
— |
Якутия |
2,0 |
1,2 |
|
1,6 |
— |
ции — область, край, автономный округ, город или |
республика |
(5). Фрагмент матрицы объект-признак для этого случая приведен в табл. 2.2.
Для иллюстрации таблицы объект-объект рассмотрим пример оценки экспертом экологической ситуации в регионах. Предположим, что эксперт не может дать уверенную оценку по какомулибо региону, поэтому он сопоставляет регионы между собой методом парных сравнений (табл. 2.3).
Способы расчета расстояний и показатели качества классификации. Признаки могут быть измерены в различных шкалах, что накладывает ограничение на способы расчета расстояний между ОТЕ. В приведенном выше примере показатели (1), (2) и (3) — количественного типа, показатель (4) — порядкового типа, показатели
(0) и (5) — номинального типа. Для количественных признаков важны единицы измерения. Сопоставлять пары ОТЕ по показателю (3) не совсем корректно, поскольку численность населения в ОТЕ различна. Показатель (1), выраженный в процентах, позволяет сравнивать ОТЕ без проведения дополнительных процедур (например, нормировки, о которой будет сказано ниже).
Различные виды расстояний между ОТЕ, во-первых, позволяют сформировать различные матрицы близостей ОТЕ-ОТЕ для географического и признакового пространств. Кроме того, на их основе строятся расстояния между классами и функционалы качества классификации.
Расстояние между ОТЕ в географическом пространстве обозначим символом g, в признаковом пространстве — символом d:
g,d : О х О /?.
Расчет расстояний между ОТЕ в географическом пространстве.
Задание расстояния в географическом пространстве должно быть содержательно интерпретируемым. Например, для ОТЕ точечного (городов и др.) и полигонального (административно-территори-
14S