- •Глава I теоретические аспекты
- •Глава Il
- •Глава III конструирование моделей
- •Глава IV конструирование моделей
- •Глава V конструировани е сложных
- •Глава V l
- •Глава Vl l
- •Глава Vll l
- •Глава IX геоинформатика
- •Глава I. Теоретически е аспект ы моделировани я в тематическо й картографи и 6
- •Глава II. Конструировани е моделе й структур ы яв лени й 3 3
- •Глава III. Конструировани е моделе й взаимосвязе й явлени й 10 0
- •Глава IV. Конструирование моделе й динамики яв лени й 16 3
Глава IV конструирование моделей
ДИНАМИК И ЯВЛЕНИЙ
IV. 1. МОДЕЛ И ДИНАМИК И ПРОСТРАНСТВЕННОГО РАСПРОСТРАНЕНИЯ ЯВЛЕНИЙ
Исследование распространения явлений по территории, ка к правило, многоаспектно и сложно формализуемо, что связано с большим рядом причин, влияющих на направления и скорости перемещения. Н о учет большого количества факторов значительно осложняет имитацию процессов, а иногда второстепенные, соподчиненные причины даж е затушевывают основную картину распространения явлений. В связи с этим многопараметрический процесс имитации пространственного распространения явлений весьма заманчиво смоделировать, основываясь на минимальном числе наиболее доступных показателей.
Дл я этого можно использовать ряд моделей ка к детерминистских, та к и стохастических. Среди стохастических моделей пространственного развития явлений важное место занимает метод МонтеКарло, который имеет хорошо разработанную структуру вычислительного алгоритма (Бусленко, Шрейдер, 1961; Соболь, 1968; и др.) и позволяет получать объективные результаты. По-видимому, все это и привело к широкому использованию данного метода для решения различных задач пространственного развития явлений (Матлин, 1971; Петров, Тикунов, 1983; Тикунов, 19856; Bailey, 1957; Bartlett, 1957; Hagerstrand, 1957; Garrison, 1962; Morrill, 1962, 1963; Forster, 1973; и др.).
В географических исследованиях н е менее широко используются модели, основанные на цепях Маркова (Харвей, 1971; Koмедчиков, Светлосанов, Тикунов, 1992; Maccheroni, 1971; Varraso,
1981). Интересен опыт приложения теории игр для решения проблем прогнозирования пространственного размещения явлений (Stevens, 1961; Gould, 1963). Достаточно полные обзоры по данным вопросам можно найти в работах (Хаггет, 1968; Харвей, 1971; Дра
И* 16 3
мович, 1979; Przestrzenna...,1975; Dramowicz, 1976). Также можно указать н а эксперименты по моделированию "волн" заселения (Bylund, 1960), развития эпидемий (Rushton, Mautner, 1955) и др. Однако среди класса детерминистских моделей основная масса работ посвящена тем или иным аспектам применения так называемых "гравитационных" моделей или их модификаций (см., например, обзор в книге П . Хаггета, 1968, с. 50-57) .
IV. 1.1. "Гравитационные" модели динамики пространственного распространения явлений
Судя по анализу опубликованной литературы, среди данного класса моделей наиболее часто имитируются потоки населения или отдельных его категорий, грузопотоки, объемы телефонных переговоров между пунктами и т.д. Иными словами, моделируются сложные многопричинные явления, которые вряд ли могут быть полностью формализованы и описаны математическими уравнениями. Однако целый класс процессов распространения явлений по территории имеет сходные стороны. Например, логично предположить, что поток отдыхающих, устремляющихся к Черноморскому побережью, или покупателей к торговым точкам, так ж е как и поток иногородних абитуриентов в вузы, будет связан с люд ностью населенных пунктов, из которых происходит миграция, и их пространственной удаленностью от центров притяжения мигрантов.
Для большинства разновидностей миграций это два самых общих фактора, влияющих на объем миграционных потоков. Но можно назвать и еще целый ряд специфических факторов, например для последнего случая это будет связь профиля вуза с преимущественным видом занятия населения, популярностью данного профиля вуза, характером информации о нем, количеством мест в вузе и т.д. Однако это сложнодоступные и менее значимые факторы. Поэтому в качестве конкретного примера была выбрана задача имитации некоторой "абстрактной" эпидемии по территории (Тикунов,
1981а). В данном случае модель основывалась на формуле взаимодействия населенных пунктов Стюарта (см. формулу (2.2)), созданную по аналогии с моделью тяготения Ньютона. Поэтому получаемые результаты рассматривались нами как ориентировочные, а сама модель - как первое приближение к математическому описанию процесса. В качестве примера моделировалось развитие эпи
164
f*5
Рис. 43. Условный пример этапности распространения эпидемии
демии между городами Великобритании с числом жителей боле е
100 тыс.
В рассматриваемом примере отсутствовали типичные источники помех, вызывающие, по мнению некоторых ученых, расхождения фактов с формулой (2.2). Это отсутствие сильных потоков не местного характера и не использование для расчетов малолюдных поселений. Статистический материал был взят из официальных материалов переписи населения в 1971 г. (Census. England an d Wales..., 1971; Census. Scotland..., 1971).
При обосновании возможностей использования модели было сделано следующее допущение. Полагалось, что развитие эпидемии пря мо пропорционально числу контактов между людьми, а следовательно, определяется объемом миграций между пунктами. Как уже отме чалось для большинства разновидностей миграций, людность пункто в и их пространственная удаленность являются самыми общими факто рами миграции. Но можно указать и еще ряд специфических факто ров, например искажения в характере распространения эпидемий, вызываемые превентивными прививками, карантинными мероприятиями и т.д.
Методику расчета этапности распространения эпидемий, разработанную автором с учетом возможности их картографирования, удобно проиллюстрировать на условном примере. Допустим, что имеется шесть населенных пунктов, все необходимые данные о которых све дены в табл. 1. Графическое изображение размещения пунктов пока зано на рис. 43.
Прежде всего, используя формулу (2.2), следует рассчитать матрицу, характеризующую объемы миграций между пунктам и (табл. 2).
165
Таблица 1
Условные данные для моделирования распространения эпидемии
Y
2, 0
1,0
2,1
2,6
3,7
3,1
Таблица 2
Матрица объемов миграций между населенными пунктами
П у н К T ы
1 2 3 4 5 6
п
1
68,5 5
88,7 6
240,1 3
446,2 7
19,07
У
2
68,5 5
343,9 4
628,0 3
329,47
31,4 9
H
3
88,7 6
343,9 4
2846,9 5
997,0 1
45,1 2
к
4
240,1 3
628,0 3
2846,9 5
5215,5 7
349,0 7
T
5
446,2 7
329,47
997,0 1
5215,5 7
239,2 4
ы
6
19,07
31,4 9
45,1 2
349,0 7
239,2 4
После этого задается номер пункта, и з которого начинает распространяться эпидемия например, 5. Дале е из пятого столбца мат рицы выбирается максимальное число (5215,57), свидетельствующее о наибольшем объеме миграций между соответствующими пунктами, а следовательно, и о максимальной вероятности перенесения эпидемии из пункта 5 в пункт 4. Теперь уж е пункты 5 и 4 могут служить очагами распространения эпидемии. Поэтому максимальное число выбирается из двух столбцов - четвертого и пятого, естественно, н е принимая во внимание уж е реализованное число
5215,57. В этом случае максимальное число (2846,95) показывает, что эпидемия распространится из четвертого пункта в третий. Рассматривая третий, четвертый и пятый столбцы, находим следующее максимальное число - 997,01 (3-5). Но в этом случае распространение н е происходит, так ка к эпидемией уж е охвачены оба этих пункта. Поэтому данное число из анализа исключается и отыскивается в этих ж е трех столбцах следующее максимальное число - 628,03. Следовательно, на третьем этапе эпидемия распространится из пункта 4 в пункт 2. Далее наиболее вероятно поражение пункта 1 и з пункта 5 (446,27). Наконец, когда лишь до шестого пункта еще н е
166
распространилась эпидемия, анализ пяти первых столбцов показывает, что она придет сюда и з пункта 4 (349,07). Этапность пространственного развития эпидемии может быть показана графически, ка к это сделано н а рис. 43. Цифры над стрелками обозначают номера этапов распространения эпидемии.
Аналогичным образом смоделировано распространение эпидемии и з Лондона до всех остальных 57 городов Великобритании с числом жителей более 100 тыс. Результирующая карта представлена на рис. 44. Этапность распространения эпидемии показана толщиной стрелок, что позволяет воссоздать картину постепенного развития эпидемии по территории. Анализ полученной карты свидетельствует о доминирующем влиянии Лондона не только на близлежащие города, но прежде всего на достаточно удаленные крупные города страны (Бирмингем, Бристоль, Манчестер, Шеффилд и др.). То есть прежде всего эпидемия будет распространяться между крупнейшими городам и и лиш ь затем ка к бы веерообразно от крупных городов к более мелким. Поэтому противоэпидемические преграды следует устанавливать в первую очередь между крупнейшими (а н е ближайшими) пунктами, та к как в противном случае общее число жителей, попавших в волну эпидемии за одни и т е ж е отрезки времени, окажется большим.
Основные оси распространения эпидемии совпадают с главнейшими путям и сообщения Британии - основными автотрассами (мотовеями) и железнодорожными магистралями. Более того, можно заметить определенное совпадение картины распространения эпидемии с транспортной доступностью между городами. Например, чтобы добраться из городов Южного Уэльса в Ливерпуль или Манчестер, по времени часто выгоден н е кратчайший путь через центральный Уэльс, а путь через Лондон, который большинство жителей выбирает для аналогичных поездок при использовании общественного транспорта. Таки м ж е образом распространение эпидемии из городов южного Уэльса в районы Ланкашира и Уэст-Райдинга произошло бы через Лондон, что отчасти подтверждается рис. 44.
Как ж е ведет себя модель, если менять некоторые ее параметры? Так , если показатель степени у величины D в формуле (2.2) взять равным 1, то доминирующее влияние Лондона оказывается еще боле е контрастно выраженным. В этом случае, если показатель степен и будет равен 3, т.е. фактор расстояния будет влиять на результирующую величину достаточно сильно, лучш е проявляются особенности регионального характера. Дл я данного варианта четко выражена тенденция последовательного развития эпидемии между круп
167
Рис. 44. Распространение эпидемии из Лондона между городами Великобритании. Толщина линий в ступенчатой шкале передает этапность распространения эпидемии
ными городами: Лондон - Бирмингем - Манчестер - Шеффилд - Лидс - Брадфорд, с последующим распространением эпидемии от них к более мелким.
В некоторых случаях для моделирования пространственного распространения явлений вместо обобщенной модели (формула (2.2)) можно использовать эмпирические формулы миграций, что, на пример, показано при моделировании притока абитуриентов в вузы (Свентэк, 1971; Тикунов, 1983а, 19856; McConnell, 1965). Собрав определенный фактический материал для того или иного вида миграции и убедившись, что эмпирические формулы, их описывающие, достоверны, в последующем открывается возможность использовать и х как стандартные формулы для тех или иных территорий с цель ю прогнозирования объемов миграций на основе достаточно общих и легкодоступных сведений. Отчасти поэтому ж е к вышеописанному эксперименту по моделированию этапности распространения эпидемии следует относиться как к методическому примеру. Если вместо уравнения (2.2) использовать эмпирические зависимости, то это, несомненно, повысит достоверность моделирования.
Проведенный эксперимент по имитации распространения эпидемии между городами правильно передает скачкообразность характера их распространения из очага. В этом случае возможно распространение эпидемии в более удаленный от источника пункт с последующим е е появлением в близлежащих пунктах и т.д. Однако разработанная модель в явном виде н е имитирует вероятностный характер распространения эпидемий, поэтому в продолжение данного эксперимента нами осуществлена работа по их моделированию с использованием метода Монте-Карло.
IV. 1.2. Стохастическое моделирование пространственного распространения явлений
В качестве конкретного примера, иллюстрирующего методику моделирования пространственно-временного развития явлений, выбрана имитаци я развития эпидемий с использованием метода Монте-Карло (Петров, Тикунов, 1986).
Вкратце метод Монте-Карло заключается в следующем. Исследуемое явление представляется ка к нека я абстрактная система, которая может находиться в нескольких различных состояниях. При этом считается, что нахождение системы в каком-либо из состояний слу 169
чайн о и вероятность этого факт а подчиняется определенному закону распределения, который характеризует ка к саму систему, та к и связи между различными ее состояниями. С помощью таблиц случайных чисел ил и датчиков псевдослучайных величин моделируются конкретные реализации состояний для исследуемой системы. Обрабатыва я полученную таким образом информацию о системе методами математической статистики, получают требуемые численные результаты . Элементарное изложение данного метода дано в работе (Нивергельт, Фаррар, Рейнголд, 1977).
В нашем эксперименте применялась стохастическая пространственно-временная модель распространения явлений эпидемического типа , т.е. без учета конкретного вида эпидемий, имеющих свои особенности течения эпидемического процесса. Таки м образом, целью исследования было моделирование развития эпидемии н а конкретной территории, но при ряде условных допущений, без учета того, что каждая эпидемическая форма болезни характеризуется своими , только присущими ей закономерностями течения эпидемического процесса, своими особенностями распространения среди раз личных возрастных и профессиональных групп населения и др. Иным и словами, моделируется некоторая абстрактная форма эпидемии. Методическим основанием работы послужили уже проведенны е исследования, подробно рассмотренные в работах (Бейли, 1970; Драмович, 1979). В кратком изложении их результаты сводятся к следующему.
Территория, изображенная на карте, для которой моделируется пространственное распространение эпидемии, разбивается на ряд территориальных единиц, размеры которых существенно меньше размеров исходной территории. Население каждой территориальной единицы делится на три группы: А - восприимчивые к инфекции , В - носители инфекции, С - выбывшие, т.е. переболевшие, умершие и т.д., а также иные лица, удаленные из процесса.
В классической модели эпидемии Кендалла (Бейли, 1970; Дра мович, 1979) взаимодействие между вышеперечисленными группам и населения в конкретной территориальной единице и между на селением прочих единиц описывается системой из трех обыкновенных дифференциальных уравнений следующего вида:
(4.1)
xKO Ж 0 ~ У (4.2)
170
где Xi(l), yi(t), Zi(i) - относительные частоты групп населения Л , в, с, соответственно находящихс я в i-й территориальной единице в момент времен и t, приче м xt(t) + y((l) + Zi(l) = 1 дл я любой г'-й единицы и любого t; /3 - частота случае в заражения ; у - частота случае в удаления ; о - плотность населения ; уг-(/) - среднее значени е yt(l), взвешенно е п о территории. Среднюю взвешенну ю вычисляют по формул е
т = XiJyj(I) dS, (4.4 )
где - дол я носителей среди жителе й /й территориальной единиц ы в момен т времен и t; Xij - неотрицательны й весовой коэффи циент , показывающи й влияни е носителей инфекци и из j-й единиц ы н а восприимчивых лиц , находящихс я в г'-й территориальной
единице. Величин а Xij подчиняется условию XydS = 1. Двой ной интегра л обозначает суммирование дл я всех элементов терри тории в предела х i-й и /й территориальных единиц.
Уравнени е (4.1) описывает процесс перехода из состояния А в состояние в, уравнени е (4.2) - и з состояния в в состояние С, уравнени е (4.3) отображает процесс удаления . Аналогичные построения , ка к правило , лежа т и в основе других моделей развити я эпи деми й ил и други х подобных им явлений . У Н . Бейл и (1970) приведена модель пространственного распространения эпидемий в предположении , что территори я являетс я однородной и изотропной в смысле влияни я н а величин у скорости и направлени я распространени я фронт а эпидемии . Дл я этой модели найдено аналитическое ре шение . Р . Камеро н (Cameron , 1975) и ря д других авторов изучал и распространение научны х и социальных идей и представлений, так ж е опираяс ь н а системы обыкновенных дифференциальны х уравнений , с цель ю формализоват ь процессы переходов населени я из одной группы в другую , аналогичн о группам А, В и С.
Одной и з трудностей, возникающи х пр и использовании перечисленных моделей, являетс я получени е численных результатов. Аналитическо е решени е удается получит ь тольк о дл я очень про стых моделе й и пр и разбиени и рассматриваемых территорий н а ма ло е число территориальны х единиц. С ростом сложности моделей
171
и количества территориальных единиц получение достоверных численных решений становится практически малореальным. Математический аппарат, используемый при построении моделей, в целом позволяет получать неплохие результаты. Однако этот аппарат не представляет возможности в полной мере учитывать территориальные аспекты задачи.
В то же время в работах Т. Хегерстранда (Hagerstrand, 1965; и др.) для получения близких по смыслу моделей распространения нововведений используется несколько иной математический аппарат. А именно стохастическое моделирование, основанное н а методе Монте-Карло. Н. Бейли, рассматривая перспективы моделирования эпидемий, такж е предлагает применять метод Монте-Карло, но со следующей оговоркой - "анализ их (стохастических моделей) сопряжен с огромными трудностями, во всяком случае если его проводить чисто математическим путем" (Бейли, 1970, с. 230).
Учитывая состояние проблемы и используя некоторые идеи Т. Хегерстранда, мы сосредоточили свое внимание на пространственном аспекте распространения явлений и анализе получаемых результатов с географических позиций. Моделирование процесса переходов населения в территориальных единицах и з одной группы населения в другую (имеются в виду группы А, В и С), учитывая положительные результаты, полученные рядом авторов, работавшим в этом направлении, нами не рассматривалось, и процесс трактовался в упрощенном виде. Система условий, используемая при построении данной модели, имеет следующий вид.
1. Территория, для которой производится моделирование, разбивается на п равных территориальных единиц. Каждой у-й территориальной единице соответствует пара чисел Xp у^ которые являются координатами ее центра в некоторой прямоугольной системе координат.
2. Дл я каждой /й территориальной единицы задается численность населения в ней - d,.
3. Кажда я территориальная единица может находиться в одном из трех состояний: I. Данная единица охвачена эпидемией (т.е. все ее население относится к группе в); И. Эпидемия в территориальной единице закончилась (ее население выбыло из процесса распространения инфекции и целиком относится к группе С); III. Эпидемия в данной единице еще не началась (т.е. ее население целиком относится к группе А). В начальный момент моделирования по крайней мере одна территориальная единица должна быть в состоянии I.
172
4. Состояния всех территориальных единиц могут меняться только через дискретные промежутки времени. Причем разность между двумя любыми последовательными моментами времени Ц и Ц + j постоянна.
5. Если в некоторый момент времени Z1в j-й территориальной единице начинается эпидемия, то считается, что все ее население заболевает, т.е. переходит в группу В, а сама единица соответственно переходит из состояния III в состояние I. Естественно ожидать, что через некоторое время Aij территориальная единица перейдет из состояния I в состояние II , и тогда ее население не будет оказывать влияния н а последующее распространение эпидемии, т.е. целиком перейдет в группу С. Промежуток времени Atj для данной j-й территориальной единицы в первом приближении будем считать пропорциональным численности жителей в ней, т.е.
Atj = К • dPj,
(4.5)
где К - некоторая постоянная величина дл я всего региона. Если положить, что ~d - средняя численность населения всех территориальных единиц, а At - время продолжительности эпидемии в территориальной единице, которая имела бы численность населения
2 , то тогда
6. Вероятность возникновения эпидемии в момент времени Ц в у-й территориальной единице считается большей нул я только в случае, если в момент времени tt _ j она находилась в состоянии III согласно п. 3; в противном случае вероятность считается равной нулю. Искомая вероятность р.пропорциональна сумме вида
(4.7)
где d j - численность населения в /й территориальной единице; (I1 - численность населения в Ifc-й единице, которая в момент времени ti _ j находилась в состоянии I, причем таких единиц т, а их
номера есть Z1, Z2, Z 3 ,... , Zm; Rj ^ = - х^) 2 + (у;- УIi)2, т.е. квад 173
рат расстояния между /й и Ik-й единицами. Дл я каждой /-й территориальной единицы, которая в момент времени Ц _ j находилась в состоянии III, определяем величину pj. Дл я всех прочих территориальных единиц полагаем эту величину равной нулю. На ходим сумму
п
Q = ^ Pj. (4.8)
/=1
Затем определяем p j для любой /-й территориальной единицы по следующей формуле:
Pj = -< 4 9 >
п
очевидно, что: a) ^ Pj -U Ь) все территориальные единицы, ко /=1
торые находились в момент времени ti_1 в состоянии I или II,
будут иметь вероятность возникновения в них эпидемии в момент времени Ц, равной нулю.
7. Н а каждом шаге по времени согласно набору вероятностей P1 , р 2 , р^, ...,P n из всех п территориальных единиц выбираем /-ю , в которой на данном шаге возникает эпидемия. Пом е этого выбора перебираем все территориальные единицы, которые находятся в состоянии I, и те из них, для которых окончилось время Atj, переводим в состояние II. Выбор искомой у-й единицы осуществляется посредством следующей процедуры. Пусть имеется число принадлежащее некоторой выборке случайных чисел, равномерно распределенных н а отрезке [0, 1 ]. Найдем суммы
B0 = O, Zj=^Pp /=1,2,3 , ...,п, (4.10)
*=1
и будем считать, что выбирается /я единица, если выполняется условие
Bj_ i <£<B j . (4.11)
Момент времени, когда произошел выбор /й единицы, фиксируется и обозначается Tj. В течение промежутка времени Atj /я территориальная единица находится в состоянии I, а как только A^ + tj > tt,
174
где Ц - текущий момент времени, эта единица переходит в состояние II.
8. Процесс моделирования можно прекратить в любой момент
времени Ц, где i = 1,2 , 3 , < " . Но понятно, что наступит такой момент времени, когда не останется ни одной территориальной единицы в состоянии III. Очевидно, что тощ а будет известно для каждой территориальной единицы время начала (Ti) в ней эпидемии.
Реализуя процесс моделирования с одними и теми ж е исходными данными т раз, в итоге для i-й территориальной единицы будем иметь выборку if , tf, ... , Очевидно, что, используя эту выборку, можно дать ряд статистических оценок случайной величины, представляющей собой время начала эпидемии в данной территориальной единице. Таким образом, можно дать любой территориальной единице статистические оценки величины времени начала эпидемии и тем самым получить пространственно-временные характеристики процесса распространения эпидемии по исследуемой территории. Кроме этого в любой момент времени tk можно подсчитать численности населения всей территории, относящиеся к группам А, В и С. Обозначим эти величины Ajc, Bj,, Cjc. Очевидно, А<к + В'к + Ok - Р , где P - общая численность населения.
Используя m-наборов {А^, Bjc1 С%}, можно, как было описано выше, оценить функци и групп населения PA(t),PB(t) и Pc(Jl)1 на ходящиеся в соответствующие моменты времени в группах А, В и С. Дл я исследования процесса развития эпидемии имеет смысл такж е анализировать величину £2 (см. формулу (4.8)), так ка к чем больше £2, тем интенсивнее происходит процесс распространения эпидемии. Анализ выборки (3/4 } дает возможность сделать соответствующие выводы о поведении этой величины во времени. Таким ж е образом можно подвергнуть анализу аналогичные набо
H a основе поставленных условий и допущений была составлена программа на языке Фортран, в которой для получения случайной величины равномерно распределенной н а отрезке [0, 1 ], был использован стандартный датчик псевдослучайных величин. При помощи этой программы было проведено моделирование процесса разви 175
ЖЖЖХХХХЖЖЖХХЖЖЖЖЖЖЖЖХЖХЖЖЖХЖЖЖЖЖЖЖЖЖЖЖЖЖ хжжжжжжхжхжжжхжжжжжжжжжжжжжжжжжжжжжжжжж ж жжжжххххжжжжхжжжжжжжжж ж жхххжхжжжжжхжхж * хжжхжж х жжжж ж :жжжхж*жжжжжжж ж
хжжхж х J жж ж г : : и и и хжжххжжжжхжх *
х : и : : : жжжжжжжжжж ж
х : : : х : : и и : жжжжжжжжжжж ' ж : : : : и и : жжжжжжжжж ж
х ж и : : : и : : : ж жжжххх ж жж ж : и : и и : жхжх ж жж ж и : и : и жхжххх ж ж** х : : : : жжжжжж ж жжжж ж * Ж" " Ж* XX X ЖХЖ хжжхж х ЖЖЖ * хжжжхххххж * жжж ж
кжхжжхжжжжжжжжжжжжжж ж * хжжжжхххххжххжжхххжхжж х жжхххжххххжхжжжжжжжхжхж х ж жжхжжжжжжжжжжжжжжжжжжжхххжххх ж ххжх ж жжжжжжжжжжжжжжжжжжжжжжжжжжжжжж х жжххж ж жхххххжжжжжжжжжжжжжжжжжжжжхжжжжжххжжжжж ж жжхжжжхжжжжжжжжжжжжжжжжжжжжжжхжжжжжжжжж ж
а ЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖ жхжжжжжхжжжжжжжжжжххжжжжхххжжхжжжжжжжжж х жжжжжжхжжжжжхжжжжжжжжж ж жжжжжжхжхжжжжжж ж жжжжжж ж : жжжж ж : :жжжжжжжжжжжжж * жжжжж ж : жж ж : : : : : : : жжжжжжжжжхжх ж ж : : : : : : : : : жжжжжжжжжж ж ж и : : : : : х : : : : : : :жжжжжжжжжж ж ж : : и : : : : : жжжжжжжжх ж х ж : и : : : : : и : : : ж жжжжжж ж жх ж S s : : и и : : : : : : жжжж ж жж ж : : : : : : : : : : : жжжжжж ж жжж ж : : : : : : : : : жжжжжж ж жжжж ж : : и : : ж жж ж жжжж * : : : : жж ж жжжжж ж жж ж : ж жжжжжжжжжж ж жжж ж
жжжжжхжжхжжхжжххжжжж ж ж
Ж*ЖЖЖЖЖЖЖЖЖЖЖXXжжжжжжжж жжжжжжжжхжжжжжжжжжжжжжж ж ж жжжжжжжжжжжжжжжжжжжжжжжжжжжжж ж жжжж ж ЖЖЖЖЖХЖЖЖЖЖЖЖЖХЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖ ЖХЖЖЖЖ жжжжхжжжжжжжжжххжжжжжжжжжжжжжжжжжжжхжжж ж жжжжжжжжжжжхжжжжххжжжжжжжжжжжжжжжжжжжжх х
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ: X - место начала эпидемии,
W - клетки, в которые попала эпидемия
(больных - 33.0% населения),
: - клетки, через которые уже прошла
эпидемия (переболевших 13.6%),
* - клетки вне Алтайского края
с ЖЖЖЖХЖЖЖЖЖХЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖ жжжжЖЖЖХЖЖЖХЖЖЖЖЖЖЖЖЖЖЖЖЖхЖЖЖЖЖЖЖЖЖЖЖЖЖЖ ЖХХХХХХХХЖХХЖЖЖЖЖЖЖЖЖЖЖ ЖЖХЖХЖХЖЖЖЖЖЖЖЖЖ жхжжхх х : : жжжжж: : : : :жжхжжжжжжжх*ж ж хжхжж ж ::жж ж : : : : : : : : жжжжжжххжжжж х
* • : : : : : : : : : : : : : : : : : : жжжжжжжжжж ж х : ::и ; : u : : it: :х:::::::::жжжжжжжжж" ж
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ: X - место начала эпидемии,
W - клетки, в которые попала эпидемия
(больных - 31.5 % населения),
: - клетки, через которые уже прошла эпидемия (переболевших 33.5%) ,
* - клетки вне Алтайского края
*ж *: ::и:и : : :::: :
жжжжжж*жж *
ш:: : : : :: : ; :::: ; ::::: : :: : * *******
*** : :: и:; :: : :.-2:: ::::: : :: : s
*****
****: : г;; : : : : ::: :
***** :::и: :и: ::: : : :
:: :
Jt:
; *******
***** :::* :: : :
****** ***** I
*********** * * * *
: * * * *
: * * *
• • • :и : *
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ: X - место начала эпидемии,
"ЖХЖЖЖЖХХЖЖЖЖЖЖЖЖЖЖЖХ ЖЖЖЖЖЖХЖЖЖЖЖЖЖЖЖЖЖЖХХЖЖ ЖЖЖЖЖЖжУЖЖЖЖЖЖЖЖЖЖжжжжжж ж ХЖЖЖЖЖЖХХХЖХЖЖЖЖЖЖЖЖЖЖЖЖЖХЖХХЖ ЖЖЖЖЖ ЖХЖЖЖЖХХХЖХЖХХЖХХЖЖХХХХЖЖЖЖХЖХХ ххххж х жжхжжжхжжжжжжжжжжжжжххххжххжжжжжхжжжхжж ж хжхжжжжжхжжжжжжжжжжжжжжжжжжжжжхжжжжжжжж *
W - клетки, в которые попала эпидемия
(больных -26.7 % населения),
: - клетки, через которые уже прошла эпидемия (переболевших 59.0%) ,
* - клетки вне Алтайского края
Рис. 45. Распространение эпидемии по территории Алтайского края из г. Барнаула, смоделированное методом Монте-Карло
тия эпидемии по территории Алтайского края на основе следующих исходных данных.
Величины численности населения по населенным пунктам Алтайского края суммировались по ячейкам прямоугольной сетки со сторонами 20 х 31 км на местности. Каждый полученный прямоугольник символизировал собой территориальную единицу. В ка честве их координат брались точки пересечения диагоналей прямо
176
А
3
33222 3 2222223 2
- 332321 2 3200121021 3
^232322222222222201 001111122 4
322332222332221100X00011122 2
0323332222222211100021 OIOI 222 *
3232222222222210122100002123 " *
2323222222221122121000111233434 3
23222322212212222121102013324 "
3222312222222222222222223234 *
2322101222222233233332344444 * * *
42232122233332333333233****4**" * '
3 21222434*3333333334***43** 4 * *
3333 * **43*333334*434*4Ж* Ж
"43333343443344*4 *
*4333**4**43334* *
**Ж***44* 4 *4** Ж
**Ж4 * Ж* *
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ : Время начала эпидемии (T) обозначено:
0 - при О < T < 5 0
1 - при 50 < T < 100
2 -пр и 100<Т<20 0
3 - при 200 < T < 300
4 - при T > 300
X - место начала эпидемии,
* - клетки с нулевой плотностью населения
33322 3 1222223 2
322321 2 3200111122 2
232222322222222210001111223 4
322332222322221100000121122 3
323232222222212100121 O 111202 3
3233222222222211122110001123 * *
2222222222222121121300112232433 3
33332322212222222121112013324 *
3222311112222222223222222323 *
23220X0122223232232332243444 " * *
42341011123332333333233****4*** "
3 20222434*3333333334***44**4* *
3333 * **33*333344*434*4* Х
"43333443443344*4* *
*4333**4**44334 *
"ЖЖЖ**44Х4*4*** * Ж**4 *
**Х
УСЛОВНЫ Е ОБОЗНАЧЕНИЯ : Время начала эпидемии (T) обозначено:
0 - при 0 < T < 50
1 - пр и 5 0 < T < 100
2 -пр и 100 <Т < 200
3 - пр и 200 < T < 300
4 - пр и T > 300
X - место начала эпидемии,
* - клетки с нулевой плотностью населения
Рис. 46. Оценки математического ожидания времени начала эпидемии в каждой территориальной единице Алтайского края: А - из Барнаула; В - из Рубцовска
угольников. Если прямоугольник оказывается,вн е территории края , то в процессе моделирования он н е учитывался. Прямоугольная сетка была выбрана и з соображений получения результирующих "карт на алфавитно-цифровом печатающем устройстве (АЦПУ) ЭВМ, учитывая отстояние лите р в строке и строк между собой, с тем чтобы карты сохраняли подобие очертаний оригиналу. Размер сетки определялся детальностью исходного материала, что привело к формированию 413 прямоугольников, участвующих в процессе моделирования.
Моделирование проводилось при начал е эпидемии из территориальной единицы, включающей в себя г. Барнаул , а во втором эксперименте - г. Рубцовск. Н а рис. 45 виден характер развития эпидемии из начального очага по территории в различные моменты времени, при t - соответствующему 51-му выбранному шагу процесса моделирования (рис. 45, Л) , 101-му шагу (рис. 45, В) и 201-му шагу (рис. 45, С). Н а распечатках карт (точнее сказать, н е карт, а примитивных графических изображений, которые те м н е менее вполне удовлетворительны дл я их содержательного анализа) приведены так
1 2 Тикунов 1 7 7
же величины долей всего населения, находящегося в данный момент времени соответственно в группах А, В и С. Дл я каждого варианта моделирования, т.е. как с очагом в г. Барнауле, та к и г. Рубцовске, было проделано по 20 реализаций процесса распространения эпидемии. По каждой территориальной единице вычислялись оценки мате матического ожидания и среднеквадратического отклонения величины времени начала эпидемии. Соответствующие данные по территориальным единицам также могут печататься в виде карт на АЦПУ ЭВМ. Так , карты оценок математического ожидания времени начала эпидемии представлены на рис. 46.
Анализируя рис. 45 и 46, нетрудно заметить, что полученные результаты моделирования в общем согласуются с пространственным варьированием плотности населения. Так , прежде всего волна эпидемии от Барнаула ка к бы распространяется вдоль железных дорог на Бийск, Рубцовск, в сторону Новосибирска, к наиболее густо заселенным территориям края и прежде всего в районы предгорий Алтая и по долине р. Оби. Лишь затем происходит "заполнение" пустот между этими направлениями развития эпидемии и появление ее в Кулундинской степи. Вероятность же появления эпидемии в районах Горного Алтая мала, что и проявляется в полном отсутствии здесь ее очагов. Можно заметить такж е появление эпидемии прежде всего в крупных, хотя и достаточно удаленных от очага эпидемии, городах с последующим ее "расползанием" на окружающие территории.
Коэффициент корреляции между плотностью населения и оценками математического ожидания величины времени начала эпидемии в каждой территориальной единице равен 0,39. Аналогичный коэф фициент для оценки среднеквадратического отклонения равен 0,49 в случае начала эпидемии из г. Барнаула. Коэффициенты корреляции аналогичных оценок с величинами потенциала поля расселения гораздо выше 0,83 и 0,71, что свидетельствует о лучшем соответствии интегральных характеристик населенности территории с ха рактером распространения эпидемии. Это же в какой-то степени подтверждает правомочность использования гравитационных моделе й для имитации процессов распространения эпидемии. Дл я случая распространения эпидемии из г. Рубцовска данные коэффициенты соответственно равны 0,31; 0,41; 0,81; 0,61.
При проведении моделирования существенную трудность представил этап оценки достоверности получаемых результатов. Наилуч шим и простейшим путем для этого могло бы стать сравнение результатов моделирования с реальными данными. Однако это далеко
178
*жжжжжжххжжжжжжжхжжжж*хжж**жххжжххххх*х *
"*хххххххххх*хжжхххжжх*жжхжжхх*хжхх***ж ж
хжхжхжжжжжххжхжжхххххх х жжхххххжжжжжжхх ж
ЖЖХЖХХЖ XXXX X S * * * х ж ж * ж ж * * * * ж
жжххх х SXX X хххжжхжхжххх х ж s жхжжжжхххх ж XS X жжжжжжхххж* " ж S S S Бжжжжжхххх ж
х * S S S ОЖОЖЖЖХХЖЖ
ХжХ XXXXX
хж х ожххжхх ж
жжж ж ожххххх ж ЖЖЖЖЖ ОЖООХЖХ Хж'жжж OOO O оооохж х хжххх х XXX S О ОО О O O OO X
"ЖЖЖЖЖЖХЖЖЖ ОХЖЖЖОО О O O О О О
хжхжжжжжхххжжжжжжжжжх о О O x
"ХХХХХЖХЖХЖЖЖЖХХХХХЖХХЖО O O O O O O ЖЖХХХХХХХХХХХХХЖЖХХЖХЖХХОООООО О О OOOX ХЖЖЖХЖЖЖХЖЖХХХХХЖХХХХХЖЖЖХЖЖЖХООО о х х х ж *
*ЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖ****ХХХХХХЖ"ХХХОООХ*Х*ЖЖ ЖЖХХХХХЖЖЖЖЖЖЖ*ЖЖЖХЖЖЖХЖЖЖЖЖЖЖХ***Х*ХХЖ*
*жжххххж*жжжжжжжжхххжжжжж*жж*ж*ж**жхххж *
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ : X - место начала эпидемии,
S - клетки с существенным расхождением оценок мат. ожидания,
О - клетки с нулевой плотностью населения,
* - клетки вне Алтайского края
в жжххххжжжж**ж*жжжжж*ж**жжжжжжжхж*жж*жжж ж жжж*ж*хх*хж*жххжжжж*жжжж**жжжжжжжжж*жх* х хжхжжжжжхххжжжжххжхжхж ж жжххххжжжжхжжжх х Х*Ж*ХЖЖ XXX* * Х**Ж*"Х"Х**** Ж
хжжхх ж S x * * хжхжжжжжхжжх ж
X S S хжжххжххжх "
* S S жжжжжжжжжх ж
* ЖЖХЖХЖ***Х XX S ОЖОЖХХЖЖХ* XXX хжхж х Х* Ж S S S S ОХ" XXXX X ХЖЖЖ S о х х ж х х х ж ЖЖЖЖЖ X S S о ж о о ж ж х ХХХЖЖ OOOO OUOOXXX ХЖЖХЖХвЖЖЖ S О О О О O O 0 0 * ХЖХЖХЖЖЖЖЖЖ ОХЖЖХО О 0 0 ООО ХЖЖЖЖХЖХЖЖЖХЖЖХЖХЖХХХО О о *
жж**жж**жжжжж**ж***хж*ж о O O O O O O ХЖЖЖ*ЖЖЖЖЖЖЖХХ*Ж**ХХЖХЖХОООООО О О OOOX ЖЖЖЖХЖЖЖЖЖХЖЖЖХ*ХЖХXХххжжжжжжжооо ожхжж " ЖЖЖХХ**ЖЖЖ*ЖЖ*ЖЖ***ХЖЖЖЖЖЖЖЖЖЖ*ОООЖЖЖ"ЖХ
***Ж***ЖЖЖ*ЖЖЖЖЖЖЖЖЖЖЖЖ*ЖЖЖЖЖЖЖЖ**ЖЖ***Х
ХХЖЖЖЖЖЖХ**ЖХЖЖЖЖ*ЖЖ*Ж**ХХХЖ****ХХ*"СЖЖХ*
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ: X - место начала эпидемии,
S - клетки с существенным расхождением оценок мат. ожидания,
О - клетки с нулевой плотностью населения,
* - клетки вне Алтайского края
Рис. 47. Значимые расхождения оценок математического ожидания времени начала эпидемии в каждой территориальной единице согласно f-крнтерию при начале эпидемии из: А - Барнаула; В - Рубцовска
не всегда возможно сделать. Второй путь заключается в проведении как можно большего числа реализаций моделирования с целью уменьшения ошибок оценивания соответствующих параметров. Но этот способ требует больших затрат машинного времени, чем снижает возможность широкого использования предлагаемой модели. Третий путь заключается в получении численных результатов с использованием иного способа выборки случайной величины £ при сохранении неизменными всех остальных условий моделирования.
Выбрав последний путь и использовав другой датчик псевдослучайных величин, нами были получены результаты, очень близкие к первому варианту моделирования. Коэффициент корреляции между набором оценок математического ожидания времени начала эпидемии при использовании двух различных датчиков оказался равным в случае начала эпидемии в г. Барнаул е 0,98 и в г. Рубцовске
0,97. Аналогичные значения для выборок оценок среднеквадратических отклонений равны 0,83 и 0,87. Таки м образом, можно сделать предварительный вывод, что полученные результаты близки между собой.
12* 179
Дл я более детального сравнения оценок математического ожи дания времени начала эпидемии в каждой территориальной единиц е был использован статистический метод сравнения двух выборочных средних в предположении, что они принадлежат нормальной совокупности. Метод основан на распределении Стьюдента (Z-распределение) (Закс, 1976). При доверительной вероятности 0,9 были получены следующие данные: в случае начала эпидемии из г. Бар наула расхождения оказались значимыми в 12 территориальных единицах и з общего числа 357 единиц с ненулевой людностью, а в случа е начала эпидемии из г. Рубцовска - в 18 территориальных единицах. Пространственное размещение этих территориальных единиц фик сировано на картах (рис. 47).
Таким образом, полученные результаты, проверенные ка к с ма тематической, так и географической точек зрения, можно считать достаточно достоверными. А их близость при различных вариантах построения модели позволяет говорить о правильности использования алгоритма.
1\/.1.3.Диффузионные модели пространственного распространения явлений
В отличие от моделирования распространения эпидемий, име ющих вероятностный, скачкообразный характер развития, в географи и существует целый ряд явлений, распространяющихся по тер ритории постепенно. В качестве примера можно привести опыт по моделированию так называемых "нововведений", при заимствовании смысла и терминологии из работ Т . Хегёрстранда и большого числа его последователей (Харвей, 1971; Пред, 1979; Хаггет, 1979;. Слей тер, Спайсер, 1980; Райтвийр, 1981; Ханин, 1982; Hagerstrand, 1952; Bylund, 1960; Cliff, 1979; Coombs, 1981; Saint-Julien, 1981; и др.) . В этих случаях чаще всего ставятся задачи моделирования движе ния фронта диффузии "нововведений" ка к некоторой обобщающей абстракции, выражающей в нашем случае постепенный процесс раз вития явлений по неоднородной территории.
Одним и з широко практикуемых способов представления дина мики различных явлений в естествознании является "диффузионный процесс". Его можно рассматривать ка к процесс переноса веще ства, выравнивающий концентрацию данного вещества в пространстве. В работе (Харбух, Бонэм-Картер, 1974) приводится ряд примеров моделей различных геологических процессов, основывающихся на математическом аппарате диффузионного процесса. Авторы данной книги, анализируя конкретные разработки, делают следующий вы
180
вод: "Методы математического описания диффузии можно с успехом использовать дл я моделирования различных реальных процессов, которые н е являются процессами "диффузии" в прямом смысле этого слова" (с. 158). Поэтому ка к первое приближение в моделировании волнообразного распространения "нововведений" нами использовалась детерминистская модель движения фронта диффузии , тем более что в ряде работ, основанных на эмпирических исследованиях, подтверждается, что форма диффузии во времени и пространстве напоминает волну (Morill, 1970). Этот вывод был положен в основу принципов выбора математической модели для нашего эксперимента (Петров, Тикунов, 1983). В данном исследовании использовались лиш ь самые общие, легко доступные материалы - данные о плотности населения и характере его размещения по территории, которые могут быть использованы ка к среда, внутри которой распространяется диффузи я "нововведений".
Пр и построении модели распространения "нововведений" по территории будем следовать следующей схеме. В каждой элементарной ячейке территории подсчитывается плотность населения. Под эле ментарной ячейкой условимся понимать ячейку регулярной сетки, покрывающей исследуемую территорию. Элементарные ячейки могут иметь нулевую численность населения. Дл я того чтобы диффузи я могла распространяться и через эту часть территории, их людность можно условно задать малой величиной, большей нуля. С другой стороны, если оставить их людность равной нулю, то процесс моделирования будет реализоваться с условием наличия непреодолимы х преград для диффузии, что такж е представляет интерес.
Все население изучаемой территории разделим на две категории: а) до достижения населения элементарной ячейки "нововведением"; б) после достижения их "нововведением", когда данна я группа населения становится его распространителем. В начальный момент времени t = Z0 в некоторой совокупности элементарных ячеек должны быть расположены один или несколько центров распространения "нововведений". Это означает, что в них находится ненулевое число распространителей "нововведения" (информаторов). Если число ин форматоров в элементарной ячейке больше определенной величины R, постоянной для любой ячейки территории, то в ней начинается цепной рост численности информаторов, пока все население н е освоит "нововведение". Пусть в некоторый момент времени t> одна из соседей какой-то элементарной ячейк и обладает ненулевой численностью информаторов, то тогда согласно соответствующему коэффициенту диффузи и с часть информаторов и з нее диффузирует
181
в рассматриваемую элементарную ячейку . Коэффициент диффузии с для каждой элементарной ячейки положим пропорциональным численности населения в ней.
В тот момент времени Ii > когда в данной элементарной ячейке начинается распространение "нововведения", коэффици ент диффузии с станет уменьшаться, оставаясь пропорциональным численности населения, н е охваченного "нововведением", и в момент t2>t\ , когда все население освоит "нововведение", станет равным нулю. Следовательно, г = t2 - t{ есть время освоения "нововведением" данной элементарной ячейки. Таки м образом, информаторы будут диффузировать только туда, где сохранилось до этого момента времени неинформированное население. Пр и достижении границы территории информаторы ее н е пересекают, т.е. диффузия "нововведений" распространяется только в пределах исследуемой территории.
Как следует из вышесказанного, основное внимание в рассмотренной схеме уделяется вопросу пространственно-временной динамики фронта "нововведений". Перечисленные условия формализуются ма тематически посредством следующей задачи:
du(xy,t)=e du(xy,t) +
dt дх 4 J ' дх
+ с (х, у, t) ди *> + / (X, у, 0 , (4.12)
(х, у) е g, г > г0,
где g - территория моделирования; х, у - прямоугольные координаты в области g; - начальный момент моделирования; и (х, у, t) - численность информаторов; с (х, у, t) - коэффициент диффузии; / (х, у, t) - функция, характеризующая кривую роста численности информаторов. Здесь (х, у) - координаты элементарной ячейки, где определены и (х, у, t), с (х, у, t) и /(х , у, t), a t > t0 соответствующий момент времени.
Начальные и граничные условия задачи имеют следующий вид:
и (х, у, t(0) = U 0 (х, у),
на # (4.13)
ди (х, у, t)
дп = 0 , на Sg
(4.14)
182
где и (х, у, t), х, у, t, Ц, g определены вьппе, dg - граница области g,
~ - производная по нормали функци и и (х, у, t) в точке границы с
координатами (х, у) и в момент времени t, ы0 (х, у) - функци я распределения информаторов по территории в начальный момент времени
Дадим аналитическое определение с (х, у, t) и / (х, у, t). Пусть z (х, у) есть численность населения в элементарной ячейке с центром в (х, у). Если z = max z (х, у), то положим
(*,У) € g
с (х, у, f0 ) = Z (х, y)fz. (4.15) Определим с (х, у, t) дл я t > следующим образом:
c(x,y,t) при t0<t<tl,
с (х, у, t) = (z (х, у)-и (х, у, t))/l при tx < t < t2, (4.16) О при t > t2.
При тех ж е предположениях / (х, у, t) вычисляется по формуле
/( х,у , О
О при tQ< t < ti и при t > t2,
z (х, у)/г (х, у) при tx<t< t2. (4Л7>
Такж е полагалось, что г (х, у) ~ Vz (х, у), а именно г (х, у) =
= T0 где T0 - время освоения "нововведением" всего населения элементарной ячейк и с максимальной ее численностью.
Таки м образом, процесс пространственного распространения "но вовведений" оказывается формализованным в виде задачи, заключающейся в решении уравнения (4.12) с начальными (4.13) и граничными (4.14) условиями. Ввиду невозможности получения ана литического решения данная задача решалась численным методом. А именно приближенное ее решение искалось посредством применения соответствующей "разностной схемы". Подробное изложение такого подхода к решению дифференциальных уравнений в частных производных можно найти в (Дьяченко, 1977). При построении "разностной схемы" могут использоваться алгоритмы и программы, приведенные в книг е (Харбух, Бонэм-Картер, 1974). Пример использования данной модели для территории Алтайского края приведен в работах (Петров, Тикунов, 1983, Тикунов, 19856). .
Описанная методика расчетов может быть легко модифицирована в зависимости от содержательных особенностей географичес 183
ки х явлений. В качестве другого примера, позволяющего проиллюстрировать изменчивость методики, обратимся к созданию карты транспортной доступности в изохронах (в изолиниях равных издержек и т.д.) (Петров, Тикунов, 1984).
Одним и з условий моделирования "нововведений" являлось то, что средняя скорость ее диффузии неизбежно уменьшалась во времени из-за падения средней величины концентрации "информаторов", что не соответствует задаче определения изохрон доступности. Второе противоречие заключается в том, что в классической модел и распространение диффузии зависит от неоднородностей ранее пройденных участков. В данном случае, при моделировании положения изохрон, каждая из них должна лишь определять началь ную линию для диффузии, распространяющейся в зависимости от проходимости участков территории з а каждый последующий промежуток времени. Дл я удовлетворения отмеченных ограничений моделирование следует проводить по следующему алгоритму. Пусть в начальный момент времени (Z0) все диффузирующее явление сконцентрировано в области gQ и имеет внутри нее постоянную концентрацию, равную V0, т.е.
uO ( х > у) =
V0 если (х, у) G g0,
О, если (х, у) ¢. gQ. ( 4 Л Й )
Решая задачу (4.21)-(4.23), без учета функции f(x,y, t), получае м для любого Z1 = Z0 + AZ значение и (х, у, Z1). Зна я время Z1, можно определить область (gt ) распространения явления, используя правило
(X, у) G S1, если и (х, у, Z1) >_v, если и (х, у, Z1) < v.
где V < V0 и определяется заранее при постановке задачи. Естественно, что границу области g1 можно считать требуемой изохроной доступности для момента времени Z1.
Дале е определим с (х, у) и U1 (х, у)):
с (х, у) =
U1 (х, у) =
С (х, у), если (х, у) <£ Eo
О, если (х, у) G g 0 '
v0> если (х, у) G i'j
" (х, у, fj) , если (х, у)
(4.20)
184
участок территории со значениями скоростей передвижения (км/ч) ; В, С, D - три варианта расчетов доступности территории из различных точек, отмеченных крестиком
Заменя я в уравнениях (4.21)-(4.23) с (х, у) на с (х, у), а ы0 (х, у) н а W1 (х, у) и Z0 на Z1, при этом сохраняя значение v постоянным, можно получить требуемую изохрону в момент Z2 = h + ^Z. Повторяя описанные процедуры для Z3, Z 4 , ... , Z1= Z1_ j + Ai, определяем требуемые изохроны доступности.
Реализаци я рассмотренной методики моделирования проводи лась нами дл я небольшого участка местности размером 0, 5 х 0,6 км, изображенного на рис. 48, А. Н а данном участке были определены выделы с примерно одинаковой возможной скоростью передвижения по Ним (см. рис. 48, а). Дале е весь участок был покрыт сетью из 2009 квадратов (49 столбцов и 41 строка), характеризуемых возможной скоростью перемещения внутри них, и задан квадрат начала диффузии (на рис. 48, В, С, D - отмечен крестиками).
185
Таки м образом, все исходные характеристик и - с (х, у), и0 (х, у), необходимые дл я моделирования, могут быть представлены в ви де матриц [Cij) и {u(r)-}, где i и j соответственно количество столбцов и строк матриц . Пр и реализаци и задач и элемент ы матриц ы
{ufy брались равными нулю , кром е элемента , соответствующего квадрату начал а диффузи и и равного v0. Элемент ы {сгу}, соответствующие скоростям передвижения в процессе моделирования, ис пользовались в нормированном виде. Нормировка осуществлялась путем деления фактических величи н скорости в каждо м элемен тарном квадрате на максимально возможну ю дл я данного участ к а ее величину, т.е. О < Cij< 1. Дл я всех вариантов моделирования (рис. 48, В, С, D) были взят ы следующие параметры : v0 = 100; V1 = 10; z = 1 ,2,3 ,...,49 ; /=1 ,2,3 ,...,41 . Изохрон ы
проведены через 10 с.
Простота реализаци и описанной методики позволяе т многократ ное экспериментирование с целью оценк и различны х возможны х вариантов транспортной доступности пр и изменения х транспортных сетей, прокладке новых путей сообщения и т.д. Использование раз новидностей методики может дать н е противоречащие географи ческой логике результаты, но в каждо м конкретном случа е необходимо постоянно следить з а соответствием модели характер у яв лений, таких, ка к распространение лесны х пожаров, диффузи я за грязнения в неоднородных средах, доступность регионов, "распол зание " в пространстве некоторых видов эпизоотий и др.
IV.2. МОДЕЛ И ДИНАМИК И СОДЕРЖАТЕЛЬНОГО РАЗВИТИЯ ЯВЛЕНИЙ
IV.2.1. Марковские модели динамики содержательного развития явлений
Модели динамик и содержательного развити я явлени й связан ы с решением важны х и весьма насущных задач , прежде всего прогноза, например роста населения городов, объемов промышленного про изводства и т.д. Пр и некоторых видах прогнозов достаточно хороши е результаты дают модели, основанные на цепя х Маркова (Харвей,
1971; Лютый, 1974; Харбух, Бонэм-Картер , 1974; Сербенюк, Ти кунов, 1980; Maccheroni, 1971; Varraso , 1981; и др.). Дл я того чтобы говорить об использовании данного метода дл я прогнозирования гео 186
графических явлений, необходимо хотя бы вкратце остановиться н а основных понятиях о цепя х Маркова.
Рассмотрим некоторую систему, которая в любой момент времени (время меняется дискретно) находится в одном из состояний Ql , Q 2 , Q3, QnЭт и состояния образуют полную и несовместную систему, т.е. они исчерпывают все и з возможных состояний системы, которая в фиксированный момент времени находится только в одном и з них . Вероятность Pij(I k ) того, что в момент времени tk система перейдет в состояние Qjи з состояния Qi, в котором она находилась в момент tk _ l, не зависит от того, в каких состояниях система находилась в предыдущие моменты времени. Последнее положение называется марковским свойством системы. Вероятности перехода рц (3/4) в своей совокупности образуют матрицу P f , причем
в каждом ее столбце имеется хотя бы один отличный от нуля эле мент. Пр и этом вероятности перехода удовлетворяют в любой момент времени tk соотношению
п
I PiyOfc) = 1, i=l,2,3,...,n , (4.21)
/=1
где п - количество состояний системы.
Таки м образом, процесс изменения состояний системы во времени, удовлетворяющий перечисленным свойствам, называется цепью Маркова. Цеп ь Маркова будет неприводимой, если каждое состояние системы достижимо и з любого другого состояния. Цепь Маркова называется однородной, если вероятность перехода р^ (3/4) не зависит от tk, т.е. ру (tk) - PiJ (i,j= 1, 2, 3 , . . и и любого tk).
Вектор-строка р (т) = Jp1 (т), р2 (т),р3 (т), ...,рп (га)] абсолютных вероятностей того, что в момент времени Zm система перейдет соответственно в состояние Q l i Q2, Q3, -.. , Q m , определяется фор мулой
р(т) = р (O)-Vt
а для однородной цепи -
1 .. . -P f , (4.22)
р(т) = р (0) • P m , (4.23)
где P = [ру] , а р (0) - начальная строка абсолютных вероятностей. Подробнее о цепях Маркова можно прочесть в работах (Романов 187
ский, 1949; Хорафас, 1967; Венцель, 1969; Смирнов, Дунин-Бар ковский, 1969; и др.).
Следует обратить внимание, что н е всякий географический про цесс может моделироваться с помощью цепей Маркова. Прежде всего, вычислив матрицу вероятностей переходов, следует убедиться, обладает ли исследуемый процесс марковским свойством, а такж е проверить, является ли данный процесс однородным. Подробно критерии проверок на марковское свойство и однородность изложены в работах (Харбух, Бонэм-Картер, 1974; Anderson r Goodman , 1957).
Дл я иллюстрации процесса моделирования, предполагая, что про цесс однороден, и фиксируя в каждый текущий момент времени номер состояния системы, можно путем элементарных арифметических операций показать этапы вычисления искомой матрицы вероятностей переходов. Пусть система имеет возможность находиться в состояниях Q1 и Q 2 . Такж е допустим, что в течение семи последовательных моментов времени система имела следующие состояния: Q 1 , Q 1 , Q 2 , Q 1 , Q 2 , Q 2 , Q 1 , Q 2 . Данный ряд позволяет построить следующую таблицу:
(X )
(XX )
1
2
(ххх)
1
1
3
4
2
2
1
3
где (х) - номер послепереходного состояния системы; (хх) - номер предпереходного состояния; (ххх) - количество раз, коща система находилась в предпереходный момент времени в соответствующем состоянии.
Из таблицы видно, что система один раз перешла и з состояния Q1 в Q 1 , три раза - из Q1 в Q 2 и т.д., а четвертый столбец свидетельствует, что четыре раза система переходила из Q1 в Q1 или Q 2 и три раза - из Q 2 в Q1 или Q 2 . Далее несложно вычислить матрицу вероятностей переходов. Дл я этого каждый элемент строк первых двух колонок делится н а величины соответствующей строки последней колонки. В итоге получаем
р _ [0,25 0,75]
~ [0,76 0,33 j •
Получив матрицу переходных вероятностей Р, можно приступить к вычислению прогнозных величин явления на определенное число
18
шагов - т. Заметим , что алгоритм вычисления прогнозных значений может иметь детерминированный или стохастический ха рактер. В детерминированном случае на основе уравнения (4.30) находится величина р (т) , позволяющая определить математическое ожидание прогнозируемой величины. При стохастическом подходе, используя значения случайной величины, равномерно распределенной н а отрезк е [0, 1 ], на каждом шаг е разыгрывается состояние, в которое переходит система, что повторяется т раз для каждого и з этапов.
В наше м эксперименте требовалось вычислить прогнозные значения людности городов, дл я чего использовался следующий вариан т алгоритма. Убедившись, что процесс обладает марковским свойством и однороден, можно, используя временной ряд людности на селения какого-либо города, вычислить матрицу переходных вероятностей. Это позволяет вычислить прогнозную величину. В математическом выражении процедура заключается в следующих действиях . Пусть XI - численность населения города в г-й год. Образуем ряд J1, у2, Уз, Уп, где у,вычисляется по формулам
У/ = 1, J U i = ^ t i , г =1,2,3 , ...,л 1, (4.24)
xI
где п - длин а временного ряда людности городов.
Дале е выбирается шкал а прироста населения. Под ней понимается набор непересекающихся интервалов, причем учитывается, чтобы в каждый из них попадало по крайней мере одно из значений yt. Пусть таки х интервалов будет I. Используя данную шкалу и ряд
J 1 , у2, Уз> •••> Уп> построим следующий ряд: Z1, Z2, z 3 , ... , zn, где Zi - номер интервала шкалы, в который попадает уПосл е этого вычисляе м матрицу переходных вероятностей. Ее р ^ элементы (г, j =
= 1, 2, 3, ..., I) вычисляются следующим образом. Сначала находятся числа /у, равные числу переходов от i к j в ряде Z1, z2 , z3 , ... , zn.
i
Зате м подсчитываются суммы в каждой строке, т.е. O i = ^ /£/-, Z= 1
г = 1, 2, 3,...,/ , и уж е затем вычисляютсяр ф
Вычисление прогнозной величины производится следующим образом. Находится номер интервала, которому принадлежит величи 189
Рис. 49. Прогнозные карты людности крупнейших городов и плотности населения по областям Украины: А - фактические данные за 1961 г.; В - фактические данные за
на, равная единице (так как полагалось, что в начальный момент относительный прирост населения равен единице). Пусть этот номер равен j. Образовав вектор р (0) = (0,... , 0, 1,0,... , 0), где на j-м месте стоит единица, а на остальных нули, необходимо умножить его на P = [pij\ в степени т и получить вектор р (га). На основании р (га) вычисляется математическое ожидание величины относительного прироста численности населения данного города на m-й год. Оно находится по формуле
7= 1
p i ( " ) < 4 2 б )
190
1979 г.; С - прогнозные данные, полученные с помощью цепей Маркова, на 1985 г.;
D - прогнозные данные, полученные с помощью регрессии, на 1985 г.
где £г- серединасоответствующих интервалов шкалы прироста населения. Перемножив произведения (^1 • £ 2 • £ 3 • .. . £ т ) на абсолютную численность населения в начальный момент времени, получае м прогнозную величину на m-тый год. Понятно, что для каж дого города надо вычислять соответствующую матрицу P и на ее основе моделировать изменения в людности городов. Программы, позволяющие производить необходимые вычисления на ЭВМ, можно найти в ряде работ, например Дж . Харбуха и Г. Бонэм-Картера (1974).
Нами использовался алгоритм построения цепи Маркова с населением более 100 тыс. жителей по данным за 1961-1979 гг. (Сер 191
бенюк, Тикунов, 1980). Достаточно длинный временной ряд в 19 ле т позволил дать прогноз по 3 3 городам, имевшим более 100 тыс. населения в 1961 г., на каждый год, начина я с 1980 и до 1985 г. Дл я того чтобы с максимальной точностью отобразить н а карте как фак тическое состояние, так и прогноз, использовался растровый способ (Ширяев, 1968) для их картографирования.
Кроме того, за те же годы По аналогичному алгоритму дан прогноз плотности населения по всем 25 областям Украины. Чтобы в пределах графической точности без ступеней закартографировать данный показатель, имеющий площадное распространение, применялось следующее правило. Расстояния между линиями штриховок рассчитывались для каждой области пропорционально величинам плотности населения. Соответствующие карты н а начальный (1961) и конечный (1979) годы базового для исследования периода приведены на рис. 49, А и В. Прогнозная карта на 1985 г. изображена на рис. 49, С. Хорошая аппроксимация фактических данных вычисленными уравнениями позволила получить кондиционный прогноз. Ошибка н е превышает 6-8% .
IV.2.2. Регрессионные модели содержательного развития явлений
Регрессионные модели для целей прогнозирования развития географических явлений используются значительно чаще (Победоносцева, 1973, 1974; Сербенюк, Жуков, 1973; Червяков, Михайлов, Лайкин, 1974; Сербенюк, Тикунов, 1981; Березнер, 1982; и др.). В этом случае задача состоит в экстраполяции, т.е. в нахождении функции у при значении аргумента х, лежащего вне исследуемого интервала (X1 хп). Это позволяет распространить выявленные закономерности изучаемого ряда за его пределы, иными словами, прогнозировать будущее развитие данного явления. Задачи с использованием регрессионных моделей могут решаться с различной степенью точности. Наиболее приближенно - вычисление самой простой формы регрессии - линейной. Пусть у - случайная вели чина, распределение которой зависит от некоторой независимой пе ременной х. В результате наблюдений, измерений и т.д. определяется п пар значений: ^1 ), (х 2 ,у 2 ) , (х 3 ,у 3 ) , ... , (хп,
Соотношение линейной регрессии между у и х можно запи сать как
у = OQ + C1X + V, (4.27)
192
где v - остаток, характеризующий величину отклонения линии регрессии от истинных значений функци и х (у). Линия регрессии, уравнение которой имеет вид у = O0 + а^х, может достаточно хорошо аппроксимировать фактические значения. Но во многих
случаях линейна я функци я недостаточна в силу слишком зна чительных отклонений вычисленных ординат от заданных зна чений у. Тогда предполагается, что зависимость фактических показателей выражается многочленом второй степени, а линия регрессии будет параболой. При необходимости дальнейших уточнений используются регрессионные уравнения более высоких степеней, которые в общем виде можно представить многочленом степени т :
у = Oq + A1X + Cl2X2 + . .. + ClnlXm + V. (4-28) Дл я того чтобы остаток v был бы, по возможности, малым, обыч но используется способ наименьших квадратов, позволяющий на ходить таки е значения коэффициентов O0, а^, а2,..., ат, при кото п
рых величина ^ v ? = min.
/=1
Подставляя в полином соответствующие заданные значения Xi
и у;, получаем систему уравнений вида
У! = Oq + CI1X1 + Cl2Xi + • + ClmXf
У2 aO + а \ х г + а2х2 + •• • + атх2
Уз = йо + C1 X3 + а2х\ + .. . + атх? (4-29)
V11 = O0 + CilXn + а 2 4 + .. . + атх(tm) .
Полагая, что число данных уравнений больше числа искомых коэффициентов, т.е. п > т 41, приходим к случаю избыточной системы, решаемой по способу наименьших квадратов. В матричном изображении систему (4.29) можно представить как
v v ^ 3 mWI
Aj Л J . . . Aj
1 X2 . . . X2*
хз хз хз •• • хз X
(4.30)
1 Лу
x уЗ vлm
ат Уп
п п Il •• • п
1 3 Тикунов. 193
или в сокращенном виде
NA = Y, (4.31)
где N - матрица (и х т + 1), состоящая из коэффициентов системы параметрических уравнений (4.29); А - вектор-столбец неизвестных коэффициентов полинома (а0, ах, а2,..., ат); Y - вектор-столбец свободных членов. Согласно принципу наименьших квадратов искомое решение находится из нормальной системы уравнений
N'N A = N'Y или А = (N'N) _ ) N'Y . (4.32) Решение системы уравнений (4.32) позволяет определить значе ния коэффициентов полинома O0, а1г а2, •••, ат.
Заметим лишь, что для прикладных целей нередко целесообразно не назначать предварительно степень полинома, а искать для у аналитическое полиномиальное выражение в процессе последовательных приближений. Вначале можно исходить из линейной функ ции у = OQ + CL1X, затем, если окажется нужным, перейти к функции
у = а^ + <2]Х 4а2х2 и т.д. до тех пор, пока вследствие малости квадратов остающихся отклонений полином не станет удовлетворять по точности решению поставленной задачи.
На основе временных рядов людности городов и плотности населения Украины рассчитывалось семь вариантов прогноза, при аппроксимации рядов полиномами, начиная с первой и заканчивая седьмой степенью. Чтобы для каждого ряда подобрать наиболее подходящую степень полинома, были проведены дополнительные расчеты. Временные ряды всех городов и областей были укорочены на шесть лет (до 1973 г.) и затем экстраполированы н а шесть лет вперед при использовании полиномов с первой по седьмую степень. Сравнение вычисленных и фактических значений за период с 1973 по
1979 г. позволяет выбрать наилучшую для прогноза степень полинома для каждого города и области.
Оказывается, что в большинстве случаев наилучший прогноз получается при использовании полиномов первой или второй степени, реже третьей и четвертой степеней, что, видимо, связано с большой плавностью изменения значений людности от года к году. Ошибка прогноза не превышает 5-7% . Полиномы высоких степеней значи
"
Ряды укорачивались на шесть лет, так как прогноз давался также на шесть лет
вперед (до 1985 г.).
194
тельно увеличивают ошибку прогноза. Выбрав, таки м образом, на илучшую степень полинома для каждого города и области и предполагая, что она окажется наиболее приемлемой и для прогнозного периода, вычисляются соответствующие прогнозные величины н а
1985 г. В настоящее время, когда сделанный прогноз уж е легко проверяется по фактическим значениям людности, можно утверждать, что сделанное предположение оказалось верным, а ошибка прогноза соизмерима с результатом, полученным при использовании цепей Маркова. Картографирование спрогнозированных данных позволяет создать соответствующую карту (рис. 49, D).
Сравнение результатов прогноза, полученных с использованием цепей Маркова и алгоритма, основанного на выборе наилучшей степени полинома при экстраполировании по уравнениям регрессии, свидетельствует о и х большой схожести. Однако сразу ж е следует оговориться, что прогнозные значения могут рассматриваться лишь ка к общие оценки и корректироваться на основе н е учитываемых в модели миграций, функционального типа городов, директивных решений, например, о строительстве крупного завода и т.п., которое приведет к росту населения и др. Некоторые из факторов, влияющие на рост городов, могут быть дополнительно учтены при использовании множественной регрессии. Но и в этом случае, при анализе сложных многофакторных явлений, оказываются чрезвычайно важными последующий географический анализ результатов и правильный, обоснованный подбор принципов и методики прогнозирования.
Заметим, что временные ряды людности, как правило, имеют достаточно плавные изменения. В это м смысле гораздо сложнее экстраполирование временных рядов, например урожайности сельскохозяйственных культур, хотя и такие примеры можно найти в литературе (Рогач, 1969; Пономаренко, 1971; Победоносцева, 1973, 1974; Червяков, Михайлов, Лайкин, 1974; Сербенюк, Тикунов, 1981; Бе резнер, 1982; и др.).
196
