- •8. Нормативные документы, требования которых учитывались при разработке умк дисциплины.
- •Содержание
- •1. Общие положения
- •2. Требования к уровню освоения дисциплины
- •3. Требования к обязательному объему учебных часов на изучение дисциплины
- •4. Требования к обязательному уровню и объему подготовки по разделам
- •Лабораторные работы
- •5. Требования к обязательному минимуму содержания программы
- •6. Литература (основная и дополнительная)
- •7. Перечень учебных наглядных пособий, а также учебно-методических материалов к использованию в учебном процессе:
- •8. Формы текущего, промежуточного и итогового контроля
- •9. Использованию информационных технологий и инновационных методов в образовательном процессе
- •Основания системного подхода при изучении геосиситем и их компонентов.
- •Математические модели в экологии
- •1 Классификация моделей
- •Вычисление основных статистических показателей
- •Основы корреляционного метода
- •Лекция № 7 Сравнение двух групп: критерий Стьюдента
- •Применение гис-технологий
- •Применение классификаций в географии
- •Модель познания и географический прогноз
- •1. Сущность и факторы географического прогнозирования.
- •2. Типология и классификация прогнозов. Этапы прогнозирования
- •3. Методы геопрогнозирования
- •Концепция поля в географии
- •5 . Картографо-статистический метод и карты полей.
- •Задание
- •Порядок выполнения работы в системе statistica
- •Вопросы для самопроверки
- •Вопросы для самопроверки
- •Порядок работы:
- •II. Ключи к тестам (для проверяющего)
Математические модели в экологии
Основные вопросы, рассматриваемые на лекции:
Классификация моделей.
Экологическое прогнозирование и мониторинг.
1 Классификация моделей
При экологическом исследовании, которое обычно проводится на определенном количестве особей, изучаются природные явления во всем их многообразии: общие закономерности, присущие макросистеме, ее реакции на изменения условий существования и др. Но каждая особь, индивидуум неодинаковы, отличны друг от друга. Кроме того, выбор особи из всей популяции носит случайный характер. И лишь применение методов математической статистики дает возможность по случайному набору различных вариантов определить достоверность тех или иных результатов (степень отклонения их от нормы, случайны отклонения или закономерны) и получить объективное представление обо всей популяции. Однако, все биологические системы, обладают способностью к саморегуляции и ограничиваться только методами математической статистики стало невозможно. Поэтому в современной экологии широко применяются методы теории информации и кибернетики, тесно связанные с такими областями математики, как теория вероятности, математическая логика, дифференциальные и интегральные исчисления, теория чисел, матричная алгебра. В последнее время широкое распространение получило моделирование биологических явлений, т. е. воспроизведение в искусственных системах различных процессов, свойственных живой природе. Так, в «модельных условиях» были осуществлены многие реакции, протекающие в растении при фотосинтезе. Примером биологических моделей может служить и аппарат искусственного кровообращения, искусственная почка, искусственные легкие, протезы, управляемые биотоками мышц, и др. В различных областях биологии широко применяются так называемые живые модели. Несмотря на то, что различные организмы отличаются друг от друга сложностью структуры и функции, многие биологические процессы у них протекают практически одинаково. Поэтому изучать их удобно на более простых существах. Они то и становятся живыми моделями. В качестве примера можно привести зоохлореллу, которая служит моделью для изучения обмена веществ; моделью для исследования внутриклеточных процессов являются гигантские растительные и животные клетки и т. д. Основной задачей биологического моделирования является экспериментальная проверка гипотез относительно структуры и функции биологических систем. Сущность этого метода заключается в том, что вместе с оригиналом, т. е. с какой-то реальной системой, изучается его искусственно созданное подобие — модель. В сравнении с оригиналом модель обычно упрощена, но свойства их сходны. В противном случае полученные результаты могут оказаться недостоверными, не свойственными оригиналу. Т. Г. Гильманов (1980) указывает: «Одно из достоинств метода моделирования состоит в возможности построения моделей с «удобной реализацией», ибо удачный выбор реализации делает исследование модели несравненно более легким, чем исследование оригинала, и в то же время позволяет сохранить существенные черты его состава, структуры и функционирования». В зависимости от особенностей оригинала и задач исследования применяются самые разнообразные модели (рисунок 1).
Реальные (натурные, аналоговые) модели, если таковые удается создать, отражают самые существенные черты оригинала. Например, аквариум может служить моделью естественного водоема. Однако создание реальных моделей сопряжено с большими техническими трудностями, так как пока еще не удается достичь точного воспроизведения оригинала. Знаковая модель представляет собой условное отображение оригинала с помощью математических выражений или подробного описания. Наибольшее распространение в современных экологических исследованиях получили концептуальные и математические модели и их многочисленные разновидности. Разновидности концептуальных моделей характеризуются подробным описанием системы (научный текст, схема системы, таблицы, графики и т.д.). Математические модели являются более эффективным методом изучения экологических систем, особенно при определении количественных показателей. Математические символы, например, позволяют сжато описать сложные экологические системы, а уравнения дают возможность формально определить взаимодействия различных их компонентов.
Рисунок 1- Классификация моделей (по В. Д. Федорову и Т. Г. Гильманову, 1980)
Процесс перевода физических или биологических представлений о любой экологической системе в ряд математических зависимостей и операции над ними называются системным анализом, а сама математическая система — моделью. Следует отметить, что математические модели являются неполным абстрактным отображением реального мира.
По типу реализации различаются реальные и знаковые модели. Реальная модель отражает существенные черты оригинала уже по самой природе своей физической реализации. Например, аквариум с его растительностью, животным и микробным населением воспроизводит некоторые черты обитаемых природных водоемов уже потому, что он сам является населенным водоемом, хотя и значительно меньших размеров. Одна из наиболее сложных проблем, с которой приходится сталкиваться при работе с реальными (натурными) моделями, заключается в трудности установления степени адекватности модели оригиналу и, следовательно, в обосновании возможности применения результатов моделирования к исходной системе-оригиналу. В отличие, например, от аэро- или гидродинамики, где разработаны количественные критерии адекватности моделей (критерий Рейнольдса и т.п.), в результате чего стало возможным успешное применение натурных моделей для решения широкого круга научных и конструкторских задач в указанных областях, при натурном моделировании экосистем вопросы обоснования адекватности еще очень далеки от удовлетворительного решения. Кроме того, создание и использование натурных моделей экосистем связано с известными трудностями технического характера, преодоление которых, из-за отсутствия гарантий адекватности, отнюдь не всегда приводит к решению поставленной задачи.
В отличие от реальной, знаковая модель представляет собой условное описание системы-оригинала с помощью данного алфавита символов и операций над символами, и результате чего получаются слова и предложения некоторого языка, которые с помощью определенного кода интерпретируются как образы некоторых свойств элементов системы-оригинала и связей между ними. Как отмечает И. А. Полетаев (1966), знаковые модели несравненно богаче возможностями, чем реальные, ибо они почти не связаны ограничениями физической реализации.
Наибольшее значение для экологии имеют две разновидности знаковых моделей: это, во-первых, так называемые концептуальные и, во-вторых, математические модели.
Концептуальная модель представляет собой несколько более формализованный и систематизированный вариант традиционного естественнонаучного описания изучаемой экосистемы, состоящей из научного текста, сопровождаемого блок-схемой системы, таблицами, графиками и прочим иллюстративным материалом. Несколько тавтологичный, но широко применяемый термин “концептуальная модель” подчеркивает, что назначение этой модели — служить ясным, обобщенным и в то же время достаточно полным выражением знаний и представлений исследователя об изучаемой системе в рамках и средствами определенной научной концепции. Например, в рамках “энергетической” или “биогеохимической” концепции соответствующие концептуальные модели принимают форму блок-схем трофических связей или потоков вещества в экосистеме, которые сопровождаются поясняющим текстовым, табличным и графическим материалом, раскрывающим состав, структуру и некоторые аспекты функционирования экосистемы.
В то же время наряду с такими общеизвестными достоинствами концептуальных моделей, как универсальность, гибкость, богатство средств выражения и др., благодаря которым этот метод применяется к самым разным системам, ему свойственны и недостатки, как, например, высокая неоднозначность интерпретации и известная статичность, затрудняющая описание динамических систем.
При количественном изучении динамики экосистем гораздо более эффективны методы математического моделирования.
В качестве примера рассмотрим идеализированную систему, состоящую из одной популяции, которая существует в условиях изобилия корма и при отсутствии врагов и паразитов. Предположим, что в этих условиях прирост популяции пропорционален достигнутой численности, причем удельная скорость прироста r зависит от единственного внешнего фактора — температуры окружающей среды, которая на рассматриваемом промежутке времени t0≤ t≤ tN считается известной. Чтобы построить математическую модель такой системы, рассмотрим множество V, состоящее из одного элемента — входной функции v(t), задающей динамику температуры окружающей среды при t0≤ t≤ tN, а также множество X, тоже состоящее из одного элемента, действительной переменной х(t), обозначающей численность популяции в момент времени t. Структуру модели образуют три математических соотношения:
(1)
Первое выражает
линейную зависимость скорости роста
популяции от ее численности с
меняющимся во времени коэффициентом
удельного прироста r(t).
Второе служит математическим выражением
зависимости r от
температуры окружающей среды v
(функция
(v)
считается известной). Третье задает
начальную численность популяции при
t=t0
Для нахождения функции модели, т. е. разрешающего оператора F системы (1), подставим в первое уравнение выражение r через v с помощью функции (v):
(2)
Разделяя переменные:
(3)
и интегрируя от х0 до х и от t0 до t соответственно, где х0=х(t0) и х=х(t), получаем
ln|x|-ln|х0|=и(v(t))dt (4)
После потенцирования получаем окончательный результат:
х(t)=х0exp{
и(v(t))dt}
(5)
Таким образом, функционирование модели выражается оператором
х(t)=F(v,х0,t)=х0exp{ и(v(t))dt} (6)
В зависимости от свойств разрешающего оператора F математические модели динамичных систем классифицируются по разным признакам. Так, если для оператора F найдено точное аналитическое выражение, позволяющее для любых входных функций и начальных условий непосредственно определять значение переменных состояния x1,…,xn в любой нужный момент t, то модель принято называть аналитической. Аналитические модели обладают многими благоприятными свойствами, облегчающими их исследование и применение. Однако в подавляющем большинстве случаев нахождение аналитического выражения для разрешающего оператора F оказывается затруднительным или в принципе невозможным. Процедуру численного решения этих уравнений на ЭВМ, в результате чего получается реализация оператора F в виде машинной программы, с помощью которой по входным и начальным данным рассчитываются значения переменных состояний x1(t),…,xn(t) на интервале t0≤t≤ tN. Такие модели называются численными, или, чаще, имитационными.
В зависимости от степени определенности предсказания траектории (x1(t),…,xn(t)) оператором F модели делятся на детерминированные и стохастические (вероятностные). Если в детерминированной модели значения переменных состояния определяются однозначно (с точностью до ошибок вычисления) (рис. 2, А), то стохастическая модель для каждой переменной xi, дает распределение возможных значений, характеризуемое такими вероятностными показателями, как математическое ожидание М{xi}, среднее квадратическое отклонение σ(xi) и т. п. (рис. 2, Б).
Рисунок 2. Детерминированная (А) и стохастическая (Б) модели динамики переменной xi(t).
Для любого момента времени t детерминированная модель предсказывает единственное значение переменной xi(t), а стохастическая модель показывает интервал [xi(t), xi(t)], содержащий величину xi(t) и ее распределение на этом интервале (в частности, математическое ожидание М{xi(t)}, среднее квадратическое отклонение σ{xi(t),} и другие статистические показатели).
По характеру временного описания динамики переменных состояния xi(t) различаются дискретные и непрерывные модели. Дискретная модель описывает поведение системы на фиксированной последовательности моментов времени t0<t1<…<ti< tN, тогда как в непрерывной модели значения переменных состояния могут быть рассчитаны для любой точки t рассматриваемого интервала [t0, tN]. Среди дискретных выделяются модели с фиксированным шагом по времени Δt= ti-ti-1, который не может быть изменен без глубокой перестройки всей модели. Например, в моделях динамики популяции организмов с непрерывающимися поколениями, сменяющимися только один раз в год, принимается Δt= 1 год (Варли, Градуэлл,Хасселл, 1978). В отличие от них существуют дискретные модели, в которых шаг по времени Δt может неограниченно уменьшаться (в пределах возможностей используемой ЭВМ), вследствие чего такие модели по детальности описания временных изменений приближаются к непрерывным. В частности, таковы модели, получающиеся в результате дискретизации непрерывного описания изучаемой системы в процессе приближенного численного решения дифференциальных уравнений.
Следующий важный признак, которому различаются математические модели экосистем, - это характер описания их пространственного строения. Модели, в которых пространственное строение экосистемы не рассматривается, т. е. в качестве переменных состояния фигурируют зависящие только от времени переменные xi(t),..., n, принято называть моделями с сосредоточенными значениями (или точечными моделями), в отличие от моделей с распределенными значениями, в которых переменные состояния xi зависят не только от времени, но и от пространственных координат (одной или нескольких). Например, при моделировании водной экосистемы в качестве переменных состояния можно взять усредненные по площади и суммированные по глубине значения биомасс популяций, запасов биогенных элементов и т. д., выраженные, например, в граммах под площадью зеркала воды в 1 м2 — это будет модель с сосредоточенными значениями (Алексеев, 1975). Если в модели учитывается гетерогенность по глубине (координата z), т. е. xi=xi(z,t) то получается (очевидно, более детальная) модель с распределенными значениями по глубине, но все еще осредненными по плоскости (х, у). При описании мелкого, хорошо перемешиваемого по вертикали, но гетерогенного по плоскости водоема целесообразно в качестве переменных состояния использовать функции вида xi=xi(x,y,t). Наконец, вводя все три пространственные координаты xi=xi(x,y,z,t), получают модель с пространственно распределенными значениями.
Завершая краткое введение в метод моделирования, остановимся на некоторых способах визуального представления результатов моделирования. Наиболее часто используется так называемый способ развертки во времени, который состоит в построении таблиц или графиков изменения входных переменных и переменных состояния как функций времени t (рисунок 3,A ). При всех его достоинствах этот способ не всегда (особенно при большом числе переменных) дает наглядное представление взаимосвязей между переменными. Поэтому в дополнение к нему нередко используется так называемый способ фазовых портретов, когда на график наносится изображение траектории системы в пространстве состояний (при n=2 или 3) или проекции этой траектории на координатные плоскости (xi, xj), образованные различными парами координат при n>3 (рисунок 3, Б). Время присутствует на фазовом портрете неявно, через указание тем или иным способом направления движения изображающей точки вдоль траектории (например, с помощью стрелок или отметок времени вдоль траектории). Соотношение способов развертки во времени и фазового портрета поясняет рисунок 3, В).
Рисунок 3 - Представление результатов моделирования способами развертки по времени (А) и фазового портрета (Б), соотношение этих двух способов в случае двухмерного фазового пространства (В).
В качестве примера рассмотрим простейшее дифференциальное уравнение, описывающее рост популяции какого-либо вида:
dх/dt=rх,
где х — плотность популяции в момент времени t; r — истинная скорость роста, принятая постоянной. Решением этого уравнения является функция
х=х0еrt,
где х0 — плотность популяции в момент времени t=0.
Следовательно, если проводить наблюдение за большой выборкой особей в течение короткого периода времени Δt, то доля особей, размножившихся в течение этого периода, будет равна rΔt. Значит, возрастной состав популяции не изменяется во времени. Но это справедливо лишь для ограниченного периода времени, так как возрастная структура популяции будет приближаться к устойчивой лишь тогда, когда специфичные для каждой возрастной группы рождаемость и смертность остаются постоянными. Такого состояния популяция может достичь только при постоянстве условий среды, избытке необходимых ресурсов и отсутствии эволюционных процессов (изменений). Но в естественных условиях этого никогда не наблюдается. Как видно, при отсутствии реальных моделей математический подход становится все более отвлеченным. При исключении же математического подхода часто бывает трудно уловить общий смысл реальной модели. Вот почему в современной экологии реальные и знаковые модели используются параллельно, дополняя и обогащая друг друга. Первыми математическими моделями простейших экологических систем хищник — жертва и паразит — хозяин были теоретические разработки В. Вольтерры, сделанные в 1931 г. Они послужили толчком для построения более сложных моделей процессов пищевых отношений популяций в биоценозах. С появлением быстродействующих электронно-вычислительных машин возникли возможности моделирования еще более сложных саморегулирующихся систем с обратной связью — популяций, биоценозов и биогеоценозов. На основе математического моделирования успешно изучаются микробные популяции и популяции одноклеточных водорослей, выращиваемых в культиваторах, исследуются явления внутривидовой конкуренции и различные формы межвидовых взаимоотношений. Важное место занимает попытка математического моделирования в экологических исследованиях, направленных на использование ресурсов природы так, чтобы в ней осуществлялось естественное их самовоспроизводство. Для этого нужно не только знать сущность основных взаимодействий и процессов, протекающих в биогеоценозах, в биосфере в целом, но и с помощью математических методов прогнозировать их хотя бы на ближайшее будущее.
Экологическое прогнозирование и мониторинг
В современных условиях моделирование занимает основное место в работах по экологическому прогнозированию. Как отмечает А. А. Ляпунов, «задачи изучения математических моделей биогеценозов состоят в том, чтобы сопоставить кинетику явлений, подсказываемую моделью, с той, которая наблюдается в действительности, и, опираясь на это сопоставление, довести модель до достаточно хорошего согласия с действительностью. Тогда такие модели станет возможным использовать для практических прогнозов, а также для выбора рационального вмешательства человека в жизнь природы, с тем чтобы обеспечить такое использование природных ресурсов, при котором бы они должным образом самовоспроизводились». В основу математического моделирования при экологическом прогнозировании положен принцип представления сложной биологической системы в виде отдельных подсистем (блоков, модулей, камер), связанных между собой функциональными связями, имитирующими либо поток веществ (в том числе и загрязняющих), либо регулирующиеся воздействия, либо пространственные миграции, либо развитие организмов и т. д.
Например, в водной экосистеме выделяются как отдельные подсистемы: рыбы разного возраста, разные виды фитопланктона, зоопланктона, бентос, донные отложения, поступающие в водоем стоки и т. д. Кроме того, можно выделять и функциональные зависимости: плодовитость рыб в норме и при определенных воздействиях, например свинца или других веществ; плодовитость и продолжительность жизни фито- и зоопланктона, бентоса; зависимость от температуры среды выклевывания мальков из икры, времени нереста и т. д. При этом экологический прогноз с помощью математических моделей возможен только при наличии данных о «нулевой точке отсчета», т. е. о не нарушенной природой системе. В последние годы среди прогнозистов широко распространилось понятие «мониторинг», которое было предложено еще в 1920-х гг. по отношению к окружающей среде. Часто за мониторингом признается только наблюдение за состоянием окружающей среды. В более широком смысле в понятие «мониторинг» включают не только наблюдение, а также контроль и управление состоянием окружающей среды, т. е. то или иное целенаправленное воздействие на нее. Таким образом, мониторинг слагается из двух последовательных этапов: от наблюдения до контроля и управления. Ограничение мониторинга наблюдением придает ему лишь пассивное, информационное значение. Задачей современного мониторинга является прогноз. Программа фонового экологического мониторинга реализуется в биосферных заповедниках. Схема фонового мониторинга загрязнения природной среды и его экологических последствий четко подразделяется на геохимический, геофизический и биологический мониторинги. Цель биохимического и геофизического мониторингов — получение информации об уровне загрязнения окружающей среды, об интенсивности и характере воздействий загрязнения на биологические системы, а также прогнозирование уровней загрязнения биоты в будущем. Цель биологического мониторинга — оценка и прогноз реакции экосистем в ответ на фоновые воздействия загрязнителей. В его основу положены разработки математических моделей экосистем, которые могли бы служить инструментом прогнозов изменения состояния экосистем на фоновом глобальном уровне. Такие модели позволяют строить прогнозы о том, когда и под влиянием каких уровней воздействия загрязнителей исчезнут наиболее чувствительные к загрязнениям виды, установить очередность их исчезновения или существенного снижения численности популяций в той или иной экосистеме. Примером успешного применения математической модели для прогнозирования является разработанная В. В. Меншуткиным модель динамики численности лососевых рыб. Анализ модели на ЭВМ позволил выяснить и понять важнейшие закономерности жизнедеятельности камчатской нерки. На модели был проведен ряд экспериментов. В результате установили, что на нерестилищах нерки наблюдается повышенная смертность мальков, а в открытом море катастрофически возрос промысел лососей. Модель явилась официальным документом при составлении прогноза. Ограничения вылова лососей в открытом море позволили сохранить стадо этих ценных рыб. В настоящее время модели чаще всего используются для решения конкретных сегодняшних задач: применять или не применять пестициды, какую природную среду требуется контролировать в первую очередь, какие антропические нагрузки допустимы и т. д. Хотя все эти сегодняшние проблемы невозможно решать без обоснованного прогноза на далекую перспективу.
Лекция № 4
Получение количественной информации и группировка данных
Основные вопросы, рассматриваемые на лекции:
Статистические совокупности и количественные признаки.
Способы отбора объектов в выборку.
Способы получения количественной информации в географических исследованиях.
Сущность и виды группировок.
Графическая форма распределения величин.
1. Статистические совокупности и количественные признаки. Прежде чем приступить к математико-статистическим расчетам, географ должен иметь в своем распоряжении достаточный объем количественной информации, характеризующей объекты, процессы и явления на определенной территории или в определенном пункте.
Математическая статистика рассматривает множества единиц одного и того же вида, называемые статистическими совокупностями. В географических исследованиях ими могут быть ландшафты, географические зоны, единицы административно-территориального деления, населенные пункты, промышленные предприятия и др.
Отдельные единицы, входящие в состав статистической совокупности, называются ее элементами. Число всех элементов называют объемом совокупности.
Явления географической среды изучаются не только в пространстве, но и во времени, отсюда элементами статистической совокупности могут быть как территориальные единицы (ландшафты, административные районы, хозяйства), так и временные (года, сезоны, месяцы, дни и т.д.).
Элементы статистической совокупности отличаются друг от друга (варьируют) по количественным признакам, выраженным в числах. Одни и те же элементы статистической совокупности могут иметь не один, а множество количественных признаков, отражающих в цифровой форме те или иные свойства рассматриваемых явлений и показывающих различия между отдельными элементами статистической совокупности.
Так, внутренняя разнородность географических ландшафтов может выражаться через различия в глубинах залегания кристаллического фундамента, абсолютной высоты земной поверхности, через вариацию климатических показателей (температуры, давления, влажности и т.д.). Административные районы различаются не только по природным условиям, но и по ряду экономических показателей - урожайности зерновых, плотности скота, посевным площадям, затратам средств на ту или иную отрасль хозяйства и т.п. Города изучаемой территории могут отличаться по количеству населения, валовой продукции промышленности, по географическому положению (широте и долготе, удаленности от моря, абсолютной высоте) и другим показателям. К наиболее типичным для географии количественным признакам правомерно отнести показатели местоположения и размеров географических объектов - их географической широты, долготы, высоты, протяженности, площади.
При изучении динамики явлений в качестве количественных показателей временных единиц часто используют данные об урожайности по годам, климатические характеристики (например, суммы температур за вегетационный период, гидротермический коэффициент, количество осадков), скорости роста оврагов и др.
Последовательное перечисление количественных признаков элементов, отличающихся местоположением, называют пространственными рядами. Количественные признаки по годам, месяцам, дням, часам образуют ряды временные.
Таким образом, элементами статистической совокупности являются объекты, подлежащие изучению. Характерной чертой математической статистики является то, что она изучает статистические совокупности объектов, но не их отдельные элементы.
Процесс получения количественных показателей объектов и явлений часто называют статистическими наблюдениями.
Статистические совокупности подразделяются на генеральную и выборочную.
Генеральная совокупность (М) – это вся имеющаяся статистическая совокупность, объединенная какой-либо качественной общностью. В географических исследованиях наиболее распространена территориальная общность объектов и явлений, заключающаяся в их принадлежности к какому-то географическом) району. Так, например, все населенные пункты России (или только города), все регионы страны (области, края, районы) являются генеральными совокупностями. Объем генеральной совокупности в географических исследованиях может быть различным – от нескольких единиц до бесконечности. Если изучаемая территория невелика, то количество элементов часто оказывается небольшим. Например, число хозяйств в административном районе значительно меньше, чем в республике, или, тем более, в России. При изучении пространственных закономерностей климатических, морфометрических и ряда других явлений наблюдается изменение количественных показателей от места к месту, т.е. любая точка местности имеет определенное числовое значение (среднегодовую или среднемесячную температуру, абсолютную высоту над уровнем моря и другие характеристики). Каждая точка в этом случае представляет собой элемент статистической совокупности, а так как таких точек неограниченное количество, то генеральная совокупность будет бесконечной.
Довольно часто вся генеральная совокупность не изучается из-за недоступности многих объектов для наблюдений или же ввиду трудоемкости обработки слишком большого количества данных. Например, вряд ли можно найти количественные характеристики всех оврагов какой-либо зоны; обработать же данные о всех городах России (их около 2 тысяч) хотя и можно, но довольно трудно. При большом объеме статистического материала обычно используют выборочную совокупность (m), когда по определенной правильно выбранной генеральной совокупности, взятой на основе отбора, судят об этой совокупности в целом. По-видимому, о всех городах России можно судить достаточно правильно, если для исследований будет взята только часть их. Достаточно большой объем выборки и надлежащая организация наблюдений приводят к тому, что результаты выборочного изучения будут близки к результатам, получаемым при изучении генеральной совокупности.
Основное качество выборочной совокупности, заключающееся в способности заменить всю генеральную совокупность, называется репрезентативностью выборки.
2. Способы отбора объектов в выборку. Отбор объектов в выборку должен удовлетворять следующему обязательному правилу - каждая единица генеральной совокупности имеет одинаковую возможность быть отобранной. Такое требование исключает субъективизм, предвзятость в исследованиях. Например, для правильной объективной оценки урожайности зерновых в области не следует использовать данные только лучших хозяйств. Изучение лишь крупных оврагов может создать неправильное представление об овражной эрозии на исследуемой территории.
Наиболее часто встречаются следующие виды отбора:
2.1. Случайный повторный отбор, при котором объекты отбираются из генеральной совокупности и после изучения возвращаются в нее, так что любой объект может попасть в выборку повторно. Предположим, на изучаемой территории имеется 2000 хозяйств (М = 2000). Исследователь решил изучать эти хозяйства, выбрав из имеющейся генеральной совокупности лишь 30 (n = 30). Каждому хозяйству присваивается номер, который записывается в отдельную карточку. Все 2000 карточек тщательно перетасовывают. Выбирают наугад одну карточку и записывают номер хозяйства. Затем эту карточку возвращают в колоду, производят повторное перемешивание, после чего берут еще карточку. Таким образом, выбирают все 30 хозяйств, количественные признаки которых надлежит изучать.
2.2. Случайный бесповторный отбор, при котором элементы статистической совокупности отбираются как и в предыдущем случае, с той лишь разницей, что выбранная карточка в колоду не возвращается, так что каждый отобранный объект не может попасть в выборку повторно. Это более распространенный способ выборки по сравнению с первым.
2.3. Механический отбор заключается в том, что единицы, подлежащие изучению, берутся через определенный, заранее установленный интервал. Например, из всех оврагов изучаемой территории может быть выбран каждый пятый или десятый.
2.4. Серийный отбор (или гнездовой) производится путем деления генеральной совокупности на части (серии), после чего внутри отобранных серий (гнезд) производится сплошное наблюдение. Так, чтобы не изучать всю территорию, ее разбивают на равные площадки и по одному из вышеописанных способов выбирают для последующего сплошного обследования несколько площадок. Участки, типичные для изучаемого географического района, часто называют «ключами».
На практике различные способы отбора могут применяться в сочетании друг с другом. Географ-исследователь должен уметь выбрать наиболее подходящий способ в зависимости от конкретных условий.
Следует учесть, что часть никогда не может абсолютно точно охарактеризовать целое, поэтому характеристики генеральной совокупности будут отличаться от характеристик, полученных по выборочным данным. Точность во многом зависит от объема выборки (n), однако большое количество наблюдений соответственно увеличивает объем измерительных и вычислительных работ.
3. Способы получения количественной информации. Географы могут получать количественные характеристики предметов и явлений самыми различными способами. По месту рабочего цикла эти способы подразделяются на полевой, камеральный и лабораторный.
3.1. Полевой способ обеспечивает исследователя конкретными и свежими данными. Он подразделяется на экспедиционный, стационарный и дистанционный.
Объектом экспедиционных исследований являются главным образом те явления, которые заметно изменяются в пространстве и медленно во времени. К ним можно отнести рельеф земной поверхности, геологию, строение почвы, растительность и животный мир.
Гидротермические явления сильно изменяются во времени (по дням, месяцам, годам) и поэтому требуют стационарных наблюдений на метеостанциях, гидропостах и т.д. Физико-географические стационары очень нужны для изучения взаимодействия природных явлений друг с другом и влияния на них антропогенных воздействий.
Современные экспедиции и стационары используют различную измерительную технику: геодезические приборы, анероиды, горные компасы, буры, калориметры, лоты, вертушки, термометры, барометры и т.д. Все они дают в руки исследователя весьма ценный по разнообразию и объему количественный материал.
Прогресс человечества немыслим без получения новой информации, которая в большинстве своем заключается в измерениях. Недаром великий русский ученый Д.И. Менделеев назвал измерения воздухом науки.
Возникли проблемы повышения остроты восприятия измерительных приборов, быстроты и дешевизны измерений.
К полевому способу следует отнести дистанционные измерения -измерения «на расстоянии», без непосредственного контакта с самим объектом. Для этого используют различные воспринимающие устройства, способные представить данные о форме, размере, температуре и других физических и химических свойствах изучаемых объектов. Чаще применяют следующие приборы: гравиметры, магнитометры, аудиометры; приборы, использующие электромагнитные волны. Электромагнитные приборы подразделяются на два класса: 1) пассивные, измеряющие падающую и отраженную энергию источника (радиометры и др.); 2) активные, требующие искусственного облучения объектов исследования волнами особых длин (действующих по принципу радаров). Объекты исследуются облучением электромагнитных волн различных спектров. Инфракрасную тепловую радиацию можно воспринимать в двух окнах спектра днем и ночью, через дымку и туман.
В пределах длинноволнового электромагнитного спектра имеется несколько окон, свободных от атмосферных помех, где возбуждаемая радиация может быть обнаружена высокочувствительными приборами, применяемыми в радиоастрономии (изучаются процессы, происходящие в ледовом, снежном или почвенном покрове, получают данные о влажности почв, плотности посевов, температуре поверхностных вод, толщине льда).
Радарные установки воспринимают размеры и очертания объектов, их плотность, влажность и другие данные (днем, ночью, в непогоду).
Сфера приложения приборов дистанционного восприятия - изучение энергетических и водньк ресурсов, их морфологии, климата, растительности, почвенного покрова, расселения людей, транспорта, процессов урбанизации и т.д.
Важно уметь интерпретировать громадную информацию, получаемую с помощью этих приборов.
3.2. Камеральный способ получения данных предусматривает использование в кабинетных условиях картографических, аэро- и космических снимков, литературных, фондовых и архивных материалов,
Следует особо остановиться на роли географических карт в получении количественной информации. Ценность карты заключается в ее способности дать количественную характеристику предметов и явлений, распространенных на больших территориях. Изучением и разработкой методов измерений по картам занимается картометрия - один из важнейших разделов картографической науки. По топографическим картам можно получить достаточно точные данные о расстояниях, длинах, площадях, объемах форм земной поверхности, абсолютных и относительных высотах, крутизне склонов. В последнее время в круг своих интересов картометрия стала включать получение количественных характеристик и не топографического свойства. Поток ценной и разнообразной количественной информации значительно возрастает с использованием тематических карт, где объекты и явления изображаются значками, точечным способом, линиями движения, изолиниями, картограммами, картодиаграммами и другими способами. Например, по размеру значков можно определить количество жителей в населенных пунктах, объем капитальных вложений в строительство, по картам изолиний - климатические показатели в любом месте, картограмма дает возможность найти количественные показатели валового сбора зерна, картодиаграмма - численность врачей и число коек по отдельным административным единицам.
Замечательными источниками разнообразных сведений о Земле являются аэро- и космические снимки. По аэросъемочным материалам с помощью современной фотограмметрической техники географ-исследователь может получить объективные количественные данные о рельефе, растительности, почве. Сопоставление аэроснимков разных лет позволяет определить динамику явлений (например, изменение площадей, занятых лесами; рост оврагов).
В экономико-географических исследованиях незаменимым источником получения количественной информации является система государственной отчетности предприятий, акционерных обществ, районов, областей, республик. Эта система охватывает все области хозяйственной и культурной жизни государства.
3.3. Лабораторный способ получения количественных показателей весьма перспективен в географии. Воспроизведение природных процессов (например, инфильтрации, смыва и т.д.) в лабораторных условиях позволяет изолировать изучаемые показатели от второстепенных и случайных процессов, благодаря чему они познаются несравненно глубже. Например, на скорость роста оврагов влияют морфометрические характеристики водосборов, грунт, растительность и ряд других известных и неизвестных факторов, которые в природе сложно взаимосвязаны. Чтобы изучить зависимость овражной эрозии только от угла наклона площади водосбора, в лабораторных условиях на макете (лотке) можно искусственно повышать угол наклона с сохранением остальных факторов на одном количественном уровне. В полевых условиях было бы весьма трудно, а, вернее, невозможно найти овраги с равными условиями роста, кроме углов наклона площадей водосбора.
4. Сущность и вид группировок. Математико-статистическая обработка данных часто начинается с группировки, под которой понимают расчленение статистической совокупности на группы, однородные по какому-либо признаку. Для этого среди всей массы элементов статистической совокупности нужно выделить однородные группы, типы и только затем давать им обобщенные характеристики. Так, например, изучая динамику овражной эрозии, можно подразделить овраги по расположению в рельефе на донные, вершинные, склоновые. Затем уже ведется исследование по этим группам. Населенные пункты можно рассматривать не все сразу, а в отдельности - городские и сельские.
4.1. Разновидности группировок. В географии важную роль играет группировка по территориальному признаку. Например, те же овраги подразделяются (группируются) по принадлежности к физико-географи-ческим районам, природным зонам и т.д. Экономические итоговые сведения обычно даются по сетке административного деления.
Группировка по временному признаку предполагает расчленение временных рядов на интервалы: часы, дни, недели, месяцы, года, десятилетия.
Перед математико-статистическими расчетами часто используется группировка по количественному признаку. Разберем пример такой группировки. В таблице 1 даны длины (L) 25 оврагов в метрах.
Таблица 1 – Длины оврагов
n/n |
L(м) |
n/n |
L(м) |
n/n |
L(м) |
n/n |
L(м) |
n/n |
L(м) |
1 |
35 |
6 |
52 |
11 |
36 |
16 |
28 |
21 |
45 |
2 |
42 |
7 |
43 |
12 |
48 |
17 |
17 |
22 |
22 |
3 |
38 |
8 |
26 |
13 |
33 |
18 |
59 |
23 |
36 |
4 |
24 |
9 |
39 |
14 |
21 |
19 |
43 |
24 |
41 |
5 |
31 |
10 |
54 |
15 |
37 |
20 |
36 |
25 |
38 |
Находим по таблице 1 наибольшее и наименьшее значения изучаемого признака (Хmах и Хmin). Оказалось, что самая большая длина оврага – 59 м, самая малая – 17м. Этими двумя числами определяется промежуток вариации признака. Делим промежуток на равные интервалы, например, на 5. Подсчитываем число оврагов в каждом интервале. Эти числа называются частотами (см. табл. 2).
Таблица 2 – Интервальный ряд распределения
Интервалы длин оврагов |
Частоты |
10-20 |
1 |
20-30 |
5 |
30-40 |
10 |
40-50 |
6 |
50-60 |
3 |
Таблица, в которой перечислены интервалы признака и указаны частоты, называется интервальным рядом распределения.
Число интервалов группировки зависит от объема совокупности. Их не должно быть чрезмерно много, так как в каждом интервале тогда окажется слишком мало наблюдений для того, чтобы закономерность проявлялась отчетливо; с другой стороны, и слишком малое число интервалов нежелательно, так как теряются существенные особенности распределения. При числе наблюдений от 100 до 500 рекомендуют делить промежуток на 8-16 интервалов.
Можно рекомендовать вычисления длин интервалов (d) по Формуле Стерджесса,
На практике лучше руководствоваться таблицей 3.
Таблица 3 – Зависимость числа интервалов группировки (m) от объема совокупности (n)
-
n
m
n
m
25-40
5-6
100-200
8-12
40-60
6-8
200 - 500
10-15
60-100
7-10
Промежуток вариации признака иногда может делиться не на равные интервалы, особенно тогда, когда в некоторых промежутках малое количество наблюдений.
Группировка количественной информации облегчает дальнейший процесс математико-статистической обработки данных.
5. Графическая форма распределения величин. Наряду с табличной формой отображения распределения величин по группам в математической статистике используется более наглядная графическая форма (гистограмма, полигон распределения и кривая распределения).
Рассмотрим технику построения гистограммы. Строятся оси координат, По оси абсцисс откладываются границы интервалов, по оси ординат - соответствующие частоты. Высоты столбиков, опирающихся на масштаб интервалов, ограничиваются значениями частот. Полученная фигура называется гистограммой распределения. На рисунке 5.1 с помощью гистограммы показано распределение длин оврагов по данным таблицы 3.
Если из середины каждого интервала восстановим ординату до пересечения с частотой и вершины перпендикуляров соединим прямыми линиями, то получим полигон распределения (см. ломаную линию на рисунке 5.2).
Рис. 5.1 – Гистограмма распределения оврагов
Более точное представление о закономерности распределения статистического материала дает третий способ изображения интервальных рядов в виде плавной кривой, называемой кривой распределения. Построение кривых требует сложных математических расчетов. В географических исследованиях они часто проводятся на глаз плавной кривой по точкам вершин перпендикуляров.
Рис. 5.2 – Полигон и кривая распределения
Таким образом, кривая распределения является сглаженным полигоном (см. пунктирную кривую линию на рисунке 5.2), а полигон — сглаженной гистограммой.
Анализ графиков распределения (изучение их максимумов и минимумов, пологих и крутых участков) представляет большой интерес для исследователя.
Из рассмотрения гистограммы, полигона распределения и кривой распределения (рис. 5.1 и 5.2) можно заключить, что в изучаемом районе преобладают овраги длиной от 30 до 40 м. Коротких (до 20 м) и длинных (свыше 50 м) оврагов значительно меньше.
В экспериментальных исследованиях широко распространен сравнительный анализ кривых распределения. Географ часто сравнивает кривые, характеризующие одни и те же явления на
разных территориях. Например, сопоставляя кривые распределения длин оврагов в нескольких физико-географических районах, можно обнаружить, в каком районе овраги длиннее, в каком короче, сравнить максимальные и минимальные значения длин, найти различия в частоте оврагов одной и той же протяженности. Если кривые окажутся сходными, можно предполагать наличие примерно одинаковых условий овражной эрозии.
Выделим следующие виды распределений в конечном промежутке (а, б). 5.1. Нормальное(«колоколообразное») (рис. 5.3).
Рис. 5.3 – Нормальное распределение
Средние значения количественных признаков встречаются чаще, чем малые и большие. Такие распределения характерны для количественных показателей климата (температуры, осадков) по временным интервалам и для биологических особей (размеры зерен, рост человека, длина его ступни).
Кроме симметричных кривых распределения, существуют и асимметричные. В географических исследованиях более типичны показательное и равномерное распределения.
2. Показательное (рис. 5.4). Наибольшая частота соответствует наименьшему значению признака. С ростом х частота убывает. Примеры:
распределение длин оврагов, людности населенных пунктов и др.
3. Равномерное (рис. 5.5). Частота во всех интервалах примерно одинаковая. Следовательно, кривая здесь становится близкой к прямой.
ВОПРОСЫ И ЗАДАНИЯ
Дайте определение следующих терминов и понятий:
1. Статистическая совокупность;
2. Элементы и объем статистической совокупности;
3. Количественные признаки;
4. Пространственные и временные ряды;
5. Статистические наблюдения;
6. Генеральная и выборочная совокупности;
7. Репрезентативность выборки;
8. Случайный повторный отбор;
9. Случайный бесповторный отбор;
10. Механический отбор;
11. Серийный отбор;
12. Полевой способ получения количественной информации;
13. Дистанционные измерения;
14. Камеральный способ получения количественной информации;
15. Лабораторный способ получения количественной информации;
16. Группировка данных по территориальному признаку;
17. Группировка данных по временному признаку;
18. Группировка данных по количественному признаку;
19. Интервальный ряд распределения;
20. Гистограмма;
21. Полигон распределения:
22. Кривая распределения;
23. Нормальное распределение;
24. Показательное распределение;
25. Равномерное распределение;
Лекция № 5
