Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие по АОЭИ Третьяков Кулеш.doc
Скачиваний:
5
Добавлен:
01.04.2025
Размер:
748.54 Кб
Скачать

Проверка выборки на соответствие нормальному распределению при помощи экспресс-метода

Импорт данных в вектор:

vector

Подсчёт математического ожидания m:

Подсчёт числа членов выборки (вектора) n

Расчёт среднего квадратического отклонения s

Расчет коэффициента вариации Cv

Расчет коэффициента асимметрии Cs

Ответ является результатом логической операции. К сожалению, строковые переменные, составленные из символов кириллицы, зачастую отображаются неадекватно. Поэтому можно либо писать по-русски латиницей, как это сделано в данной программе, либо писать по-английски.

Замечательным свойством рабочей области пакета Mathcad является её универсальность. Когда нужно обработать другие данные, достаточно лишь изменить оператор, отвечающий за импорт данных. Для этого необходимо подвести курсор «мыши» в пределы данного оператора и нажать на правую кнопку манипулятора. Появится диалоговое меню, в котором следует выбрать опцию «Выбор файла». Затем, соответственно, выбрать необходимый новый файл с данными. Более не надо производить никаких действий. Все расчеты в рабочей области будут выполнены автоматически.

Однако экспресс-метод может нас «подвести», если распределе­ние значений выборки не является одномодальным. Поэтому совершенно обязательным элементом анализа данных служит построе­ние гистограммы распределения. При этом область значений подразде­ляется на несколько равных интервалов и для каждого подсчитывается частота, т.е. отношение количества значений в данном интервале на общее количество значений выборки. Если оказывается, что распреде­ление многомодальное, т.е. в разных частях гистограммы имеется как минимум два (возможно, и более) «высоких» столбиков, соответст­вующих интервалам с высокими значениями частот, а между этими «высокими» столбиками располагаются «низкие» столбики (низкие значения частот), то выборка явно неоднородна. Следует попытаться разбить её на отдельные однородные части. Существенным подспорьем для этого служат базы данных и геоинформационные системы. С их помощью следует проанализировать пространственно-временную не­однородность выборки. Возможно, окажется, что группировки значе­ний относятся к различным временным периодам или пространствен­ным местоположениям. Например, это могут быть различные ланд­шафтные, биогеографические или почвенные таксоны, разные почвен­ные горизонты. В водных экосистемах следует привлечь данные о вер­тикальной стратификации и водных массах. Может оказаться, что одна группировка значений относится к эпилимниону, а другая – к гиполим­ниону. Другой вариант, если речь идет о крупном озере или морской акватории – группы значений пространственно разделены термическим баром, существующим в периоды прогрева (весна – первая половина лета) и охлаждения (осень) водного объекта. Вариант – различные вод­ные массы. Для их выявления придётся привлекать TS-анализ. На дан­ном этапе анализа требуются комплексные знания специалиста-эколога. Возможно, выявленные одномодальные группировки значений будут характеризоваться нормальным распределением.

Однако тот факт, что распределение одномодально, ещё не гаран­тирует нормальности распределения. Последнее симметрично, поэтому сдвиг моды (самого высокого столбика) распределения к краю гистограммы говорит об асимметричности распределения и, соответст­венно, о том, что закон распределения выборки существенно отлича­ется от нормального. Чаще всего при исследованиях содержания ве­ществ в окружающей среде мы сталкиваемся со сдвигом влево: наибо­лее часто встречаются низкие концентрации. Это происходит в том случае, когда большинство значений в выборке соответствуют фоно­вым природным значениям, но есть несколько «выбросов», высоких значений, определяемых антропогенным воздействием. В данном слу­чае также «на выручку» приходит пространственный анализ. Разбив с его помощью выборку на «природную» и «антропогенную» части, мы можем в результате получить выборки, подчиняющиеся нормальному закону распределения.