
- •В.Ю. Третьяков, в.П. Кулеш автоматизированная обработка экологической информации
- •Введение
- •Типовые задачи геоэкологических исследований
- •Проверка данных на однородность Параметры геосистем как случайные величины
- •Законы распределения случайных величин
- •Проверка выборки на соответствие нормальному распределению при помощи экспресс-метода
- •Построение гистограммы частотного распределения
- •Критерии согласия
- •Проверка соответствия распределения выборки нормальному закону по критерию Крамера-Мизеса-Смирнова(nω2)
- •Критерий хи-квадрат (Пирсона)
- •Критерий Колмогорова
- •Проверка соответствия распределения выборки нормальному закону по критерию Колмогорова
- •Построение совмещенной гистограммы распределений двух выборок
- •Параметрические критерии
- •Критерий Стьюдента
- •Проверка однородности двух групп данных по критерию Стьюдента
- •Критерий Фишера
- •Проверка однородности двух групп данных по критерию Фишера
- •Непараметрические критерии
- •Рангово-сумарный критерий Уилкоксона-Манна-Уитни
- •Проверка однородности двух групп данных по критерию Уилкоксона-Манна-Уитни
- •Ранговый критерий рассеяния Зигеля-Тьюки
- •Проверка однородности двух групп данных по критерию Зигеля-Тьюки
- •Интерполяция и фильтрация данных
- •Линейная интерполяция
- •Сплайновые интерполяции
- •Фильтрация и сглаживание
- •Запись данных в файл
- •Зависимость между параметрами
- •Расчет коэффициента парной корреляции
- •Регрессия
- •Заключение
- •Рекомендованная литература
- •Содержание
- •Автоматизированная обработка экологической информации
- •199061, С.-Петербург, Средний пр., 41.
Построение совмещенной гистограммы распределений двух выборок
Данная «программа» (рабочая область) во многом совпадает с рабочей областью построения гистограммы частотного распределения. Разница в следующем: подсчитывается общее количество элементов обоих выборок, число градаций и ширина градаций по оси X определяются для объединенной выборки:
Далее рабочая область не отличается от алгоритма построения одной гистограммы распределения непосредственно до определения параметров совмещенной гистограммы:
Две гистограммы имеют одинаковые интервалы градаций и размещаются на одном на одном графике:
Рис. 3. Совмещенная гистограмма частотного распределения
двух выборок
Параметрические критерии
Напоминаем, параметрические критерии можно применять только в том случае, если уже определены законы распределения выборок (сравниваемых групп данных). Критерии Стьюдента и Фишера – когда при помощи критериев согласия выяснено, что обе выборки имеют законы распределения, достаточно близкие нормальному закону.
Критерий Стьюдента
Необходимо подчеркнуть, что критерий и статистика часто имеют одинаковые названия, например критерий Стьюдента (t-критерий) базируется на использовании статистики Стьюдента. Если мы предполагаем верной гипотезу, что две совокупности данных принципиально не различаются между собой, т.е. принадлежат одной генеральной совокупности, то различия между оценками математических ожиданий двух групп экспериментальных данных и оценкой математического ожидания суммарной группы данных должны быть достаточно малы. Однако в качестве критерия применяется не величина различия между оценками математических ожиданий, а t-статистика, про которую заранее известно, что она подчиняется распределению Стьюдента. Если Z – нормированная нормально распределенная СВ, а U – независимая от Z СВ, подчиняющаяся распределению хи-квадрат с степенями свободы, тогда СВ
t = Z/U
подчиняется распределению Стьюдента (Госсета) с степенями свободы. Распределение Стьюдента называют также t-распределением. Плотность вероятности этого распределения определяется равенством:
f(t)=c()[1+t2/]-(+1)/2
где c() – параметр, зависящий от числа степеней свободы:
c() = [(+1)/2]/[ [(/2)]
Распределение Стьюдента симметрично. Математическое ожидание, дисперсия и среднее квадратическое отклонение равны:
mt = 0, при >1; Dt =2t = /(-2) при >2
При =1 распределение Стьюдента приводит к распределению Коши, дисперсия которого бесконечна. С увеличением числа степеней свободы распределение Стьюдента асимптотически приближается к нормальному с параметрами mt = 0 и t = 1.
Величина t=( x – mx)/(S/n) имеет распределение Стьюдента, где x и S –среднее арифметическое выборки и её СКО, n – число членов выборки.