
- •В.Ю. Третьяков, в.П. Кулеш автоматизированная обработка экологической информации
- •Введение
- •Типовые задачи геоэкологических исследований
- •Проверка данных на однородность Параметры геосистем как случайные величины
- •Законы распределения случайных величин
- •Проверка выборки на соответствие нормальному распределению при помощи экспресс-метода
- •Построение гистограммы частотного распределения
- •Критерии согласия
- •Проверка соответствия распределения выборки нормальному закону по критерию Крамера-Мизеса-Смирнова(nω2)
- •Критерий хи-квадрат (Пирсона)
- •Критерий Колмогорова
- •Проверка соответствия распределения выборки нормальному закону по критерию Колмогорова
- •Построение совмещенной гистограммы распределений двух выборок
- •Параметрические критерии
- •Критерий Стьюдента
- •Проверка однородности двух групп данных по критерию Стьюдента
- •Критерий Фишера
- •Проверка однородности двух групп данных по критерию Фишера
- •Непараметрические критерии
- •Рангово-сумарный критерий Уилкоксона-Манна-Уитни
- •Проверка однородности двух групп данных по критерию Уилкоксона-Манна-Уитни
- •Ранговый критерий рассеяния Зигеля-Тьюки
- •Проверка однородности двух групп данных по критерию Зигеля-Тьюки
- •Интерполяция и фильтрация данных
- •Линейная интерполяция
- •Сплайновые интерполяции
- •Фильтрация и сглаживание
- •Запись данных в файл
- •Зависимость между параметрами
- •Расчет коэффициента парной корреляции
- •Регрессия
- •Заключение
- •Рекомендованная литература
- •Содержание
- •Автоматизированная обработка экологической информации
- •199061, С.-Петербург, Средний пр., 41.
Проверка однородности двух групп данных по критерию Стьюдента
Вначале импортируем в переменные v1 и v2 исходные данные из двух векторов, причем распределения этих наборов данных должны соответствовать нормальному закону:
v1
v2
Определение размеров выборок:
n1:=length(v1) n2:=length(v2) n1=51 n2=49
Определение оценок математических ожиданий выборок:
m1:=mean(n1) m2:=mean(n2) m1=0.067381 m2=0.067861
Определение средних квадратических отклонений выборок:
s1=0.011499 s2=0.011986
Дисперсии:
d1:=s12 d2:=s22 d1=0.0001322 d2=0.0001437
Определение числа степеней свободы:
:=n1+n2 = 98
Определение эмпирической оценки одинакового для обеих выборок среднего квадратического отклонения S:
S=0.0117399
Определение значения t-статистики:
t:=m1-m2*(n1*n2)/(n1-n2) / S t=0.204262
Задаётся двусторонний уровень значимости , равный 10%. Определяется теоретическое значение t-статистики T при принятом уровне значимости и вычисленном числе степеней свободы.
Нулевая гипотеза об однородности выборок отвергается, если модуль оценки t-статистики превышает теоретическое значение: |t| > T.
Применение критерия (теста):
test_answer: = ”gipoteza ob odnorodnosti oprovergaetsa” if |t| > T
”gipoteza ob odnorodnosti ne oprovergaetsa” otherwise
test_answer = ”gipoteza ob odnorodnosti ne oprovergaetsa”
При построении критерия предполагается, что анализируемые группы данных имеют одинаковую (хотя и неизвестную) дисперсию. Однако это отнюдь не очевидно, поэтому кроме критерия Стьюдента необходимо применять критерий Фишера, который проверяет близость дисперсий выборок. Действительно, при близких значениях оценок математических ожиданий двух групп данных (выборок) зачастую наблюдаются существенные различия в разбросе данных, т.е. дисперсиях. Например, одна величина среднегодовой температуры воздуха 5С ничего нам не говорит о температурных условиях и продолжительности вегетационного периода. Так, при данном значении среднегодовой температуры возможен и резко континентальный климат с суровой зимой и холодным летом, и океанический климат с незначительными годовыми колебаниями температуры воздуха. Естественно, совершенно различными будут и геосистемы, имеющие данную среднегодовую температуру.
F-распределение Фишера
Если Z и U независимые случайные СВ, обладающие распределением хи-квадрат с 1 и 2 степенями свободы, то СВ F=(Z/1)/(U/2) имеет распределение Фишера с 1 и 2 степенями свободы. Плотность вероятности этого распределения определяется равенством:
f(F ) = 11/2 22/2 [(1+2)/2]/[ [(1/2) [(2/2)] 1 = n1-1, 2 = n2-1
Распределение Фишера не зависит от дисперсии исходных выборок, а зависит только от числа степеней свободы. Это обстоятельство является очень важным, т.к. именно дисперсию и требуется установить в результате тех или иных действий. Отношение дисперсий двух выборок длиной m и n имеет распределение Фишера с числом степеней свободы 1 = m-1, 2 = n-1.