Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
122
Добавлен:
28.04.2017
Размер:
5.83 Mб
Скачать

Форма обработки вариант в независимых совокупностях

20

3,4

11,56

17

1,8

3,24

17

0,4

0,16

16

0,8

0,64

16

–0,6

0,36

15

–0,2

0,04

15

–1,6

2,56

14

–1,2

1,44

15

–1,6

2,56

14

–1,2

1,44

∑ 83

0

17,20

76

0

∑ 6,80

= 16,6

= 15,2

Определяем разницу между средними: d = 16,6 – 15,2 = 1,4. Ошибки средних по каждой выборке равны:

= 0,93;

Ошибка разности средних составляет:

md ==

Полученные данные подставляем в формулу (1.19) и вычисляем tф= 1,4 / 1,2 = 1,17. Число степеней свободы ν =+2 = 5 + 5 – 2 = 8.

Сопоставляем табличные значения критерия Стьюдента 2.31 и 3,36 (см. приложение 4) при Р= 0,95 и 0,99 для степени свободы ν = 8 с фактическим (расчетным)tф = 1,17. Посколькуtт (2,31 и 3,36)> tф(1,17) при обоих уровнях значимости, то разность между средними признается недостоверной (несущественной). При выделении геоморфологических районов по глубине расчленения рельефа их объединяют.

Вариант второй. Сравниваемые независимые совокупности имеют различие по объему (N1N2). Порядок вычисления критерия Стьюдента такой же, как и при установлении достоверности в независимых выборках с одинаковым числом наблюдений. Различие состоит в вычислении по другой формуле ошибки разности средних:

md = . (1.20)

Вариант третий. Сравниваемые сопряженные совокупности имеют одинаковый объем выборки (N1 = N2). Ошибка разности средних определяется по формуле:

md = . (1.21)

Обозначения для формул (1.20) и (1.21): и– индивидуальные значе­ния вариант первой и второй выборок соответственно; и – сред­ние первой и второй выборочной совокупности соответственно; и – объем выборки первой и второй соответственно; di – разность меж­ду индивидуальными сопряженными вариантами в выборках; d – разность между средними сопряженных выборок.

Пример для сопряженных наблюдений.Сравним глубину расчленения рельефа в пределах конечно-моренного (х1) и донно-моренного (х2) ландшафта. Для обработки данных составляем исходную табл. 1.6.

Таблица 1.6

Форма обработки данных сопряженных наблюдений

di

di2

did

(did)2

20

17

3

9

+1,6

2,56

17

16

1

1

–0,4

0,16

16

15

1

1

–0,4

0,16

15

14

1

1

–0,4

0,16

15

14

1

1

0,4

0,16

∑83

∑76

∑7

∑13

∑0

∑3,20

= 16,6

= 15,2

d = 1,4

Число пар в выборках Nп = 5. Разность между средними арифметическими сопряженных выборокd= 16,6 – 15,2 = 1,4. Ошибку разницы средних рассчитываем по одной из формул:

md = (1.22)

md = (1.23)

Результаты расчетов по приведенным формулам не выявили расхождений. Критерий Стьюдента получим следующий: t= 1,4 / 0,40 = 3,5. Число степеней свободы ν =Nn– 2 = 5 – 2 = 3. Для ν = 3 приР0,95 и 0,99 табличное значение критерия Стьюдента 3,18 и 5,84 соответственно (см. прил. 4). Посколькуtф > tт приР0,95, то различие по глубине расчленения рельефа в сравниваемых ландшафтах признается существенным. Такие ландшафты образуют самостоятельные группы.

Если при проведении эксперимента не учитывать сопряженность и независимость выборок, то можно получить противоположный вывод.

При сравнении средних, полученных на основе большого объема наблюдений при соблюдении нормального распределения, определение достоверности и различий средних можно выполнить упрощенно:

(M1M2)2 / (m12 + m22) 9.

Различия средних арифметических можно считать статистически достоверными, если получена величина 9 и более, если меньше – недостоверными. Пример нахождения сходства и отличия выборок с помощью критерия Стьюдента в MS Excel приведен в прил. 10.

Наименьшая существенная разность (НСР). Используется в дисперсионном анализе. Она показывает то минимальное различие между средними, начиная с которого при выбранном уровне вероятности средние сравниваемые показатели существенно отличаются друг от друга. Величина критерия выражается в тех же единицах, что и сравниваемые средние выборочных совокупностей и определяется по формуле:

НСР = tтаблmd , (1.24)

где md – ошибка разницы средних; tтабл – табличное значение критерия Стьюдента при уровне вероятности 0,95 или 0,99 и степени свободы, определяемой экспериментом.

Если разность между сравниваемыми средними в условиях эксперимента больше или равна величине НСР при Р 0,95 или 0,99, то различие сущеcтвенно. Используя предыдущий пример по глубине расчленения рельефа, проверим достоверность разницы между средними арифметическими с использованием критерия НСР для случаев независимого и сопряженного наблюдений по формуле (1.24):

НСР0,95 = 2,31 ∙ 1,40 = 3,23 м; НСР0,99 = 3,36 ∙ 1,40 = 4,70 м (для независимых наблюдений);

НСР0,95 = 3,18 ∙ 0,40 = 1,27 м; НСР0,99 = 5,84 ∙ 0,40 = 2,33 м (для сопряженных наблюдений.

Разница между средними арифметическими глубины расчленения рельефа при независимых и сопряженных наблюдениях одна и та же (1,4 м). Сравнивая ее с величиной НСР, приходим к тем же выводам. что и при использовании критерия Стъюдента.

Критерий Фишера. В выборочных совокупностях дисперсии могут существенно отличаться друг от друга. В таких случаях установление различий между выборочными совокупностями проводится по критерию Фишера (F – положительное асимметричное распределение). Расчет производится по формуле:

F = σ2большая/ σ2меньшая (1.25)

Если величина расчетного критерия Фишера (Fф) не превышает величины приведенного в таблице (Fт) (прил. 5), то различие между сравниваемыми дисперсиями считается недостоверным. При Fф > Fт эти дисперсии достоверно различны, как и сравниваемые по ним генеральные совокупности. Степень свободы рассчитывается для сравниваемых выборок отдельно по формуле ν = N – 1.

Пример. Необходимо установить достоверность различия в содержании гумуса в дерново-подзолистой заболоченной суглинистой почве для северной (x1) и центральной (x2) провинций Беларуси. Объем выборочных совокупностей одинаков (N1, N2). В результате обработки данных получены следующие средние и дисперсии:= 3,53 %,= 0,0024 %;= 3,32 %,= 0,00032 %. Сравниваемые совокупности весьма сходны и можно констатировать отсутствие различия между ними. Однако пределы колебаний вариант в совокупностях существенно различны (более чем в 2 раза). В данном случае для сравнения следует использовать критерий Фишера. В результате вычислительных операций получены следующие результаты:Fф=/= 0,0024 / 0,00032 = 7,5. Степень свободы одинакова для первой и второй совокупности (5–1=4). ДляР0,95 и 0,99 табличное значение критерия Фишера 6,39 и 15,98 соответственно. ПосколькуFф > Fт, то различие в содержании гумуса по провинциям признается существенным приР0,95.

Критерий Пирсона (хи-квадрат, χ2). Для оценки соответствия или расхождения полученных эмпирических данных и теоретических (расчетных, прогнозных) распределений применяются статистические критерии согласия. Среди них наибольшее распространение получил непараметрический критерий К. Пирсона – хи-квадрат. Его можно использовать с различными формами распределения совокупностей. Как и любой другой статистический критерий, он не доказывает справедливость нулевой гипотезы, а лишь устанавливает с определенной вероятностью ее согласие или несогласие с экспериментальными данными. Критерий применяется при условии наличия не менее 5 наблюдений или частот в каждой группе, классе или совокупности. Малые частоты объединяют. Вычисление проводят по формуле:

χ2 = ∑ [(φ – φ΄)2 / ∑ φ΄], (1.26)

где φ, φ΄– наблюдения или частоты в опыте соответственно эмпирически или теоретически ожидаемые.

Значения χ2 могут быть только положительными и возрастать от нуля до бесконечности. Если вычисленный критерий хи-квадрат больше табличного (теоретического) значения, нулевая гипотеза, которая предполагает соответствие эмпирического и теоретического распределений, отвергается, при χ2выч < χ2табл нулевая гипотеза принимается.

Достоверность различий можно определить по правилу Романовского: нулевая гипотеза отвергается, если соблюдается неравенство:

D =2 – ν) / >3 (1.27)

Степень свободы при проверке гипотезы о нормальном распределении вычисляется по формуле ν = k – 3, где k – число классов. Различие между экспериментальными вариантами и теоретическими считаются достоверными, если D > 3.

Критерий Пирсона тем меньше, чем меньше различаются эмпирические и теоретические частоты. Он не позволяет обнаружить различия, которые скрадывает группировка (объединение малых частот в одну группу). Его удобно использовать, так как не требуется вычислений средних дисперсий.

Пример.Следует определить число сельских жителей с бронхолегочными заболеваниями, обострение болезни у которых связано с природными условиями местожительства. Для обработки выборочных вариантов составляем таблицу 1.7.

Таблица 1.7

Соседние файлы в папке Матметоды в географии