Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Чернов книга Полный вариант книги Методика плю...doc
Скачиваний:
7
Добавлен:
01.05.2025
Размер:
33.02 Mб
Скачать

Сравнение статистик распределения

Установление статистической достоверности различий двух совокупностей является задачей, которую приходится решать при сравнении: 1) выборочной и генеральной совокупностей; 2) двух выборочных совокупностей. Пример сравнения выборочной и генеральной совокупностей (аппроксимация эмпирической кривой распределением Лапласа-Гаусса) приведен выше с использованием критерия 2.

В научных исследованиях часто возникает необходимости сравнения эмпирических выборок между собой, позволяющего получить как теоретические, так и практические результаты, пригодные для использования в производстве. В качестве примеров необходимости сравнения эмпирических выборок можно привести следующие:

Сравнение особенностей роста одновозрастных культур сосны (ели, лиственницы, кедра сибирского) в различных лесорастительных условиях;

Сравнение роста чистых одновозрастных культур сосны и ели, сосны и лиственницы, ели и лиственницы, сосны, ели и лиственницы в одних и тех же лесорастительных условиях;

Сравнение роста культивируемых древесных пород в смешанных лесных культурах.

Приведенные примеры дают представление о сути сравнения выборочных совокупностей. Можно сравнивать как отдельные статистика варьирования совокупностей, так и совокупности в целом.

Сравнение средних арифметических. Выше был приведен пример сравнения средних значений двух взвешенных выборок с одинаковым или незначительно различающимся числом наблюдений по формуле (67).

Если сравниваемые совокупности достаточно велики по объему и распределение их подчиняется закону Лапласа-Гаусса, различие средних можно вычислить по формуле:

Использование этой формулы позволяет избежать применения таблиц и извлечения корня. Если левая часть неравенства больше 9, значит различие средних статистически достоверно.

Сравнение средних значений выборок с попарно связанными вариантами производят с помощью парного критерия Стьюдента. Этот способ применяется, когда доказано наличие связи между сравниваемыми рядами, для чего используют показатель корреляции рангов Спирмена .

где t – парный критерий Стьюдента;

N – число пар выборки;

– различие вариант в каждой паре с учетом знака.

Если вычисленное значение t – критерия больше 2, различие между средними статистически достоверно.

Сравнение коэффициентов вариации производят по формуле неравенства:

где: коэффициенты вариации сравниваемых выборок;

ошибки коэффициентов вариации;

N – объем меньшей из сравниваемых выборок.

Если левая часть неравенства больше правой, различие коэффициентов вариации является статистически достоверным. При использовании этой формулы объем меньшей выборки должен быть не менее 5.

Сравнение показателей точности опытапроизводится по формуле неравенства:

где: P1 и P2 –показатели точности опыта сравниваемых выборок;

ошибки показателей точности опыта;

N – объем меньшей из сравниваемых выборок.

Показатели точности опыта различаются достоверно, если левая часть неравенства больше правой части.

Сравнение коэффициентов корреляции позволяет судить о том, относятся или нет выборки к одной генеральной совокупности. Пример: вычислены коэффициенты корреляции между диаметром ствола и высотой дерева в двух независимых друг от друга выборках. Коэффициенты корреляции (по:Зайцев Г.Н.Табл. 26 П.) переводятся в значения z1иz2. Оценка различия между этими значениями производится по t – критерию Стьюдента вычисляемому по формуле:

где: N1 и N2– численности выборок.

Число степеней свободы определяется по формуле: y = N1+N2 – 4. Табличное значение t – критерия при большом числе наблюдений равно 2. Если вычисленное значение t – критерия больше табличного (больше 2), то различие коэффициентов корреляции выборок является достоверным.

Сравнение выборочных срвокупностей. Для сравнения двух выборок, выборочной и генеральной совокупностей и отдельных статистик совокупностей используют различные критерии. Они подразделяются на параметрические ( 2 критерий Пирсона, F – критерий Фишера, критерий Стьюдента) и непараметрические (критерий лямбда Колмогорова-Смирнова, критерий медианы, критерий Колтогорова и др.). Для применения параметрических критериев необходимого вычислить среднюю арифметическую М, среднеквадратическое отклонение σ или ошибки параметров. Непараметрические критерии не требуют вычисления этих показателей, что упрощает процесс сравнения совокупностей и не требует применения специальных таблиц.

Наибольшее распространение получило применения критерия 2. Он применяется в целом ряде случаев, основными из которых являются:

  • оценка совпадения теоретических и эмпирических частот взвешенных рядов (пример расчета 2 приведен выше в табл. 48);

  • сравнение дисперсий выборочной и генеральной совокупностей;

  • сравнение двух взвешенных рядов одинакового объема;

  • сравнение двух взвешенных рядов разного объема;

  • сравнение нескольких совокупностей.

Критерий Колмогорова-Смирнова лямбда ( ) не требует применения таблиц и вычисляется по формуле:

где : λ – критерий различия лямбда;

где – накопленные частоты, а объемы выборок соответственно рядов x и y.

Парный критерий Вилкоксона (Уилкоксона) применяется для сравнения выборок с попарно сопряженными вариантами, учитывает знаки и величину разностей. Он позволяет, в отличие от критерия знаков, с большей точностью сравнить выборки с попарно сопряженными вариантами.

Критерий Колмогорова близок к критерию Колмогорова-Смирнова; отличается от него тем, что применяется для оценки только взвешенных рядов, как эмпирических с теоретическими, так и эмпирических между собой при больших объемах выборок величин непрерывного типа. Критерий Колмогорова более удобен, чем критерий 2 , так как позволяет обходиться без таблиц и учета степеней свободы. Пример расчета приведен втабл. 50.

В столбце 7 показывается разницы между частотами без указания знака. Из столбца 7 берется лишь одно значение максимального различия Критерий Колмогорова вычисляется по формуле:

где: k(λ) – критерий Колмогорова;

dmax – максимальное различие частот.

Таблица 50

Расчет критерия Колмогорова при сравнении эмпирических частот с теоретическими

Частоты

d

эмпирические n1

теоретические n2

накопленные эмпирические

накопленные теоретические

1

2

3

4

5

6

7

9

29

71

103

98

43

5

5

28

76

112

89

39

9

9

38

109

212

310

353

358

5

33

109

221

310

349

358

0,0251

0,1061

0,3045

0,5922

0,8659

0,9860

1,0000

0,0140

0,0922

0,3045

0,6173

0,8659

0,9749

1,000

0,0111

0,0139

0

0,0251

0

0,111

0

N = 358

358

Полученное значение критерия сравнивают с табличным (табл. 50). Критическое значение критерия Колмогорова на 5% уровне значимости составляет 1,36. Если вычисленное значение критерия Колмогорова меньше 1,36, значит совпадение эмпирического и теоретического рядов распределения удовлетворительное. В нашем примере: следовательно, выборка достаточно точно отражает генеральную совокупность.

Расчет для сравнения двух рядов распределения числа деревьев по диаметру 60-летних культур сосны, произрастающих в Учебно-опытном лесхозе, приведен в табл. 51. Находят максимальное различие и вычисляют значение критерия Колмогорова по формуле:

Таблица 51

Сравнение двух эмпирических рядов по критерию Колмогорова.

Ступень толщины

Фактические

частоты

Накопление частоты

Частости

Разности

частостей

(6) – (7)

x

y

nx

ny

nx/Nx

ny/Ny

1

2

3

4

5

6

7

8

12

16

20

24

28

32

36

9

29

71

103

98

43

5

55

55

70

67

42

12

3

9

38

109

212

310

353

358

55

110

180

247

289

301

304

0,025

0,081

0,198

0,288

0,274

0,120

0,014

0,181

0,181

0,230

0,220

0,138

0,039

0,010

0,156

0,100

0,032

0,068

0,136

0,081

0,004

358

304

различие между двумя выборочными совокупностями доказано. Оно, возможно, является следствием различия лесорастительных условий двух участков культур и условий формирования древостоев – первоначальной густоты культур и регулирования густоты рубками ухода за лесом в процессе роста культур.

Примечание: В выборке y оказалось на одну ступень толщины больше, чем в выборке x, а именно на 8-сантиметровую ступень. В расчете критерия Колмогорова частота 8-сантиметровой ступени, равная 8, включена в 12-сантиметровую ступень, частота которой была равна 47; в итоге слияния ступеней толщины частота 12-сантиметровой ступени равна 55.

Усреднение и нормирование взвешенных вариационных рядов

В практике исследований возникает необходимость усреднения вариационных рядов одного и того же изучаемого признака. Такая необходимость может возникнуть в случаях нахождения усредненных показателей варьирования в рядах распределения, полученных:

    1. в разные временные периоды (дня, года, нескольких лет);

    2. при изучении повторностей опыта;

    3. в разных экологических условиях (типах леса, типах лесорастительных условий);

    4. в различных географических условиях, и т.д.

Усреднение рядов распределения возможно и целесообразно при соблюдении некоторых требований:

    1. оно должно быть логически обоснованным, иметь научный смысл;

    2. ряды распределения должны иметь один и тот же классовый интервал.

Вначале из нескольких рядов распределения составляют обобщенный ряд, суммируя частоты по классам, после чего каждую частоту обобщенного ряда делят на число объединенных рядов, получая частоты усредненного ряда, и находят его статистические характеристики. В ряде случаев нахождение статистик усредненного ряда имеет более важное значение для научного обобщения в сравнении с изучением варьирования отдельных рядов распределения. Изучение обобщенного ряда также может иметь более весомое научное значение за счет получения более точных статистик распределения и его аппроксимакции при большем в несколько раз числе наблюдений.

Более сложной является процедура усреднения вариационных рядов, имеющих различные сетки классов как по оси X,так и по оси Y. Нормирование значений ряда Xпутем деления отклонений значений X от среднего значения М на стандартное отклонение σ по формулеt = (XM)/σ не всегда продуктивно, так как ряды по-прежнему остаются несравнимыми из-за различий их средних значений или границ классов. Чтобы привести частоты рядов к новой сетке классов, необходимо произвести полный перерасчет старой системы координат на новую по обеим осям XиY.