Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Смольянов. тексты лекция

.pdf
Скачиваний:
29
Добавлен:
15.03.2016
Размер:
1.22 Mб
Скачать

110

Отсюда: S = 12 + 64 +180 +196 +100 = 552.

5 Сумма квадратов всех вариант по всему комплексу (V )2 равна

(V)2 =22 +32 +12 +42 +32 +62 +32 +52 +62 +42 +62 +92 +92 +

+92 +72 +62 +62 +32 +62 +52 +62 =586.

Затем производится расчет дисперсий:

Д ф

= S

(∑ ∑ V )2

= 552 500 = 52 .

 

N

 

 

 

 

 

 

Д с

= (V )2

S = 586

552

= 34 .

Д о

= (V )2

(∑ ∑ V )2

= 586

500 = 86 .

 

 

 

 

N

 

 

 

На основании произведенных расчетов можно сформулировать ряд следствий:

1)До – общая дисперсия равна разности между суммой квадратов вариант всего комплекса и средним квадратом их суммы;

2)Дф – фактическая дисперсия равна разности между суммой средних квадратов вариант по градациям и средним квадратом суммы всех вариант комплекса;

3)Дс – случайная дисперсия равна разности между суммой квадратов всех вариант комплекса и суммой средних квадратов по градациям.

Вычисление показателей степеней и достоверности влияния изучаемого фактора. Сила влияния регулируемого фактора определяется по формуле

η2 =

Дф

=

52

= 0,605.

(11.5)

 

86

 

До

 

 

Величина η2 определяет долю общей дисперсии, которая приходится на фактическую дисперсию, т.е. долю влияния изучаемого фактора в общей сумме влияния всех факторов. Для рассматриваемого примера около 61 % всех воздействий на появление всходов семян лиственницы составило снегование. Это свидетельствует о целесообразности осуществления подобной предпосевной подготовки семян.

Цель проведения эксперимента состоит в том, чтобы распространить результаты опыта на генеральную совокупность. Это возможно, если показатель силы влияния является достоверным. В противном случае полученные резуль-

 

 

 

 

 

 

 

 

 

 

 

 

111

 

 

 

 

 

 

 

 

 

 

 

таты

(η2 =

0,61)

справедливы

лишь

 

для тех семян, с которыми проведен

эксперимент.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчет показателя достоверности начинают с вычисления факториальной

( δ ф2

) и случайной (δ с2

) варианс:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δф2 =

Дф

 

=

 

52

 

=13;

(11.6)

 

 

δc2

=

Д

с

=

34

 

= 2,27 , (11.7)

 

g 1

 

5 1

 

 

N

g

205

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где g – число градаций изучаемого фактора.

 

 

 

 

 

 

 

Достоверность силы влияния (F) равна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F =

δ

ф2

=

 

13

 

= 5,7 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δ

2

2,27

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

где F – эмпирический критерий достоверности силы влияния, который

должен сравниваться со стандартными значениями критерия Фишера ( Fst ) для различных порогов (уровней) вероятности (0,95; 0,99; 0,999).

Для оценки также необходимо знать число степеней свободы для отдельных варианс:

f1 = g 1 = 5 1 = 4;

f2 = N g = 20 5 = 15 .

На основании таблиц стандартных значений Фишера (прил. 9) по числу

степеней свободы устанавливается Fst . Для рассматриваемого примера оно

равно 3,1. Поскольку опытный критерий F = 5,7 превышает Fst = 3,1 для ве-

роятности 0,95, т.е. ( F > Fst ), можно считать, что влияние снегования, обнаруженное в выборочном комплексе, свойственно всем генеральным совокупностям. Следовательно, всем лесхозам, занимающимся выращиванием сеянцев лиственницы европейской, нужно рекомендовать перед посевом производить

снегование семян. Если F < Fst , то данная рекомендация справедлива лишь для обследованной партии семян.

В статистике всякий показатель определяется с ошибкой. Ошибка показа-

теля силы влияния mη определяется по формуле

 

mη

= ± (1 η 2 )

g 1

= ± (1 0,605 )

4

= ± 0,105 .

N g

 

 

 

15

 

Рис. 11.1 Зависимость всхожести семян лиственницы от продолжительности снегования.
Всхожесть, %

112

Зная ошибку показателя, можно установить доверительные границы

показателя силы влияния для генеральной (

η2

 

 

 

г ) совокупности:

 

 

η г2 = η 2 ± ;

(11 .8)

= mη

Fst

(11.9)

С вероятностью 0,95 доверительные границы генерального параметра

η2

г

равны: = 0,105 3,1 = ±0,326;

ηг2 = 0,605 ± 0,326;

0,28 < ηг2

< 0,93.

Следовательно, для всех случаев снегования семян лиственницы влияние его может составлять не менее 28 % от общей суммы факторов.

Определение оптимальной величины действующего фактора путем сравнения групповых средних (Мг). Сформулированные выше выводы охватывают весь дисперсионный комплекс. По ним не представляется возможным оценить, какая степень воздействия фактора из исследованных эффективна в наибольшей степени. Последнее может быть установлено через существенность различий между средними арифметическими величинами по градациям действующего фактора в дисперсионном комплексе. Для этих целей в эксперименте обычно предусматривают контрольные варианты, на которых действие изучаемого фактора не распространяется. Оценка существенности различий между результатами контроля и результатами, полученными при различной дозе фактора, позволяют установить наиболее эффективную силу изучаемого признака.

На рис. 11.1 отображена всхожесть семян (%) в зависимости от продолжительности их снегования. При этом увеличение всхожести с возрастанием продолжительности снегования четко не просматривается. Более определенно направление изменения всхожести отражают групповые средние (Мг), через которые проведена линия на графике: сначала заметно увеличение всхожести семян, а затем – снижение. Это обстоятельство свидетельст-

недели вует о наличии оптимума в изучаемом явлении. Дисперсионный анализ позволяет довольно точно установить этот оптимум.

113

Вспомним некоторые показатели исследуемого комплекса (табл. 11.2):

Градации фактора

контр.

2

4

6

8

 

 

нед.

нед.

нед.

нед.

Число повторностей (n)

3

4

5

4

4

 

 

 

 

 

 

Групповые средние (Мг)

2

4

6

7

5

 

 

 

 

 

 

Разность между средней по контролю

2

4

5

3

и групповыми средними (α)

 

 

 

 

 

 

 

 

 

 

 

Оценку разности между средними произведем с помощью критерия Стьюдента (t):

 

t

=

 

 

α

 

 

 

 

 

 

 

 

 

 

 

 

 

m

d

,

 

 

 

 

 

 

 

(11.10)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

d – разность между средними;

 

 

 

 

 

 

 

 

 

md – ошибка разности средних.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

+ n2

 

 

n1

+ n2

 

 

 

 

md =

n1

 

= δ c

 

 

 

 

δ c

 

 

 

 

 

 

 

 

,

(11.11)

 

 

 

 

n2

n1 n2

 

 

 

n1

 

 

 

 

 

 

 

где

δ с2 – случайная варианса;

 

 

 

 

 

 

 

 

n1 ,n2 – количество вариант в сравниваемых группах.

Вычислим ошибку разности средних контроля и двухнедельного снегова-

 

 

4 +3

 

 

 

 

 

2

 

 

ния семян: md =

=1,57

0,58 =1,15;

t12 =

=1,74. Сопоста-

2,27

 

 

 

 

 

 

4 3

1,15

вим фактическое значение критерия t со стандартными значениями Стьюдента. Число степеней свободы случайной вариансы нам известно:

f2 = N g = 20 5 = 15 .

Отсюда: t0,95 = 2,1; tф =1,47, т.е. tф < t0,95 . Следовательно, различие между сравниваемыми средними не существенно.

Теперь сопоставим среднюю всхожесть семян контроля и семян четырехнедельного снегования:

 

 

 

5 + 3

 

 

 

 

 

4

 

 

 

 

md =

2,27

= 1,51 0,53

= 1,1; t13

=

= 3,6 ; t

 

> t0,95 .

 

 

 

 

 

 

ф

5 3

1,1

 

 

 

 

 

 

 

 

 

 

 

Как видим, различие между средними величинами всхожести существен-

ное.

114

Также существенным оказалось и различие при сравнении данных контроля и шестинедельного снегования на самом высоком пороге вероятности

безошибочных прогнозов: tф = 4,34; tst = 4,1 для вероятности 0,999.

И, наконец, сравниваем результаты контроля и восьминедельного снего-

вания: m d =

2,27

 

4 + 3

 

= 1,15 ; t15

=

3

= 2,61 ; t

 

> t 0 ,95 .

 

 

 

 

 

ф

4 3

1,15

 

 

 

 

 

 

 

 

 

В этом случае различие существенно, но лишь с вероятностью 0,95. Таким образом, максимальный эффект наблюдается при продолжитель-

ности снегования в 6 недель. Снегование семян лиственницы менее 4 и более 8 недель нецелесообразно.

Вопросы для самопроверки:

1 Наблюдение и эксперимент.

2 Особенности применения эксперимента в лесном хозяйстве.

3 Действующие факторы и градации.

4 Результативные признаки и их классификация.

5 Дисперсионный комплекс и его построение.

6 Понятие о дисперсии, ее сущность.

7 Техника вспомогательных расчетов.

8 Факториальная дисперсия. Техника расчета.

9 Случайная дисперсия. Техника расчета.

10 Понятие о силе влияния.

11 Вариансы и степень свободы.

12 Достоверность силы влияния.

13 Определение групповых средних и оптимальной величины действующего фактора.

115

ЛЕКЦИЯ XII Планирование выборочных наблюдений

План лекции

1 Общие задачи планирования наблюдений.

2 Оценка ошибок выбора.

3 Точность и объем выборки.

1 Общие задачи планирования наблюдений

Вышеизложенные способы оценки параметров статистической совокупности по выборочным показателям применимы только в тех случаях, когда выборка является репрезентативной (представительной) для совокупности. Считается, что можно удачно заложить «типичные» пробы. Ошибочность таких суждений описана в литературе. Подбор проб по принципу типичности не состоятелен, когда ставят целью результаты опыта истолковывать с определенной точностью и уверенностью как средние для характеризуемой совокупности. Статистический анализ к такому материалу неприменим. Биологические совокупности, для которых требуется статистическая информация, как правило, очень неоднородны. По одному или даже нескольким типическим образцам надежно судить о них вообще нельзя. Несмотря на этот недостаток, способ типической выборки приходится нередко применять при оценке насаждений. Например, при глазомерной таксации средний диаметр деревьев древостоев определяют как среднюю величину из 3-4 средних по толщине деревьев. При детальном обследовании участка леса на зараженность вредителями приходится закладывать пробную площадь в средних (типичных) условиях. Иногда решают также и задачу оценки возобновления.

По неизбежности, как способ, требующий наименьшего объема наблюдений, он находит широкое применение при решении многих задач в лесном деле. Следует отметить, что информацию, пригодную для статистической оценки опыта с определенной точностью, этим способом получить невозможно. Можно вычислить среднюю величину признака на основе такого материала. Но ошибку этой средней вычислять не следует, так как она неправомерна, ибо случайная изменчивость признака (среднеквадратическое отклонение) в опыте не изменялась. В этом случае придется для оценки опыта ограничиться типической выборкой, т.е. только полученной средней величиной признака. Для статистического истолкования результатов опыта необходимо решить два вопроса:

116

1 Определить достаточное число наблюдений;

2 Правильно отобрать единицы для наблюдений.

При решении первого вопроса можно воспользоваться формулой

N =

c 2

t 2

 

 

 

 

,

(12.1)

P 2

 

где с – коэффициент варьирования;

t – критерий Стьюдента (ошибка опыта); Р – показатель точности опыта.

Таким образом, число наблюдений равно отклонению квадратов коэффициентов вариации и показателя точности. Анализ материалов по изучению многих лесоводственно-таксационных признаков дал возможность сделать некоторые обобщения и установить наиболее вероятные значения коэффициентов вариации, которые используются для расчета числа наблюдений. Заметим, что степень варьирования изменяется в зависимости от возраста леса, его структуры, условий местопроизрастания и ряда других факторов. Известно, например, что наибольшее варьирование высот деревьев отмечается в самом молодом возрасте, затем оно постепенно уменьшается и становится минимальным в глубокой старости, когда прирост по высоте совершенно прекращается. Варьирование таксационных признаков в разновозрастных и сложных насаждениях значительно выше, нежели в одновозрастных и простых.

Для иллюстрации приведем данные о степени варьирования некоторых таксационных признаков применительно к однородным средневозрастным насаждениям: диаметр деревьев – Сд = 20…25 %; высота деревьев – Сh = 8…13 %; объем стволов – СV = 30…40 %; процент текущего прироста по объему –

Сч =30..40 %; коэффициент формы – Сq = 5…8 %.

Как правило, N, рассчитанное вышеуказанным способом (формула 12.1), практически недостижимо, исследователь должен пойти на сужение объекта исследований или довольствоваться более низким уровнем точности опыта (Р=10%). Обычно применяют следующие способы отбора: простой случайный отбор, систематическая выборка.

Простой случайный отбор является наиболее распространенным статистическим методом. Его организуют с помощью какого-либо механизма, обеспечивающего равную возможность для любой единицы попасть в выборку, для чего используют таблицу случайных чисел. Чтобы воспользоваться таблицей всю совокупность следует разделить на единицы и последовательно пронуме-

117

ровать. Например, можно выбрать деревья для измерения высот или для исследования на выход из них сортиментов предварительно пронумерованной их совокупности. При исследовании численности или качественно состава возобновления на вырубке можно разбить сначала на клеточной бумаге всю ее площадь. Из них можно выбрать по таблице случайных чисел номера для учета.

Систематическая выборка полностью определяется выбором первого ее члена. Выбирают для обмера или наблюдения, допустим, каждый десятый член, например, 10, 20, 30-е и т.д. дерево по перечету или 10, 20, 30-й и т.д. ряд культур. Закладка учетных площадок через определенное расстояние друг от друга представляет собой также систематическую или механическую выборку. Преимущество такой выборки – легкость ее получения и равномерность распределения по всему объекту. Но если совокупность обладает изменчивостью, и если интервал между отбираемыми единицами совпадает с длиной волны этого изменения (или кратной ей), получим выборку со смещением (систематической ошибкой).

2 Оценка ошибок выбора

Результаты измерения содержат погрешности – ошибки измерения, которые возникают в частности вследствие того, что условия измерений не остаются постоянными в течение физического процесса измерения. Важным условием малой погрешности результата измерения любого параметра является учет максимального по возможности количество факторов, влияющих в ходе эксперимента на достоверность добываемой информации. За этим, собственно говоря, и скрыт субъективный фактор называемый обычно искусством экспериментатора.

Абсолютной погрешностью (ошибкой) измерения называется разность между результатом измерения и действительным значением измеряемой величины.

Относительной погрешностью (ошибкой) измерения называется отклонение (в том числе процентное) абсолютной ошибки к результату измерения.

Ошибки измерения можно классифицировать на пять групп:

1 Ошибки, вызванные объектом исследования – изменение объекта во времени (старение материала, увеличение возраста и т.п.), неоднородностью объекта в пространстве, влиянием процесса измерения на состояние объекта.

2 Ошибки оператора, связанные с уровнем его квалификации и психологическим состоянием.

118

3 Инструментальные ошибки, связанные с низкой точностью и погрешностями измерительных приборов.

4 Методические ошибки, связанные, с одной стороны, с неправильными или упрошенными представлениями о закономерностях проявления некоторого свойства, а с другой – со степенью разработки методики проведения измерительных операций.

5 Ошибки, обусловленные влиянием внешней среды (температура, загазованность и т.п.) на исследуемый объект и измерительную систему.

Качество исследования существенно определяется тем, насколько исследователю удается устранить воздействие вышеуказанных источников ошибок на результат измерения. Погрешность измерения можно условно разделить на две части: систематическую и случайную.

Грань между случайными и систематическими ошибками, вообще говоря, провести достаточно сложно, так как последние могут в соответствующих условиях рассматриваются как случайные величины. Способом включения систематических ошибок в число случайных является рандомизация.

Систематическими ошибками можно назвать такие ошибки, величина которых во всех измерениях производящихся одним и тем же прибором одинакова или изменяется по некоторому детерминированному закону в зависимости от источников возникновения ошибок. Знание закона позволяет устранить систематическую ошибку из результата измерений. Однако на практике и после такой процедуры результат измерения весьма часто может содержать остаточную систематическую ошибку.

Случайными ошибками можно назвать такие ошибки, величина которых во всех измерениях, проводящихся одним и тем же методом и с помощью одних и тех же измерителей, изменяется.

Необходимо различать понятия правильности и точности результатов измерения. Правильность измерения характеризуется систематической ошибкой, а точность – оценкой среднеквадратического отклонения σ , характеризующего случайную ошибку.

Формулы ошибки средней выборочной совокупности были приведены ранее (7.1, 7.3, 7.4). Для ограниченных по объему совокупностей, когда выборка включает более 5 единиц, в формулы ошибки вводится поправка на ограниченность совокупности. Эта поправка равна отклонению части совокупности,

N n

не включенной в выборку, ко всей совокупности, т.е. N .Так

119

как n = f – доля выборки, то не включенная доля равна 1f . Значение по-

N

правочного множителя (1f ) сводится к уменьшению дисперсии выборочного показателя на величину f .

3 Точность и объем выборки

Термин «точность» обычно связывают только с ошибками выборки. Ошибки, которые происходят от неправильной методологии, не являются ошибками выборки в полном смысле слова.

При подготовке плана выборочного наблюдения более удобно иметь дело с относительными показателями точности или с показателями относительных ошибок выборки.

Общее понятие об относительной вариации было дано выше. Оно применимо как к выборкам, так и к совокупностям и может быть расширено. Например, оно применимо в отношении распределения средних долей, коэффициентов корреляции и т.д. Символ С – относительный показатель варьирования, подписной значок при нем указывает варьирующую переменную и совокупность (выборочная – с чертой, генеральная – без значков и черты). Если показатели относительных ошибок относятся к выборочным распределениям, то С – представляет отношение стандартной ошибки выборки σ к оцениваемой величине, т.е.

С =

σ

 

 

 

 

 

 

М

,

 

 

 

(12.2)

 

 

 

 

 

 

ср

 

 

 

 

где Мср - выборочная средняя, принимаемая также за оценку средней

генеральной совокупности.

 

 

 

 

 

 

Для генеральной совокупности коэффициент вариации

С =

σ

, или в %

 

µ

 

 

 

 

 

 

С = σµ 100 % . Практически удобнее пользоваться средним квадратом ко-

эффициента или средним квадратом относительной ошибки дисперсии.

Для определения числа наблюдений в случае неограниченной генеральной совокупности (когда n < 0,05 N ) применяется формула (12.1).

Для случая ограниченной совокупности когда n > 0,05 N , применяется формула