Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Смольянов. тексты лекция

.pdf
Скачиваний:
29
Добавлен:
15.03.2016
Размер:
1.22 Mб
Скачать

60

больше ошибка средней). Представление о точности опыта часто оказывается наиболее отчетливым на основе сопоставления величины ошибки средней величины со значением самой средней. Относительную ошибку опыта, выраженную в процентах, называют показателем точности опыта

Р =

m M

100 %

(7.2)

 

 

M

 

 

 

ср

 

Опыт считают достаточно точным при Р меньше 2%, удовлетворительным при Р не менее 5%. В некоторых опытах с сильна варьирующими признаками довольствуется и точностью более 5%. Показатель точности можно использовать для сравнения точности различных выборочных средних, в том числе выраженных в разных мерах. Другие выборочные характеристики (среднеквадратическое отклонение σ, коэффициент вариации С, показатель асимметрии А, показатель эксцесса i и др.) также содержат в себе ошибки, которые имеют тот же смысл, что и ошибка средней арифметической. Они представляют собой величину, на которую в среднем данный выборочный показатель отличается от соответствующего показателя генеральной совокупности. Для вычисления ошибок перечисленных показателей применяются формулы:

Ошибки основного отклонения:

σ

mσ = ± 2 (7.3)

N

Ошибки коэффициента варьирования:

mC = ±

 

C

 

(7.4)

 

 

 

2N

 

 

 

 

Ошибки меры крутости (эксцесса):

m = ±2 m

(7.5)

 

mE = ±

 

24

(7.6)

и

 

 

E

K

 

 

N

 

 

 

 

 

 

 

Ошибки меры косости (асимметрии):

6

m a = ± (7.7)

N

Основная ошибка частоты:

m n

= ±

 

n ( N n)

 

(7.8.)

N

 

 

 

 

 

где n – частота конкретного класса; N – сумма частот.

61

Во избежание неоправданного усложнения вычислительных работ необходимо соблюдать определенную точность получения отдельных статистических показателей. Среднее значение признака необходимо вычислять до такой точности, с которой зафиксированы значения вариант в исходных данных. Например, диаметры деревьев – с точностью до 0,1 см; высоты деревьев – 0,1 м; вес желудей – 0,1 г; длина листьев – 0,1 см; высота сеянцев – 1 см, и т.д. Аналогичная точность требуется при вычислениях Мо и Ме. Значения σ и mМ записываются с точностью, превышающей точность вычисления М в 10 раз. Показатель точности опыта, как правило, отражается с точностью до целого числа; в редких случаях (при tМ < 3) – с точностью до 0,1. Показатели, значение которых выражается в процентах, достаточно фиксировать с точность до 0,1% при РМ < 10% и до 1% - при РМ > 10%.

Оценка разности между средними значениями. В практике часто приходится сравнивать между собой средние арифметические величины и делать заключения о том, достоверны ли разница между ними или она есть результат случайного состава частичных совокупностей. Поскольку каждая из средних величин определяется с ошибкой М1 ± mМ1 и М2 ± mМ2, то разумеется и разность между ними (М1 - М2) будет содержать некоторую ошибку. Ошибка разности равна корню квадратному из суммы квадратов ошибок уменьшаемого и вычитаемого:

m

M

=

m2

+m2

(7.9)

M

 

1

2

1

2

 

 

 

 

Отношение фактической разности средних величин к своей ошибке называется показателем достоверности (существенности) различия:

t =

M 1

M 2

 

(7.10)

 

 

 

 

 

m12

+ m 22

 

 

 

 

Если t >2,6 различие между средними величинами признается существенным (достоверным) с вероятностью 0,99, если t >2,0, то различие достоверно с вероятностью 0,95. Если t <2,0, имеющиеся различия следует считать случайными, неубедительными.

4 Критерий Стьюдента, испытание статистических гипотез

Чтобы иметь определенный уровень доверия к выборочной средней как к оценке генеральной средней величины необходимо иметь соответствующий критерий, показывающий как изменяется значение σ для выборок разного размера. Такие критерии были созданы английскими учеными: в 1908 г. В.С. Гос-

62

сетом (псевдоним Стьюдент) и в 1925 г. – Р. Фишером. Производя случайные выборки из одной и той же совокупности, они получили распределение отклонений выборочных средних от генеральной средней, которые явились исключительно следствием случайных причин. Эти отклонения были выражены Стьюдентом в единицах стандартного отклонения выборки и выражаются формулой:

t =

M

 

(7.11)

 

 

m M

В приложении 3 приведены критические значения t соответствующие различному числу степеней свободы и наиболее употребляемым (стандартным) уровням вероятности Р = 0,95; Р = 0,99; Р = 0,999 безошибочного заключения.

Если найденное в опыте tфак. превзойдет по величине табличное значение для данного уровня вероятности, его нельзя уже объяснить случайными признаками. Как отмечалось ранее, одной из главных задач статистического анализа является заключение о величине показателей в генеральной совокупности на основе выборочных показателей. В ряде случаев ограничиваются нахождением выборочных показателей и принимают их за оценки параметров. Хотя эти оценки являются лучшими характеристиками для параметров, однако они подвержены случайному варьированию, а следовательно, не могут быть абсолютно точными. Поэтому в большинстве случаев статистический анализ принимает форму установления пределов, внутри которых как ожидается с некоторой мерой надежности заключено значение параметра. Эту форму анализа называют

установлением интервала оценки или интервальной оценкой параметра. Построение интервальной оценки производят на основе выборочного ста-

тистического показателя и критерия t, принимая для последнего определенный стандартный уровень значимости. Уровнем значимости критерия называют разницу между единицей и принимаемой вероятностью безошибочного значения. Иначе: уровень значимости характеризует относительное число ошибочных заключений в общем числе заключений. Если, например, для средней в генеральной совокупности указать интервал µ ± t0,05 · mМ, то с вероятностью 0,95 можно утверждать, что этот интервал покроет генеральную совокупность.

Интервал M t mM ≤ ≤ M + t mb называют доверительным интервалом. Степень доверия зависит от уровня значимости t (5;1%-ый и т.д.), который указывается в индексе при t в виде t0,05 , t0,01 и т.д.

63

Рассматриваемый метод интервальной оценки на примере средней арифметической применим ко всем статистическим показателям σ, С, А, Е генеральной совокупности.

При малых выборках взятых из совокупностей с ненормальным распределением, t-критерий и интервальная оценка не эффективны.

Испытание статистических гипотез. В биологических исследованиях наиболее распространенной формой статистических заключений является испытание некоторой статистической гипотезы (предположения) о свойствах параметра, которое имеет гипотетическое значение. Во многих опытах целесообразно оценить параметр путем проверки статистической гипотезы в отношении его размера. Наиболее часто проверяется предположение, что полученная выборочная величина незначительно отличается от гипотетической (теоретически предполагаемой) или установленной величины в генеральной совокупности. Выдвигается гипотеза НО, что истинная разность равна нулю. В таком виде гипотеза часто называется нулевой. Ее проверка состоит в выяснении совместимости наблюденных данных с этой гипотезой. Поменяют критерий, который при оценке значимости различия средних имеет выражение:

t =

M

 

(7.12)

 

 

mM

Формула может быть обобщена в том отношении, что она применима для оценки значимости любого статистического показателя Т, к которому нулевая гипотеза разумна. Критерий t обычно называют критерием значимости или существенности. При фактически полученном в опыте значении t < ti (где: ti – критическое значение этого критерия, взятое из таблиц для уровня значимости 5 или 1%) опытные данные совместимы с гипотезой, т.е. НО подтверждается. Полученное значение выборочного показателя в таком случае незначимо отклоняется от нуля, т.е. является незначимым или несущественным. Если полученное экспериментальное значение t > t0,05 или t0,01, данные опыта считаются не совместимыми с гипотезой НО, т.е. нулевая гипотеза отвергается.

Вопросы для самопроверки:

1 Ошибки выборочных статистических показателей. Понятие репрезентативности.

2 Точность опыта. Способы оценки.

64

3 Оценка разности между средними значениями. Достоверность различий.

4 Понятие о критерии Стьюдента. Практическое использование.

5 Таблица стандартных значений критерия Стьюдента.

6 Испытание статистических гипотез. Нулевая гипотеза.

Лекция VIII

Оценка согласия между эмпирическим и теоретическим распределением. Критерии λ и Р(χ)2. Непараметрические методы оценки

План лекции

1 Оценка согласия между теоретическим и практическим распределения-

ми.

2 Критерии согласия λ (лямбда) и Пирсона Р(χ)2. 3 Непараметрические методы оценки.

1 Оценка согласия между теоретическим и практическим распределениями

Рассмотренным выше моделям теоретических распределений (нормальное, биномиальное, Пуассона) соответствуют многие фактические распределения, встречающиеся на практике. В теории статистической оценки эти теоретические модели являются основополагающими. Большая часть статистических критериев оценки параметров применима для распределения нормального или несильно от него отклоняющихся. При распределениях сильно отклоняющихся от нормального применимы непараметрические критерии. Поэтому окончательному заключению о структуре распределения в целом и о его параметрах должно предшествовать решение о соответствии экспериментального распределения определенной теоретической модели. Оценка модели распределения необходима также и для последующего статистического анализа экспериментального распределения, завершающегося, как правило, выравниванием опытных данных. Дело в том, что численность любого экспериментального выборочного распределения есть случайные величины. Любая другая выборка того же размера, взятая из той же генеральной совокупности, никогда не обнаружит полного сходства в распределении численностей по классам. Наиболее вероятные численности точнее отражающие структуру распределения в генеральной

65

совокупности находят, пользуясь соответствующим уравнением, являющимся математической моделью этого распределения. Найденные теоретические численности или частости являются наиболее эффективными оценками вероятных численностей в генеральной, если последние были приведены к тому же масштабу. По вычислении теоретических частот оценивают степень расхождения их с частотами практическими. При этом используют соответствующие статистические критерии согласия. В качестве критерия согласия используют критерий χ2, предложенный К. Пирсоном, а также критерий λ (лямбда), предложенный А.Н. Колмогоровым.

Сущность оценки согласия между экспериментальным и теоретическим распределением состоит в проверки гипотезы о том, что распределения эти согласуются, а расхождения являются незначительными, вызванные действием случайных факторов. Если в качестве распределения теоретической модели принято нормальное, статистическая гипотеза состоит в утверждении, что выборочное распределение подтверждается его закономерностями. Альтернативное предположение состоит в том, что положенное в основу выравнивания опытных данных модель не соответствует экспериментальному распределению. Проверку гипотезы производят сравнением частот эмпирического и теоретического распределений по одному из критериев χ2 или λ.

2 Критерии согласия λ (лямбда) и Пирсона Р(χ)2

При сравнении эмпирического распределения с теоретическим, т.е. при одинаковом числе классов и одинаковой общей численности сравниваемых групп, критерий λ определяется по формуле:

λ =

 

D

 

,

(8.1)

 

 

 

 

 

 

N

 

где D – максимальная разность (без учета знака) между накопленными частотами в эмпирическом и теоретическом распределениях в пределах одного и того же класса;

N – общее число наблюдений в эмпирическом ряду распределения. Если значение λ не превзойдет критических его значений (1,36; 1,63 и

1,95), соответствующих стандартным степеням вероятности достоверного различия Р1 = 0,95; Р2 = 0,99 и Р3 = 0,999, то расхождения между теоретическими и экспериментальными частотами незначительны. Они могут быть объяснены

случайным составом данной выборки. При получении n (теоретических частот) вышеуказанных критических значений подтверждается альтернативная

66

гипотеза о несоответствии проверяемой модели структуре эмпирического выборочного распределения. Рассмотрим на примере, помещенном в табл. 8.1.

Найденное значение λ = 0,44 не достигает даже первого порога λкрит. равного 1,36. На основе прил. 3 можно утверждать что λ = 0,44 встречается вследствие случайных причин с вероятностью Р = 0,99.

Различие между теоретическим и эмпирическим распределением случай-

но.

Таблица 8.1 Вычисление критерия λ для выборки диаметров стволов сосны

 

 

Частоты

 

Накопленные

 

 

 

 

 

 

Диаметры,

 

 

частоты

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n - n

см

 

 

 

 

 

 

 

 

 

 

 

 

эксперимен-

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

вычисленные, n

 

 

 

 

 

 

 

 

 

 

 

 

 

тальные, n

 

 

 

 

12

0

 

0,3

 

 

0

 

0,3

 

0,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

4

 

1,7

 

 

4

 

2,0

 

2,0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

7

 

6,3

 

 

11

 

8,3

 

2,7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

8

 

15,0

 

 

19

 

23,3

 

4,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

28

28

 

23,2

 

 

47

 

46,5

 

0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

32

20

 

23,4

 

 

67

 

69,9

 

2,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36

18

 

15,4

 

 

85

 

85,3

 

0,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

40

9

 

6,6

 

 

94

 

91,4

 

2,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

44

0

 

1,8

 

 

94

 

93,7

 

0,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

48

0

 

0,3

 

 

94

 

94,0

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ИТОГО

94

 

94

 

 

 

λ = 4,3

 

 

 

 

 

 

 

 

 

 

94 = 0,44

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сравниваемые ряды обнаруживают достаточное согласие. Распределение сосны по классам диаметров следует считать соответствующим модели нормального распределения.

Критерий согласия Пирсона χ2 (хи-квадрат) применяется для решения ряда задач статистического анализа в частности при проверке гипотез:

а) о независимости двух принципов положенных в основу группировки результатов наблюдений из одной совокупности;

б) об однородности групп в отношении некоторых определяемых характеристик;

в) о согласии теоретической и экспериментальной кривых численностей. Соответственно задаче и методу определения χ2 называют критерием независимости, критерием однородности и критерием согласия. Его находят из

следующего выражения:

 

 

 

(n

 

 

)2

 

67

 

 

 

 

 

 

 

χ

2

=

n

,

(8.2)

 

 

 

 

 

 

 

n

 

 

 

 

 

где n – частоты экспериментальные;

n – частоты теоретические.

При расчетах критерия χ2 численность классов не должны быть менее 5. Для этого крайние классы объединяют одновременно для практических и теоретических частот.

Полученное χ2 сравнивают с критическим χ 02,05 или χ 02,01 (приложение 8), принимая число степеней свободы, равным числу классов без 3, т.к. в процессе вычисления теоретической кривой использовали N, Мср, σ, потеряв, таким образом, три степени свободы. Если найденное значение Р(χ)2 из приложения больше уровня значимости 0,05, что соответствует вероятности 0,95, то расхождение между распределениями несущественно. Они могли быть следствием случайных причин. Нулевая гипотеза не отвергается.

3 Непараметрические методы оценки

Изложенные выше методы оценки параметров основаны на предположении о нормальном или несильно уклоняющимся от нормального распределения единиц генеральной совокупности. Когда распределение сильно отклоняется от нормального, а выборки малы по объему, сделанные на основе параметрических методов критериев оценки могут быть неточными. В последнее время все больше для таких ситуаций находят непараметрические методы и критерии, которые не требуют знания параметров выборки – средней, дисперсии. Эти методы применимы для оценки свойств объектов, основанные не только на количественных, но и на качественных измерениях.

Оценка двух выборок при качественных признаках. Если применить количественную шкалу для оценки свойств того или иного явления невозможно, применяют оценки качественные. Можно, например, расположить отдельные единицы в ранжированный ряд от худших к лучшим по форме, вкусу, запаху или другим свойствам. Если подобного рода ранжирования ряда объектов или вариантов эксперимента будут проведены при помощи случайной выборки из числа экспертов, то можно сделать определенные выводы о ранжированном ряде в генеральной совокупности. Предположим шесть случайных экспертов оценивают лекции, сделанные двумя лекторами. В основу оценки положен учет ряда не измеряемых количественных факторов: содержание, форма, его подача,

68

культура речи и т.д. Предположим, независимые оценки с подразделением их на два ранга (1 – лучшие, 2 – худшие) были такие: первый лектор получил пять оценок 1-го ранга и одну 2-го, второй – наоборот. Нулевая гипотеза состоит в том, что нет значимого различия в качественной оценки лекций. Для оценки используют критерий χ2 (хи-квадрат), формула для которого при малых выборках имеет вид:

χ 2 =

(n

n

2

1)2

 

1

 

 

,

(8.3)

 

N

 

 

 

 

 

 

где n1 – число однородных оценок; n2 – число неоднородных оценок.

Для рассматриваемого примера имеем: χ 2 = (5 11)2 = 1,5. 6

Число степеней при двух группах оценок равно 1. По таблице Пирсона χ2

(хи-квадрат) находим χ02,05 = 3,8. Нулевая гипотеза на уровне значимости 5% (т.е. при вероятности безошибочного заключения Р = 0,95) не отвергается. Она отвергается с вероятностью 0,90, которую в подобных случаях можно было бы считать достаточной, если повторение эксперимента было бы затруднительным.

Вопросы для самопроверки:

1 Критерий согласия Колмогорова. Практическое использование.

2 Критерий согласия Пирсона. Практическое использование.

3 Оценка количественных признаков.

4 Использование непараметрических методов оценки при оценки качественных признаков.

69

ЛЕКЦИЯ IX

Измерение корреляции между признаками

План лекции

1 Общие понятия о корреляции.

2 Вычисление показателей тесноты связи и их оценка при большой выборке. Коэффициент корреляции и корреляционные отношения.

3 Статистический анализ корреляции. Оценка показателей связи при малых выборках.

1 Общие понятия о корреляции

В природе все явления взаимосвязаны. Некоторые из них находятся в определенной зависимости, другие изменяются в определенном направлении под влиянием общих условий. Так, производительность древостоев зависит от плодородия почв, а диаметры и высоты деревьев взаимосвязано изменяются под влиянием некоторых общих факторов. Такого рода зависимости называются корреляционными связями. Различают связи функциональную и корреляционную. Функциональной называют такую связь между величинами, при которой каждому значению одной независимой переменной аргумента соответствует одно определенное значение зависимой переменной функции. Такие связи наблюдаются в физике, математике. В природе же явления развиваются под воздействием различных факторов внешней среды. Поэтому связь между признаками проявляется в виде корреляционной связи или корреляции. Каждому значению одного признака здесь соответствует не одно, а несколько значений другого признака, т.е. его распределение. Один из признаков (обычно легче или точнее измеряемый) принимают за функциональный, а другой – за результативный. Иногда в условном значении один называют независимым, а другой зависимым. Статистическое исследование корреляции сводится к установлению факта связи, определению ее формы, направленности и тесноты. Установление факта связи производят сначала на основе биологического анализа явления. Например, можно сказать о наличии корреляции между размерами диаметра (толщины) и высоты деревьев в древостое еще до ее измерения.

Корреляцию называют простой, если она измеряется на основе двух признаков или множественной, если изменение результативного признака измеряют в связи с влиянием или изменением нескольких факториальных признаков.