- •Теоретический материал по курсу «методы оценки биоразнообразия» Статистические совокупности
- •Средние величины
- •Показатели разнообразия
- •Нормированное отклонение
- •Распределение признака
- •Ошибки репрезентативности
- •Ошибка средней арифметической
- •Ошибка репрезентативности разности средних арифметических
- •Необходимый объем выборочной совокупности
- •Анализ качественных признаков
- •Корреляция
- •Регрессия
- •Список литературы
- •Основная литература по лекционным занятиям
- •Задания для индивидуальных работ
Распределение признака
При наблюдении за большими группами биологических объектов можно заметить, что разные значения признака встречаются неодинаковое число раз. Одни значения встречаются чаще, другие – реже. Различная встречаемость разных значений признака называется распределением.
Наиболее распространенным является нормальное распределение, при котором чаще всего встречаются значения признака, близкие к средней арифметической. Чем дальше от нее в сторону увеличения или уменьшения, тем значения признака встречаются реже. Например, людей среднего роста гораздо больше, чем высокого и низкого.
Существует несколько способов представления распределений: вариационный ряд, вариационная кривая (или полигон распределения) и др.
Вариационный ряд – это двойной ряд чисел, состоящий из значений признака и соответствующих частот. Например, даны значения урожайности пшеницы в ц/га (V) и количество гектаров, на которых получена такая урожайность, то есть частота встречаемости (р):
V, ц/га |
15 |
13 |
16 |
10 |
р, га |
5 |
10 |
8 |
4 |
При графическом изображении (см. рис. 1) на оси абсцисс откладываются значения признака (V), на оси ординат – их частоты или встречаемость (p):
|
Рис. 1. Зависимость встречаемости признака от его значения |
Построенный график продолжается до горизонтальной оси и носит название полигона распределения (см. рис. 2).
|
Рис. 2. Полигон распределения |
Ошибки репрезентативности
Вследствие разнообразия биологических объектов выборочная совокупность не может точно охарактеризовать генеральную. Всегда будут присутствовать расхождения или ошибки, которые называются ошибками репрезентативности (от лат. represento – представляю). Они возникают при оценке целого по его части. Эти ошибки не зависят от исследователя, их нельзя избежать, но можно и нужно учитывать в процессе статистической обработки результатов, например, для нахождения генеральных параметров достоверности.
Ошибка средней арифметической
Эта ошибка
определяется по формуле:
,
из которой видно, что чем больше разнообразие признака (величина σ), тем больше ошибка. Если бы все объекты были одинаковы, то есть разнообразие было бы равно нулю, то и ошибка была бы равна нулю (m = 0). В этом случае даже один экземпляр точно характеризовал бы всю генеральную совокупность.
Ошибка также зависит от численности выборки n: чем больше численность, тем меньше ошибка. Определив ошибку репрезентативности m, можно найти генеральную среднюю по формуле:
,
где
–
генеральная
средняя, M
– выборочная средняя, m
– ошибка репрезентативности или просто
ошибка, t
– критерий Стьюдента, соответствующий
вероятности получаемого результата.
Точное значение генеральной средней найти невозможно, поскольку число объектов стремится к бесконечности. С помощью данной формулы с определенной степенью вероятности находятся две границы: максимального и минимального значений. Эти значения называются доверительными интервалами, то есть такими, которым можно доверять. Если доверительные интервалы определены с вероятностью 95% или 0,95, то с вероятностью 5% (100% – 95%) или 0,05 генеральная средняя может быть меньше минимального и больше максимального значений. Значение 5% (или 0,05) называется уровнем значимости. Чаще всего в биологических и экологических исследованиях результат определяется с вероятностью 95% или 0,95. Такой вероятности соответствует tst = 2. В ней степень вероятности, выраженная в долях единицы, обозначается B. Всего представлено 4 степени вероятности.
Из данных, приведенных в таблице видно, что при значениях ν больше 28, при вероятности 95% t = 2. Если значения ν меньше, то величина t постепенно увеличивается. При работе со средними арифметическими ν = n - 1. Этот показатель называется числом степеней свободы.
Пример 6. У 10 свиноматок было по следующему количеству поросят в помете:
V |
12 |
10 |
5 |
8 |
9 |
10 |
9 |
7 |
10 |
10 |
Найти генеральную среднюю. Определена выборочная средняя арифметическая: M = 9,0, определена σ = 1,94. Находим ошибку:
.
Далее находим генеральную среднюю: по таблице 1 определяем, что при n = 10, (ν = 10 - 1 = 9) критерий Стьюдента (tst) равен 2,3. Значит:
.
Вывод: с вероятностью 95% (или в долях единицы 0,95) генеральная средняя для количества поросят в помете свиноматок будет находиться в пределах от 7,6 до 10,4.
С помощью ошибки также определяется достоверность полученных результатов, которая показывает, насколько правильно выборочные данные характеризуют генеральные. Достоверность также определяется через критерий Стьюдента. При нахождении генеральных параметров мы сами задаем значение этого критерия. При определении же достоверности получаем его значение по формуле:
.
При определении достоверности какого–либо показателя этот показатель делится на свою ошибку. Если полученное значение больше табличного или равно ему t ≥ tst, то результат достоверен, если t < tst, то результат недостоверен.
В предыдущем примере:
.
Стандартное (табличное) значение t, как мы уже говорили, равно 2,3. Значит, наш результат достоверен, и ему можно доверять. При таком значении полученного t результат достоверен не только с вероятностью 0,95, но и при более высокой степени вероятности. Если же наш результат оказался недостоверным, это значит ошибка m очень большая. Вспомним, что
,
и если мы добавим для исследования еще несколько объектов, то величина ошибки сразу снизится, и мы добьемся достоверного результата, то есть для снижения величины ошибки и получения достоверного результата, необходимо увеличить количество объектов исследования.
