Биометрия_пособие2
.pdfМИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
«СТЕРЛИТАМАКСКАЯ ГОСУДАРСТВЕННАЯ ПЕДАГОГИЧЕСКАЯ АКАДЕМИЯ им. ЗАЙНАБ БИИШЕВОЙ»
СТАТИСТИЧЕСКАЯ ОБРАБОТКА БИОЭКОЛОГИЧЕСКИХ ДАННЫХ
Учебно-методические материалы для студентов вузов
Стерлитамак 2012
УДК 57.087.1
ББК 28
С 78
Рецензенты:
доктор физико-математических наук, профессор, зав. кафедрой прикладной математики и механики И.К. Гималтдинов (Стерлитамакская государственная педагогическая академия им. Зайнаб Биишевой), доктор технических наук, профессор И.Х. Бикбулатов (Стерлиамакский филиал Уфимского государственного нефтяного технического университета), кафедра биологии и химии (Стерлитамакская государственная педагогическая академия им. Зайнаб Биишевой).
Ответственный редактор – кандидат биологических наук, доцент В.А. Михайлова (Стерлитамакская государственная педагогическая академия им. Зайнаб Биишевой)
Статистическая обработка биоэкологических данных. Учебнометодические материалы для студентов вузов. Авторысоставители Чаус Б.Ю., Шарафутдинов В.М. Стерлитамак: Стерлитамак. гос. пед. академия им. Зайнаб Биишевой, 2012. –
80с.
Вматериалах приводятся основные биометрические понятия и рекомендации для статистической обработки биоэкологических данных, полученных как в ходе полевых, так и в лабораторных исследованиях.
Издание адресуется студентам, аспирантам, педагогам дополнительного образования, учителям, учащимся школ и гимназий.
©Б.Ю. Чаус, 2012
©В.М. Шарафутдинов, 2012
©Стерлитамакская государственная педагогическая академия им. Зайнаб Биишевой, 2012
2
ВВЕДЕНИЕ
Современные биология и экология давно перестали быть исключительно описательными науками. Сегодня их существование и развитие невозможно без использования методов и подходов математической статистики. В связи этим быстрыми темпами развивается «Биометрия».
Термин «биометрия» в науку ввел Ф. Гальтон в 1889 г., имея в виду новое научное направление в биологии, связанное с применением математических методов в исследовательской работе.
Затем Г. Дункер в 1899 г. предложил другое название «вариационная статистика», которое тоже вошло в обиход. Так появились разные названия одного и того же предмета, хотя буквальный смысл их неодинаков.
Слово «биометрия» (от лат. bios - жизнь и melron - мера) обозначает измерение биологических объектов, а термин «ва-
риационная статистика» (от лат. variatio - изменение, колебание и status — состояние, положение вещей) понимается как статистическая обработка результатов измерений. Оба термина имеют недостатки, не лишено их и понятие «биологическая статистика».
Современному биологу в его научно-исследовательской работе необходима статистическая обработка опытных данных и сравнительная оценка результатов исследований. Настоящее пособие рассчитано главным образом на студентов, изучающих этот предмет, а также на преподавателей и научных работников, не имеющих специальной математической подготовки. Полезные сведения здесь найдут педагоги школ и учреждений дополнительного образования, занимающихся с учащимися научно-исследовательской работой.
3
Цель данного пособия - формирование основных представлений о принципах и методах применения математических методов в биологии и экологии, что дает надёжный инструментарий для определения степени достоверности результатов экспериментов и наблюдений, а также правильного их обобщения. Применение этих методов крайне важно при выполнении на современном уровне курсовых и дипломных работ, научноисследовательских проектов и т.д.
В задачи пособия входят:
1.Освоение методов, позволяющих выявлять количественные закономерности в биоэкологических явлениях;
2.Формирование у студентов навыков и умений статистической обработки экспериментальных данных;
3.Избавление педагогов и студентов от боязни математически оформленных статей биоэкологического содержания и формирование способности к критическому анализу представляемых в публикациях данных;
4.Ознакомление с принципами построения математических моделей биоэкологических явлений и процессов.
Вычисления значительно ускоряются и позволяют представить результаты на современном уровне с применением компьютерных технологий, каковыми являются программы Exel for Windows и Statistica. Поэтому, в пособии приводятся алгоритмы работы в этих пакетах, которые будут понятны даже человеку, который имеет незначительную компьютерную подготовку.
Данное пособие является практическим дополнением к теоретическому (лекционному) курсу по биометрии.
4
Часть I. Основы биометрии
Тема 1. Оценка рядов данных: среднее, квадратическое отклонение, коэффициент вариации, стандартная ошибка средней арифметической
Первым этапом обработки полученных в ходе биоэкологических исследований данных (результаты измерений, взвешивания, счета и т.п.) является вычисление средних значений, среднего квадратического отклонения, коэффициента вариации и ошибки средней. Приведенные ниже простейшие методики статистической обработки являются обязательными при проведении любых исследований, связанных с набором однотипных данных. Без этих расчетов дальнейшая обработка и тем более, подведение итогов считаются бессмысленными.
Средняя арифметическая. Очень часто исследова-
телю необходимо знать только среднюю арифметическую величину показателя. Находят ее суммированием всех п о- казателей и делением этой суммы на число показателей. Чем больше количество членов выборки, тем больше средняя величина приближается к истинному значению. В общем виде расчет проводится по формуле:
Хср. = Σхi / n, где Хср.- средняя арифметическая; Σхi – сумма всех показателей; n – количество этих показателей.
Пример: Пусть Х1 = 2; Х2 = 3; Х3 = 5; Х4 = 5. Вычислить среднюю арифметическую.
Решение: Для вычисления средней арифметической нужно суммировать все значения и разделить на 4, то есть
Хср. = (2 + 3 + 5 + 5) / 4 = 15 / 4 = 3,75.
Взвешенная средняя арифметическая вычисляется в том случае, если полученные показатели повторяются несколько раз и исследователь для простоты расчетов группирует их. Например, если в обследованной группе инфузорий Paramecium caudatum длину тела 150 мкм имели 12 шт., длину 180 мкм - 10 шт., 220 мкм - 15 шт. и 300 мкм - 10 шт., то взвешенную среднюю арифметическую можно определить следующим образом: умножить величину длины инфузорий на количество штук в каждой группе, затем суммировать все эти величи-
5
ны и разделить на общее количество организмов. В общем ви-
де расчет проводится по формуле: Xвз. ср. = ( xipi) / pi. Иногда взвешенную среднюю арифметическую в биологических иссле-
дования находят по средним величинам (Xср.) небольших рядов, содержащих разное количество вариант (ni). Тогда форму-
ла приобретает вид: Xвз. ср. = ( xi ср.ni) / ni.
Средняя гармоническая вычисляется в том случае, если изучаемый признак находится в обратно пропорциональной зависимости с другим признаком, связанным с ним функционально. В этом случае средняя гармоническая (хср.h)более точно характеризует эти признаки. Средняя гармоническая равна частному от деления количества признаков (n) на сумму обратных значений ( (1/x)) и вычисляется по формуле: хср.h = n /
( (1/xi)).
Взвешенная средняя гармоническая рассчитывается из сгруппированных рядов, когда одинаковые признаки встречаются несколько раз. Расчет в этом случае проводят по формуле: хср.h = n / ( (Рi/xi)), где n - общее количество признаков,(Рi/xi) - сумма частных от деления количества вариант на их величину.
Средняя квадратическая вычисляется в том случае, если изучаемые показатели определяют величины площади. Тогда средняя квадратическая равна корню квадратному из суммы квадратов показателей, деленной на количество этих показателей: Хср.q = ( xi2) / n, где xi2 - сумма квадратов всех вариант, n - количество вариант.
Взвешенную среднюю квадратическую можно вычис-
лить тогда, когда отдельные величины, находящиеся в изучаемом ряду, повторяются и сгруппированы. В общем виде формула расчета выглядит следующим образом: Хср.q = ( рixi2)/n, где рixi2 - сумма произведений квадратов повторяющихся вариант xi2 на их количество рi; n - общее количество всех вариант.
Средняя кубическая вычисляется при необходимости нахождения средней величины у каких-либо объемных признаков. Средняя кубическая равна корню кубическому из суммы
кубов вариант, деленной на их общее количество: Хср.Q = 3
( xi3) / n.
6
Взвешенная средняя кубическая может быть вычислена в том случае, если представленные ряды сгруппированы и имеются данные, сколько раз повторяется та или иная вариан-
та. В таком случае расчет делают по формуле: Хср.Q = 3 ( рixi3) / n, где рixi 3 - сумма произведений кубов повторяющихся вариант xi3 на их количество рi; n - общее количество всех вариант.
Среднюю геометрическую обычно вычисляют в тех случаях, когда нужно охарактеризовать изменения каких-то показателей под влиянием различных факторов, например, изменение численности организмов за какой-то отрезок времени. Она выражается в различных единицах, х или в процентах. Средняя геометрическая обычно вычисляется по формуле: Хср.g =х1х2......хn или с помощью логарифмирования: lg Хср.g = ( lgxi) / n.
Вычисление стандартной ошибки средней арифме-
тической. Как правило, выборочные характеристики не совпадают по абсолютной величине с соответствующими генеральными параметрами. Величина отклонения выборочного показателя от его генерального параметра называется статистической ошибкой этого показателя или ошибкой репрезентативности. Статистические ошибки — это не ошибки, допускаемые при измерении биологических объектов. Они возникают исключительно в процессе отбора вариант из генеральной совокупности и к ошибкам измерений отношения не имеют.
Величина ошибки репрезентативности измеряется средним квадратическим отклонением, которое является не только характеристикой варьирования того или иного признака, но и служит мерой «ошибки» отдельных вариант, если они используются в качестве оценки генеральных параметров. Следует отметить также, что величина статистической ошибки уменьшается при увеличении числа наблюдений.
Среднее квадратическое отклонение (σ) вычисляется по формуле:
|
|
|
|
|
|
( Xi Xс) |
2 |
|
|
σ = |
|
, где Хс – среднее значение выборки. |
||
|
|
|
||
|
n 1 |
Ошибка среднего квадратичного отклонения вычисляется
7
по формуле: т = / 2N;
Стандартная ошибка средней вычисляется по формуле: Sx =
σ / √ n.
Приводя числовые данные в тексте или в таблицах, вначале ставят значения параметра, затем знак ±, а после него - значение ошибки. Например, средняя длина тела инфузорийтуфелек равна 200 ± 25 мкм.
Пример: Пусть Х1 = 5; Х2 = 7; Х3 = 9; Х4 = 10. Вычислить стандартную ошибку средней арифметической.
Решение: Для вычисления стандартной ошибки сред-
ней арифметической нужно: |
|
|
|
||
1. |
Составить таблицу: |
|
|
|
|
|
Xi |
Xi - Xc |
|
(Xi – Xc)2 |
|
|
5 |
-2,25 |
|
5,06 |
|
|
7 |
-0,75 |
|
0,56 |
|
|
9 |
1,25 |
|
1,56 |
|
|
10 |
2,25 |
|
5,06 |
|
Хс = 7,75 |
|
|
Σ = 12,24 |
|
|
2. |
Разделить 12,24 на 3. Получаем 4,08. |
||||
3. |
Извлечь из величины 12,24 |
квадратный корень и, |
таким образом, получить среднее квадратическое отклонение. 4. Извлечь квадратный корень из цифры 4. Получиться 2.
5. Делим величину среднего квадратического отклонения на 2 и получаем показатель стандартной ошибки средней арифметической.
Коэффициент вариации - это выраженное в процентах отношение среднего квадратичного отклонения к средней арифметической: CV = / M •100%. В отличие от среднеквадратичного отклонения, коэффициент вариации - безразмерная величина, поэтому он может служить для сравнения по степени вариабельности любых рядов.
Контрольные вопросы и задание для самостоятельной работы к теме 1:
1.Какие показатели вычисляются на 1-м этапе обработки биоэкологических данных?
2.Как группируются данные для нахождения взвешенной средней арифметической?
3.В каком случае вычисляется средняя гармоническая?
8
4.Когда и как вычисляется взвешенная средняя квадратическая?
5.В каких случаях вычисляют среднюю геометрическую?
6.Почему в некоторых случаях вычисляется средняя гармоническая и как это делается?
7.Зачем и как вычисляется стандартная ошибка средней арифметической?
8.Для чего и как вычисляется коэффициент вариации?
9.Из чего исходят при вычислении t-критерия Стьюдента?
10.В чем заключается сущность дисперсионного анализа?
11.Как определяется достоверность влияния фактора после проведения дисперсионного анализа?
12.В семи районах города было собрано по 30-ть растений одуванчика в фазе формирования семян в корзинке (см. результаты в таблице 1.1).
Таблица 1.1
Число семян в корзинке Taraxacum officinale с различных пунктов сбора
№ растения |
|
|
Пункт сбора |
|
|
|||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
||
|
||||||||
1 |
135 |
239 |
156 |
271 |
150 |
250 |
158 |
|
2 |
204 |
102 |
134 |
214 |
124 |
198 |
237 |
|
3 |
154 |
184 |
211 |
282 |
113 |
174 |
205 |
|
4 |
220 |
180 |
224 |
228 |
129 |
226 |
273 |
|
5 |
202 |
220 |
204 |
176 |
186 |
254 |
226 |
|
6 |
204 |
186 |
156 |
128 |
135 |
152 |
170 |
|
7 |
176 |
214 |
125 |
171 |
149 |
86 |
152 |
|
8 |
121 |
196 |
115 |
184 |
175 |
151 |
168 |
|
9 |
266 |
194 |
140 |
282 |
181 |
113 |
199 |
|
10 |
230 |
197 |
285 |
157 |
217 |
136 |
174 |
|
11 |
228 |
200 |
176 |
187 |
134 |
164 |
102 |
|
12 |
196 |
159 |
128 |
175 |
203 |
180 |
218 |
|
13 |
284 |
187 |
308 |
160 |
139 |
184 |
216 |
|
14 |
270 |
219 |
132 |
162 |
130 |
149 |
215 |
|
15 |
214 |
166 |
164 |
104 |
155 |
115 |
102 |
9
|
16 |
258 |
123 |
206 |
175 |
171 |
150 |
182 |
|
17 |
276 |
261 |
210 |
129 |
121 |
169 |
168 |
|
18 |
260 |
233 |
130 |
252 |
141 |
104 |
203 |
|
19 |
224 |
199 |
204 |
128 |
194 |
127 |
139 |
|
20 |
247 |
167 |
158 |
154 |
115 |
90 |
135 |
|
21 |
293 |
217 |
170 |
127 |
208 |
94 |
185 |
|
22 |
280 |
112 |
205 |
245 |
154 |
107 |
180 |
|
23 |
310 |
192 |
188 |
183 |
101 |
161 |
176 |
|
24 |
126 |
245 |
128 |
125 |
132 |
147 |
283 |
|
25 |
265 |
179 |
179 |
154 |
111 |
155 |
142 |
|
26 |
252 |
177 |
156 |
157 |
173 |
203 |
134 |
|
27 |
176 |
251 |
232 |
196 |
146 |
146 |
160 |
|
28 |
264 |
180 |
106 |
138 |
182 |
169 |
133 |
|
29 |
198 |
170 |
180 |
134 |
111 |
130 |
178 |
|
30 |
205 |
180 |
243 |
156 |
134 |
133 |
164 |
Провести вычисления всех приведенных в теме 1 статистических показателей.
Тема 2. Сравнение средних значений двух выборок
Сравнение средних значений двух выборок по t-критерию Стьюдента. При сравнении средних показателей двух выборок (Х и У) по t-критерию Стьюдента исходят из предположения, что возможные различия возникли случайно («нулевая гипотеза»). Параметр t вычисляют по формуле:
t = |
|
Хс Ус |
|
|
, где Sх2 и Sу2 — квадраты стандартных (стати- |
|||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
Sx |
2 |
Sy |
2 |
|
||||
|
|
|
|
|
||||
|
|
|
|
|
|
|
стических) ошибок для каждой из средних значений выборок. Полученное значение t – критерия Стьюдента сравнивают с табличными (табл. 2.1) значениями для определённых чисел свободы и при необходимом уровне значимости. Число степеней свободы определяется по формуле: nx + ny – 2.
10