Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Биометрия_пособие2

.pdf
Скачиваний:
42
Добавлен:
18.03.2016
Размер:
2.79 Mб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«СТЕРЛИТАМАКСКАЯ ГОСУДАРСТВЕННАЯ ПЕДАГОГИЧЕСКАЯ АКАДЕМИЯ им. ЗАЙНАБ БИИШЕВОЙ»

СТАТИСТИЧЕСКАЯ ОБРАБОТКА БИОЭКОЛОГИЧЕСКИХ ДАННЫХ

Учебно-методические материалы для студентов вузов

Стерлитамак 2012

УДК 57.087.1

ББК 28

С 78

Рецензенты:

доктор физико-математических наук, профессор, зав. кафедрой прикладной математики и механики И.К. Гималтдинов (Стерлитамакская государственная педагогическая академия им. Зайнаб Биишевой), доктор технических наук, профессор И.Х. Бикбулатов (Стерлиамакский филиал Уфимского государственного нефтяного технического университета), кафедра биологии и химии (Стерлитамакская государственная педагогическая академия им. Зайнаб Биишевой).

Ответственный редактор – кандидат биологических наук, доцент В.А. Михайлова (Стерлитамакская государственная педагогическая академия им. Зайнаб Биишевой)

Статистическая обработка биоэкологических данных. Учебнометодические материалы для студентов вузов. Авторысоставители Чаус Б.Ю., Шарафутдинов В.М. Стерлитамак: Стерлитамак. гос. пед. академия им. Зайнаб Биишевой, 2012. –

80с.

Вматериалах приводятся основные биометрические понятия и рекомендации для статистической обработки биоэкологических данных, полученных как в ходе полевых, так и в лабораторных исследованиях.

Издание адресуется студентам, аспирантам, педагогам дополнительного образования, учителям, учащимся школ и гимназий.

©Б.Ю. Чаус, 2012

©В.М. Шарафутдинов, 2012

©Стерлитамакская государственная педагогическая академия им. Зайнаб Биишевой, 2012

2

Фрэнсис Гальтон
(1822 - 1911) - английский психолог и антрополог

ВВЕДЕНИЕ

Современные биология и экология давно перестали быть исключительно описательными науками. Сегодня их существование и развитие невозможно без использования методов и подходов математической статистики. В связи этим быстрыми темпами развивается «Биометрия».

Термин «биометрия» в науку ввел Ф. Гальтон в 1889 г., имея в виду новое научное направление в биологии, связанное с применением математических методов в исследовательской работе.

Затем Г. Дункер в 1899 г. предложил другое название «вариационная статистика», которое тоже вошло в обиход. Так появились разные названия одного и того же предмета, хотя буквальный смысл их неодинаков.

Слово «биометрия» (от лат. bios - жизнь и melron - мера) обозначает измерение биологических объектов, а термин «ва-

риационная статистика» (от лат. variatio - изменение, колебание и status — состояние, положение вещей) понимается как статистическая обработка результатов измерений. Оба термина имеют недостатки, не лишено их и понятие «биологическая статистика».

Современному биологу в его научно-исследовательской работе необходима статистическая обработка опытных данных и сравнительная оценка результатов исследований. Настоящее пособие рассчитано главным образом на студентов, изучающих этот предмет, а также на преподавателей и научных работников, не имеющих специальной математической подготовки. Полезные сведения здесь найдут педагоги школ и учреждений дополнительного образования, занимающихся с учащимися научно-исследовательской работой.

3

Цель данного пособия - формирование основных представлений о принципах и методах применения математических методов в биологии и экологии, что дает надёжный инструментарий для определения степени достоверности результатов экспериментов и наблюдений, а также правильного их обобщения. Применение этих методов крайне важно при выполнении на современном уровне курсовых и дипломных работ, научноисследовательских проектов и т.д.

В задачи пособия входят:

1.Освоение методов, позволяющих выявлять количественные закономерности в биоэкологических явлениях;

2.Формирование у студентов навыков и умений статистической обработки экспериментальных данных;

3.Избавление педагогов и студентов от боязни математически оформленных статей биоэкологического содержания и формирование способности к критическому анализу представляемых в публикациях данных;

4.Ознакомление с принципами построения математических моделей биоэкологических явлений и процессов.

Вычисления значительно ускоряются и позволяют представить результаты на современном уровне с применением компьютерных технологий, каковыми являются программы Exel for Windows и Statistica. Поэтому, в пособии приводятся алгоритмы работы в этих пакетах, которые будут понятны даже человеку, который имеет незначительную компьютерную подготовку.

Данное пособие является практическим дополнением к теоретическому (лекционному) курсу по биометрии.

4

Часть I. Основы биометрии

Тема 1. Оценка рядов данных: среднее, квадратическое отклонение, коэффициент вариации, стандартная ошибка средней арифметической

Первым этапом обработки полученных в ходе биоэкологических исследований данных (результаты измерений, взвешивания, счета и т.п.) является вычисление средних значений, среднего квадратического отклонения, коэффициента вариации и ошибки средней. Приведенные ниже простейшие методики статистической обработки являются обязательными при проведении любых исследований, связанных с набором однотипных данных. Без этих расчетов дальнейшая обработка и тем более, подведение итогов считаются бессмысленными.

Средняя арифметическая. Очень часто исследова-

телю необходимо знать только среднюю арифметическую величину показателя. Находят ее суммированием всех п о- казателей и делением этой суммы на число показателей. Чем больше количество членов выборки, тем больше средняя величина приближается к истинному значению. В общем виде расчет проводится по формуле:

Хср. = Σхi / n, где Хср.- средняя арифметическая; Σхi – сумма всех показателей; n – количество этих показателей.

Пример: Пусть Х1 = 2; Х2 = 3; Х3 = 5; Х4 = 5. Вычислить среднюю арифметическую.

Решение: Для вычисления средней арифметической нужно суммировать все значения и разделить на 4, то есть

Хср. = (2 + 3 + 5 + 5) / 4 = 15 / 4 = 3,75.

Взвешенная средняя арифметическая вычисляется в том случае, если полученные показатели повторяются несколько раз и исследователь для простоты расчетов группирует их. Например, если в обследованной группе инфузорий Paramecium caudatum длину тела 150 мкм имели 12 шт., длину 180 мкм - 10 шт., 220 мкм - 15 шт. и 300 мкм - 10 шт., то взвешенную среднюю арифметическую можно определить следующим образом: умножить величину длины инфузорий на количество штук в каждой группе, затем суммировать все эти величи-

5

ны и разделить на общее количество организмов. В общем ви-

де расчет проводится по формуле: Xвз. ср. = ( xipi) / pi. Иногда взвешенную среднюю арифметическую в биологических иссле-

дования находят по средним величинам (Xср.) небольших рядов, содержащих разное количество вариант (ni). Тогда форму-

ла приобретает вид: Xвз. ср. = ( xi ср.ni) / ni.

Средняя гармоническая вычисляется в том случае, если изучаемый признак находится в обратно пропорциональной зависимости с другим признаком, связанным с ним функционально. В этом случае средняя гармоническая (хср.h)более точно характеризует эти признаки. Средняя гармоническая равна частному от деления количества признаков (n) на сумму обратных значений ( (1/x)) и вычисляется по формуле: хср.h = n /

( (1/xi)).

Взвешенная средняя гармоническая рассчитывается из сгруппированных рядов, когда одинаковые признаки встречаются несколько раз. Расчет в этом случае проводят по формуле: хср.h = n / ( (Рi/xi)), где n - общее количество признаков,(Рi/xi) - сумма частных от деления количества вариант на их величину.

Средняя квадратическая вычисляется в том случае, если изучаемые показатели определяют величины площади. Тогда средняя квадратическая равна корню квадратному из суммы квадратов показателей, деленной на количество этих показателей: Хср.q = ( xi2) / n, где xi2 - сумма квадратов всех вариант, n - количество вариант.

Взвешенную среднюю квадратическую можно вычис-

лить тогда, когда отдельные величины, находящиеся в изучаемом ряду, повторяются и сгруппированы. В общем виде формула расчета выглядит следующим образом: Хср.q = ( рixi2)/n, где рixi2 - сумма произведений квадратов повторяющихся вариант xi2 на их количество рi; n - общее количество всех вариант.

Средняя кубическая вычисляется при необходимости нахождения средней величины у каких-либо объемных признаков. Средняя кубическая равна корню кубическому из суммы

кубов вариант, деленной на их общее количество: Хср.Q = 3

( xi3) / n.

6

Взвешенная средняя кубическая может быть вычислена в том случае, если представленные ряды сгруппированы и имеются данные, сколько раз повторяется та или иная вариан-

та. В таком случае расчет делают по формуле: Хср.Q = 3 ( рixi3) / n, где рixi 3 - сумма произведений кубов повторяющихся вариант xi3 на их количество рi; n - общее количество всех вариант.

Среднюю геометрическую обычно вычисляют в тех случаях, когда нужно охарактеризовать изменения каких-то показателей под влиянием различных факторов, например, изменение численности организмов за какой-то отрезок времени. Она выражается в различных единицах, х или в процентах. Средняя геометрическая обычно вычисляется по формуле: Хср.g =х1х2......хn или с помощью логарифмирования: lg Хср.g = ( lgxi) / n.

Вычисление стандартной ошибки средней арифме-

тической. Как правило, выборочные характеристики не совпадают по абсолютной величине с соответствующими генеральными параметрами. Величина отклонения выборочного показателя от его генерального параметра называется статистической ошибкой этого показателя или ошибкой репрезентативности. Статистические ошибки — это не ошибки, допускаемые при измерении биологических объектов. Они возникают исключительно в процессе отбора вариант из генеральной совокупности и к ошибкам измерений отношения не имеют.

Величина ошибки репрезентативности измеряется средним квадратическим отклонением, которое является не только характеристикой варьирования того или иного признака, но и служит мерой «ошибки» отдельных вариант, если они используются в качестве оценки генеральных параметров. Следует отметить также, что величина статистической ошибки уменьшается при увеличении числа наблюдений.

Среднее квадратическое отклонение (σ) вычисляется по формуле:

 

 

 

 

 

 

( Xi Xс)

2

 

 

σ =

 

, где Хс – среднее значение выборки.

 

 

 

 

n 1

Ошибка среднего квадратичного отклонения вычисляется

7

по формуле: т = / 2N;

Стандартная ошибка средней вычисляется по формуле: Sx =

σ / √ n.

Приводя числовые данные в тексте или в таблицах, вначале ставят значения параметра, затем знак ±, а после него - значение ошибки. Например, средняя длина тела инфузорийтуфелек равна 200 ± 25 мкм.

Пример: Пусть Х1 = 5; Х2 = 7; Х3 = 9; Х4 = 10. Вычислить стандартную ошибку средней арифметической.

Решение: Для вычисления стандартной ошибки сред-

ней арифметической нужно:

 

 

 

1.

Составить таблицу:

 

 

 

 

Xi

Xi - Xc

 

(Xi – Xc)2

 

 

5

-2,25

 

5,06

 

 

7

-0,75

 

0,56

 

 

9

1,25

 

1,56

 

 

10

2,25

 

5,06

 

Хс = 7,75

 

 

Σ = 12,24

 

2.

Разделить 12,24 на 3. Получаем 4,08.

3.

Извлечь из величины 12,24

квадратный корень и,

таким образом, получить среднее квадратическое отклонение. 4. Извлечь квадратный корень из цифры 4. Получиться 2.

5. Делим величину среднего квадратического отклонения на 2 и получаем показатель стандартной ошибки средней арифметической.

Коэффициент вариации - это выраженное в процентах отношение среднего квадратичного отклонения к средней арифметической: CV = / M •100%. В отличие от среднеквадратичного отклонения, коэффициент вариации - безразмерная величина, поэтому он может служить для сравнения по степени вариабельности любых рядов.

Контрольные вопросы и задание для самостоятельной работы к теме 1:

1.Какие показатели вычисляются на 1-м этапе обработки биоэкологических данных?

2.Как группируются данные для нахождения взвешенной средней арифметической?

3.В каком случае вычисляется средняя гармоническая?

8

4.Когда и как вычисляется взвешенная средняя квадратическая?

5.В каких случаях вычисляют среднюю геометрическую?

6.Почему в некоторых случаях вычисляется средняя гармоническая и как это делается?

7.Зачем и как вычисляется стандартная ошибка средней арифметической?

8.Для чего и как вычисляется коэффициент вариации?

9.Из чего исходят при вычислении t-критерия Стьюдента?

10.В чем заключается сущность дисперсионного анализа?

11.Как определяется достоверность влияния фактора после проведения дисперсионного анализа?

12.В семи районах города было собрано по 30-ть растений одуванчика в фазе формирования семян в корзинке (см. результаты в таблице 1.1).

Таблица 1.1

Число семян в корзинке Taraxacum officinale с различных пунктов сбора

№ растения

 

 

Пункт сбора

 

 

1

2

3

4

5

6

7

 

1

135

239

156

271

150

250

158

2

204

102

134

214

124

198

237

3

154

184

211

282

113

174

205

4

220

180

224

228

129

226

273

5

202

220

204

176

186

254

226

6

204

186

156

128

135

152

170

7

176

214

125

171

149

86

152

8

121

196

115

184

175

151

168

9

266

194

140

282

181

113

199

10

230

197

285

157

217

136

174

11

228

200

176

187

134

164

102

12

196

159

128

175

203

180

218

13

284

187

308

160

139

184

216

14

270

219

132

162

130

149

215

15

214

166

164

104

155

115

102

9

 

16

258

123

206

175

171

150

182

 

17

276

261

210

129

121

169

168

 

18

260

233

130

252

141

104

203

 

19

224

199

204

128

194

127

139

 

20

247

167

158

154

115

90

135

 

21

293

217

170

127

208

94

185

 

22

280

112

205

245

154

107

180

 

23

310

192

188

183

101

161

176

 

24

126

245

128

125

132

147

283

 

25

265

179

179

154

111

155

142

 

26

252

177

156

157

173

203

134

 

27

176

251

232

196

146

146

160

 

28

264

180

106

138

182

169

133

 

29

198

170

180

134

111

130

178

 

30

205

180

243

156

134

133

164

Провести вычисления всех приведенных в теме 1 статистических показателей.

Тема 2. Сравнение средних значений двух выборок

Сравнение средних значений двух выборок по t-критерию Стьюдента. При сравнении средних показателей двух выборок (Х и У) по t-критерию Стьюдента исходят из предположения, что возможные различия возникли случайно («нулевая гипотеза»). Параметр t вычисляют по формуле:

t =

 

Хс Ус

 

 

, где 2 и Sу2 — квадраты стандартных (стати-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sx

2

Sy

2

 

 

 

 

 

 

 

 

 

 

 

 

 

стических) ошибок для каждой из средних значений выборок. Полученное значение t – критерия Стьюдента сравнивают с табличными (табл. 2.1) значениями для определённых чисел свободы и при необходимом уровне значимости. Число степеней свободы определяется по формуле: nx + ny – 2.

10