- •Часть 1
- •Биолого-почвенного факультета
- •Учебно-методическое пособие к курсу "Компьютерные методы в зоологии". Часть 1: Казань, 2002. 19 с.
- •Введение
- •Вариационный ряд и его основные характеристики
- •Законы распределения
- •Основные критерии и параметры вариационных рядов нормального распределения
- •Основные непараметрические критерии и статистические методы
- •Статистические гипотезы и критерии их проверки
- •Приципы и методы количественного анализа в фаунистических и зоологических исследованиях
- •Показатели разнообразия и обилия животных
- •Сравнение выборок с использованием индексов общности (сходства)
- •Краткая характеристика программных пакетов
- •Программа Microsoft Excel
- •Программа statistica
- •Электронные таблицы Spreadsheet могут содержать данные в различных форматах, например, даты, времени, текстовый формат и др.
- •Содержание
Законы распределения
Значения изучаемой случайной величины подчиняются определенным законам, называемым законами распределения. Они описываются с помощью функций, показывающих, у какой доли изучаемых объектов количественное значение изучаемого признака меньше определенной величины (значения аргумента). Функции зависят от небольшого числа величин, называемых параметрами распределения.
Если мы имеем набор выборок, отличающихся друг от друга только в силу действия случайных причин, и каждая из них независима от остальных и оказывает незначительное влияние на конечный результат измерений, то это распределение подчиняется закону нормального распределения (Гаусса). При нормальном распределении наименьшие и наибольшие значения проявляются крайне редко, а значения, близкие к среднему арифметическому, – часто. Примеры кривой нормального распределения и кумулятивная гистограмма показаны на рис. 1.
Рис. 1. Нормальная кривая. На оси абсцисс – баллы шкалы по среднему квадратичному отклонению; M – средняя арифметическая; f – частоты; х – варианты, δ – сигма или среднее квадратическое (стандартное) отклонение.
Нормальное распределение характеризуется следующими признаками:
симметрической колоколообразной двускатной кривой распределения частот f,
совпадением по абсолютной величине средней арифметической, медианы и моды,
соотношением средней арифметической и среднего квадратического отклонения, равным 3δ, коэффициентом вариации (CV) = 33%.
При анализе ряда, подчиняющегося закону нормального распределения, используют параметрические критерии: t-критерий Стьюдента, а для оценки дисперсии - F-критерий Фишера. Основные параметры данной совокупности - средняя арифметическая (M), среднее квадратическое отклонение (стандартное отклонение или σ), показатели вариации (CV) и стандартная ошибка (m). Многие методы одномерной и многомерной статистики, а именно, корреляция Пирсона, регрессионный, факторный, дискриминантный, кластерный и другие виды анализов, можно использовать лишь для указанного вида распределения.
Однако на практике чаще всего приходится иметь дело с совокупностями, распределение которых не подчиняется закону нормального распределения, а также с классификационными, альтернативными и порядковыми (ранговыми) данными. Распределения часто бывают асимметричными, а кривые их могут иметь два или несколько максимумов.
Иногда приходится проверять рабочие гипотезы независимо от формы распределения совокупностей. При отклонении от нормального распределения используют непараметрические критерии: Χ-критерий Ван-дер-Вардена и U-критерий Уилкоксона (Wilkokson-test), критерий знаков z. В качестве основных характеристик рядов, не подчиняющихся закону нормального распределения, используют медиану, а для корреляционного анализа - ранговую корреляцию Спирмена и т.д.
Для того чтобы эмпирическое (полученное на практике) распределение приблизить к нормальному, используют процедуры преобразования или выравнивания (например, x' = ln+1, x' = 1/x, x' = √ x). Тогда появляется возможность использовать статистические методы, применение которых ограничено нормальным распределением.
Занятие 2.
