- •Описательная статистика. Основные понятия биометрии
- •Основные характеристики статистических совокупностей. Средние величины и показатели вариации. Квантили и выбросы
- •Квантили.
- •Вариационные ряды. Построение интервального ряда
- •Случайные величины и их распределение
- •Оценки. Статистические ошибки
- •Статистика выводов
- •Критерии достоверности оценок. Статистические гипотезы, их проверка
- •Асимметрия и эксцесс.
- •Непараметрические критерии
- •Первичная статистическая обработка экспериментальных данных
Статистика выводов
Существует несколько способов создания статистических выводов. Первый - построение доверительных интервалов.
И нтервальные оценки По известным выборочным характеристикам можно построить интервал, в котором с той или иной вероятностью, называемой доверительной, находится генеральный параметр. В качестве доверительных используют вероятности Р1 = 0,95; Р2 = 0,99; Р3 = 0,999. Выбор того или иного порога доверительной вероятности осуществляется исходя из практических соображений той ответственности, с какой делаются выводы о генеральных параметрах. С доверительной вероятностью тесно связан уровень значимости , под которым понимают разность = 1 – Р. Если известны генеральные параметры и нормального распределения, можно сказать, что около 95 % значений вариационного ряда попадают в интервал 2 стандартных отклонений от среднего. Этот интервал называется доверительным. Для уменьшения доверительного интервала необходимо увеличить размер выборки. Если генеральные параметры неизвестны, для построения доверительного интервала используют t-статистику и коэффициент Стьюдента. В этом случае генеральная средняя с выбранной вероятностью находится в интервале
t S + t S или = ± t S
Величины и S определяют по выборке, t (коэффициент Стьюдента) зависит обычно от одного из трех значений доверительной вероятности 0,95; 0,99; 0,999, принимая величины 1,96; 2,58; 3,29 или, в случае малой выборки, до n = 30 находится по таблицам.
Доверительный интервал для генеральной дисперсии нормально распределяющейся генеральной совокупности можно представить в виде Рн ≤ 2 ≤ Рв и его строят с применением 2 (хи-квадрат)-критерия Пирсона. Критические (процентные) точки для этого критерия приведены в специальных таблицах. Они рассчитаны для разных уровней значимости и соответствующих порогов доверительной вероятности Р. При использовании критерия 2 для построения доверительного интервала применяют двусторонний уровень значимости, т. е. = 2,5% (для Рн.) и для Рв = 100 — 2,5 = 97,5%. Границы 95%-ного доверительного интервала определяют по формулам:
Рн = Рв =
где Sx2 – выборочная дисперсия, n – объем выборки. Границы доверительного интервала для стандартного отклонения: Рн(СКО) = √ Рн ; Рв(СКО) = √ Рв.
Критерии достоверности оценок. Статистические гипотезы, их проверка
Второй способ создания статистических выводов – это проверка гипотез, основанная на теории изучаемого явления. Сначала формулируется гипотеза, затем собираются данные и выполняется проверка, включающая 4 основных элемента:
1. Формулировка нулевой гипотезы, чаще всего общепринятой (Н0); 2. Формулировка альтернативной гипотезы (На); 3. Вычисление статистики теста; 4. Определение области непринятия гипотезы. Верхняя и нижняя границы области принятия гипотезы называются критическими значениями.
В области биометрии широкое применение получила так называемая нулевая гипотеза (Н0). Сущность ее сводится к предположению, что разница между генеральными параметрами сравниваемых групп равна нулю, а различия, наблюдаемые между выборочными характеристиками, носят не систематический, а исключительно случайный характер. Так, если одна выборка извлечена из нормально распределяющейся совокупности с параметрами х и х а другая — из совокупности с параметрами у и у, то нулевая гипотеза исходит из того, что х =у, и х =у, т. е. х - у = 0 и х - у =0 (отсюда и название гипотезы — нулевая).
Противоположная нулевой — альтернативная гипотеза (На) — исходит из предположения, что х - у ≠ 0 и х - у ≠ 0.
Для проверки принятой гипотезы используют критерии достоверности, которые позволяют в каждом конкретном случае выявить, удовлетворяют ли выборочные показатели принятой гипотезе. Функции распределения этих критериев сведены в специальные таблицы, где содержатся значения функции для разных чисел степеней свободы k или объема выборки n и уровней значимости .
Обычно при проверке статистических гипотез принимают три уровни значимости: 5%-ный (вероятность ошибочной оценки Р=0,05), 1%-ный (Р=0,01) и 0,1%-ный (Р=0,001). В биологических исследованиях часто считают достаточным 5%-ный уровень значимости. При этом нулевую гипотезу не отвергают, если в результате исследования окажется, что вероятность ошибочности оценки относительно правильности принятой гипотезы превышает 5%, т. е. Р>0,05. Если же Р < 0,05, то принятую гипотезу следует отвергнуть на взятом уровне (). Ошибка при этом возможна не более чем в 5% случаев, т. е, она маловероятна.
В биометрии применяют два вида статистических критериев: параметрические и непараметрические. Параметрические строятся на основании параметров данной совокупности (например, , sx2) и представляют функции этих параметров. Непараметрические представляют собой функции, зависящие непосредственно от вариант данной совокупности с их частотами. Параметрические служат для проверки гипотез о параметрах совокупностей, распределяемых по нормальному закону, непараметрические – для проверки рабочих гипотез независимо от формы распределения совокупностей.
При нормальном распределении признака параметрические критерии обладают большей безошибочностью и мощностью, чем непараметрические критерии. В случае очень больших отличий в распределении признака от нормального вида применяют непараметрические критерии. В ситуациях, когда варьирующие признаки выражаются не числами, а условными знаками, применение непараметрических критериев оказывается единственно возможным. Из параметрических критериев в биометрии чаще всего применяют t-критерий Стьюдента и F-критерий Фишера. Первый используют для сравнительной оценки средних величин, второй – для оценки дисперсий.
В биологии очень часто возникает необходимость сравнивать те или иные генеральные параметры изучаемых совокупностей, которые, как правило, остаются неизвестными. Невозможно сравнивать неизвестные показатели, но можно сравнить выборочные характеристики, которые являются оценками генеральных параметров. По разности между выборочными показателями, наблюдаемой между сравниваемыми выборками, учитывая статистические ошибки, судят о разнице между генеральными параметрами. Вопрос о достоверности выборочной разности с ее ошибкой решают исходя из той или иной гипотезы относительно параметров сравниваемых групп. Гипотеза выражается в терминах вероятности и может быть проверена по выборочным характеристикам.
Оценка разности средних. При сравнении друг с другом двух независимых выборок, взятых из нормально распределяющихся совокупностей с параметрами 1 и 2, можно предположить, что 1 - 2 = D. Значения этих генеральных параметров неизвестны, однако можно найти величины выборочных средних и разность между ними ( 1 — 2) = d. Нулевая гипотеза сводится к предположению, что 1 = 2 и t-критерий выражается в виде отношения разности выборочных средних к ошибке разности средних:
,
где для равновеликих выборок (n1 = n2) ,
для неравновеликих (n1 n2)
Н0 - гипотезу отвергают, если фактически установленная величина t-критерия (обозначаемая символом tф.) превзойдет или окажется равной критическому (стандартному) значению tst этой величины для принятого уровня значимости и числа степеней свободы k = n1 + n2 — 2, т. е при условии tф > tst. Если фактическое значение tф меньше табличного (k = n1 + n2 -2), то разность между средними не выходит за пределы случайных колебаний.