- •По теории вероятностей
- •1.2 Структурные средние и способы их вычисления
- •Вопрос 1.6 Распределение «хи-квадрат», t-распределение Стьюдента, распределение f Фишера-Снедекора.
- •2. По математической статистике
- •Вопрос 2.1 Генеральная совокупность и выборка
- •Вопрос 2.2 Понятие о вариационных рядах, средняя ряда. Показатели вариации. Дисперсия, среднее квадратичное отклонение (стандартное отклонение). Оценка структурных средних.
- •2.10 Однофакторный дисперсионный анализ
- •2.11. Анализ качественных признаков
- •Примеры сравнение качественных признаков.
- •1) Тромбозы шунта при приеме плацебо и аспирина
- •2.12 Доверительный интервал для среднего.
- •2.13 Доверительный интервал для доли.
- •2.14. Определение необходимого объема выборки.
- •2.15. Повторные измерения (Парный критерий Стьюдента).
- •2.16. Критерий Крускала-Уоллиса
- •2.18 Критерий знаков z
- •Линейная регрессия и метод наименьших квадратов
- •2.23. Оценка параметров уравнения регрессии по выборке
- •2.24. Ранговый коэффициент корреляции Спирмена.
- •Вопросы прикладной (микробиологической) статистики
- •3.1 Кривая «доза-эффект»
- •Вопрос 3.2 методы количественной оценки иммуногенности вакцин.
- •Вопрос 3.3 количественный метод определения иммуногенности вакцин, основанный на испытании их постоянным уровнем
- •3.4 Количественный метод определения иммуногенности вакцин, основанный на испытании их постоянным уровнем иммунитета
- •3.5. Количественные закономерности связи между уровнем иммунитета и дозой антигена.
- •3.7 Метод Кербера.
- •3.8 Пробит-метод.
- •Вопрос 4.1 Факторы. Требования к ним.
- •Вопрос 4.2 Параметр оптимизации. Требования к нему.
- •4.3 Полный факторный эксперимент
- •Свойства матриц полного факторного эксперимента
- •Вопрос 4.5 Метод крутого восхождения.
- •Вопрос 4.6 Симплексный метод оптимизации.
- •5. Вопросы по методам математического моделирования в биологии
- •5.1 Исследование мат. Модели
- •5.2 Исследование моделей биологических систем, описываемых системами двух автономных дифференциальных уравнений.
- •Исследование устойчивости стационарных состояний моделей биологических систем.
- •5.4. Мультистационарные системы
- •5.5 Колебания в биологических системах. Предельный цикл. Теоремы, определение существование предельного цикла.
- •5.6 Анализ модели брюсселятор.
- •5.7 Модели взаимодействия двух видов
- •Вопрос 5,8 Уравнение конкуренции и их анализ ..
- •5.9 Уравнения системы «хищник – жертва» и их анализ.
- •5.10 Моделирование микробных популяций.
2.18 Критерий знаков z
В тех случаях, когда результаты наблюдений выражаются не числами, а знаками плюс (+) и минус (−), различия между попарно связанными членами выборок оценивают с помощью критерия знаков z. Конструкция этого критерия базируется на следующих соображениях: если попарно сравниваемые значения двух зависимых выборок существенно не отличаются друг от друга, то число плюсовых и минусовых разностей окажется совершенно одинаковым; если же заметно преобладают плюсы или минусы, это будет указывать на положительное или отрицательное действие изучаемого фактора на результативный признак
Пример. Влияние туберкулина на состав периферической крови
Номер подопытных животных |
Эозинофилия в крови |
Эффект воздействия |
|
до введения туберкулина |
после введения туберкулина |
||
1 |
++ |
++ |
0 |
2 |
+++ |
++ |
+ |
3 |
++ |
+ |
+ |
4 |
++ |
++ |
+ |
5 |
+++ |
++ |
+ |
6 |
++ |
+++ |
- |
7 |
++ |
+ |
+ |
8 |
+ |
++ |
- |
9 |
+++ |
++ |
+ |
10 |
++ |
+ |
+ |
11 |
++ |
++ |
0 |
12 |
+++ |
+ |
+ |
13 |
++ |
+ |
+ |
14 |
++ |
+ |
+ |
Их 14 наблюдений два оказались нулевыми, n = 14 − 2 = 12.
Из этого числа положительных разностей насчитывается 10.
Следовательно, zФ = 10.
Из таблицы для n = 12 и = 5% находим zst = 10.
Равенство zФ = zst дает основание отвергнуть гипотезу Н0 на 5 % уровне значимости. Следовательно, с вероятностью 95 % можно утверждать, что введение туберкулина (реакция Манту) вызывает заметное снижение эозинофилов в периферической крови.
2.19 U - Критерий Манна-Уитни для двух независимых выборок
(U-критерий Уилкоксона)
Гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности или к совокупностям с одинаковыми параметрами т.е. Н0 – гипотезу можно проверить с помощью рангового критерия Уилкоксона.
- Расположить значения сравниваемых выборок в возрастающем порядке в один общий ряд и пронумеровать члены ряда от 1 до
N = n1 + n2 (Эти номера и будут рангами членов ряда);
Выборка 1 ( объема n1 ) |
Выборка 2 ( объема n2 ) |
||
наблюдение |
ранг |
наблюдение |
ранг |
х11 |
r11 |
х12 |
r12 |
х21 |
r21 |
х22 |
r22 |
· |
· |
· |
· |
· |
· |
· |
· |
х n1 1 |
r n1 1 |
х n2 2 |
r n2 2 |
Сумма |
R1 |
Сумма |
R2 |
Величины {хij} – реальные наблюдения. Определим n = n1 + n2. Числа { r ij } – ранги этих наблюдений. Они меняются от 1 до n.
Отдельно для каждой выборки найти суммы рангов R и определить величины U1 = R1 – n1(n1+1)/2
И U2 = R2 – n2(n2+1)/2
Которые отображают связь между суммами рангов первой и второй выборки. В качестве U критерия использовать меньшую величину Uф , которую сравнить с табличным значением Ust . Условием для сохранения принятой нулевой гипотезы служит неравенство Uф > Ust.
Вычисление значения критериальной статистики.
1) Малые выборки:
U1 = n1n2 + n1(n1+1)/2 –R1;U2 = n1n2 + n2(n2 + 1)/2 – R2; U = max (U1,U2). Нужно сравнить U с критическим значением для малых выборок.
2) Большие выборки:
Следует сравнить Т = (U – 0,5 n1n2) / { n1n2(n+1)/12 }0,5 с критическим значением для стандартного нормального распределения
Замечания: 1. Не имеет значения, как ранжируются наблюдения: от наименьшего до наибольшего или наоборот.
2. Если два или более наблюдения имеют в точности одинаковые значения, они называются совпадающими и в этом случае каждому из них следует приписать значения ранга, равное среднему из рангов, которые были бы им приписаны при отсутствии совпадений.
3. U1 + U2 = n ·n2
4. Не следует применять критерий к парным наблюдениям.
5. Если обе выборки извлечены из совокупностей, имеющих нормальные распределения с равными дисперсиями, то следует использовать более мощный критерий Стьюдента.
Пример. Уровень сывороточного холестерола
Самцы |
Самки |
||
уровень |
ранг |
уровень |
ранг |
226,5 |
9 |
221,5 |
3 |
224,1 |
7 |
230,2 |
12 |
218,6 |
1 |
223,4 |
5 |
220,1 |
2 |
224,3 |
8 |
228,8 |
10 |
230,8 |
13 |
229,6 |
11 |
223,8 |
6 |
222,5 |
4 |
|
|
Сумма рангов |
44 |
|
47 |
U1 = 26, U2 = 16 и U = 26. Эта величина не является значимой, т.к. для уровня значимости 5% критическая область определяется неравенством U ≥ 36. Принимается нулевая гипотеза о том, что средние равны.
Вариант U - критерия Манна-Уитни (U – критерия Уилкоксона)
- Отдельно для каждой выборки найти суммы рангов R и определить величины
U1 = R1 – n1(n1 + 1)/2 и U2 = R2 – n2(n2 + 1)/2 ;
- в качестве U-критерия использовать величину UФ, равную меньшей из U1 и U2, которую сравнить с табличным значением Ust. Условием для сохранения принятой Н0-гипотезы служит неравенство UФ > Ust. Критические точки U-критерия Ust для n1 , n2 и принимаемого уровня значимости α содержатся в соответствующей таблице.
2.20 T-критерий Манна-Уитни
Порядок вычисления критерия:
- Данные обеих групп объединяют и упорядочивают по возрастанию.
Ранг 1 присваивают наименьшему из всех значений, ранг 2 - следующему и т.д. Если значения совпадают, им присваивают один и тот же средний ранг.
- Для меньшей группы вычисляют Т – сумму рангов ее членов. Если численность групп одинакова, Т можно вычислить для любой из них.
- Полученное значение Т сравнивают с критическими значениями. Если Т меньше или равно первому из них либо больше или равно второму, то Н0-гипотеза отвергается (различия статистически значимы).
При
n2
≥ n1
> 8
имеет стандартное нормальное распределение
( μТ
= 0,5 n1
(n1
+ n2
+ 1) ;
-стандартное отклонение).
n1,
n2
– объемы
меньшей и большей выборок. μТ
- средняя
всех возможных значений Т.
Пример.Продолжительность бодрствования в первый час жизни, мин
По обычной методике |
Ранг |
По методике Лебуайе |
Ранг |
5,0 |
2 |
2,0 |
1 |
10,1 |
3 |
19,0 |
5 |
··· |
··· |
··· |
··· |
55,0 |
38 |
51,2 |
34 |
56,7 |
39 |
52,5 |
35 |
58,0 |
40 |
53,3 |
37 |
Сумма рангов : Т = 374 ; μТ = 20(20+20+1)/2=410 ;
и
< 1,96
2.21. T-критерий Уилкоксона для парных выборочных наблюдений
Порядок вычисления значения критериальной статистики проводят по одному из следующих двух вариантов.
Вариант 1.
а) В случае малых выборок.
- Ранжируют абсолютные величины разностей в возрастающем порядке и приписывают им соответствующие ранги от 1 до n.
- Каждому значению ранга приписывают знак его разности.
- Вычисляют сумму значений положительных рангов и обозначают ее через N.
- Проверяют, принадлежит ли N критической области (по таблице значений критерия Уилкоксона).
б) В случае больших выборок.
Вычисляют N как в п. а) и полагают
Т = {N – n·(n+1) / 4} / {n·(n+1)·(2n+1)/ 24}1/2
и проверяют по таблице стандартного нормального распределения.
Вариант 2.
- Вычисляют величины изменений наблюдаемого признака. Отбрасывают пары наблюдений, которым соответствует нулевое изменение.
- Упорядочивают изменения по возрастанию их абсолютной величины и присваивают соответствующие ранги. Рангами одинаковых величин назначают средние тех мест, которые они делят в упорядоченном ряду.
- Присваивают каждому рангу знак в соответствии с изменением: если значение увеличилось – « + », если уменьшилось – « – ».
- Вычисляют величину W , равную сумме знаковых рангов.
- Сравнивают W с критическим значением. Если она больше критического значения, изменение показателя статистически значимо. Замечание:
Если число пар наблюдений больше 20, то распределение величины
близко
к стандартному нормальному.
( здесь n – число пар наблюдений, т. е. численность групп
2.22 Общие принципы выбора уравнений регрессии. Прямая регрессия. Метод наименьших квадратов.(мне кажется, что первую часть не надо, но так в учебнике написано, а вторая часть полностью подходит)
Рассмотрим двумерную случайную величину (X, Y), где X и Y – зависимые случайные величины. Представим одну из величин как функцию другой. Ограничимся приближенным представлением величины Y в виде линейной функции величины X: g(x)=α+βX, где α и β – параметры, подлежащие определению. Это можно сделать различнами способами: наиболее употребительный из них – метод наименьших квадратов.
Функцию g(x)=α+βX называют наилучшим приближением Y в смысле метода наименьших квадратов, если математическое ожидание М (Y – g (X))2 принимает нименьшее возможное значение; функцию g(x) называют среднеквадратической регрессией Y на X.
Теорема.
Линейная
средняя квадратическая регрессия Y
на X
имеет вид:
,
где mx
= M(X),
my
= M(Y),
,
,
r
= μxy/(σxσy)
– коэффициент корреляции величин X
и Y
.
Доказательство. Введем в рассмотрение функцию двух независимых аргументов α и β: F(α, β)=M(Y-α-βX)2 .(1)
Учитывая,
что M(X-mx)
= M(Y-my)
= 0, M[(X-mx)*
(Y-my)]
= μxy
= rσx
σy,
и выполнив выкладки, получим
.
Исследуем функцию F(α, β) на экстремум, для чего приравняем нулю частные производные:
Отсюда
,
.
Легко убедиться, что при любых значения α и β рассматриваемая функция принимает наименьшее значение.
Итак, линейная средняя квадратическая регрессия Y и X имеет вид
g(x)=α+βX=
,
или
.
Коэффциент
называют коэффициентом регрессии Y
на X,
а прямую
(2) называют прямой среднеквадратической
регрессии Y
на X.
Подставив
найденные значения α и β в соотношение
(1), получим минимальное значение функции
F(α,
β), равное
.
Величину
называют остаточной дисперсией случайной
величины Y
относительно случайной величины X;
она характеризует величину ошибки,
которую допускают при замене Y
линейной функцией g(x)=α+βX.
При r
= ±1 остаточная дисперсия равна нулю;
другими словами, при этих крайних
значениях коэффициента корреляции не
возникает ошибки при представлении Y
в виде линейной функции от X.
Итак, если коэффициент корреляции r = ±1, то Y и X связаны линейной функциональной зависимостью.
Аналогично можно получить прямую среднеквадратической регрессии X на Y:
x-mx
= r
(Y-my)
(3) и остаточную дисперсию
величины X
относительно Y.
Если r = ±1, то обе прямые регрессии, как видно из (2) и (3), совпадают.
Из уравнений (2) и (3) следует, что обе прямые регрессии проходят через точку (mx; my), которую называют центром совместного распределения величин X и Y.
