- •По теории вероятностей
- •1.2 Структурные средние и способы их вычисления
- •Вопрос 1.6 Распределение «хи-квадрат», t-распределение Стьюдента, распределение f Фишера-Снедекора.
- •2. По математической статистике
- •Вопрос 2.1 Генеральная совокупность и выборка
- •Вопрос 2.2 Понятие о вариационных рядах, средняя ряда. Показатели вариации. Дисперсия, среднее квадратичное отклонение (стандартное отклонение). Оценка структурных средних.
- •2.10 Однофакторный дисперсионный анализ
- •2.11. Анализ качественных признаков
- •Примеры сравнение качественных признаков.
- •1) Тромбозы шунта при приеме плацебо и аспирина
- •2.12 Доверительный интервал для среднего.
- •2.13 Доверительный интервал для доли.
- •2.14. Определение необходимого объема выборки.
- •2.15. Повторные измерения (Парный критерий Стьюдента).
- •2.16. Критерий Крускала-Уоллиса
- •2.18 Критерий знаков z
- •Линейная регрессия и метод наименьших квадратов
- •2.23. Оценка параметров уравнения регрессии по выборке
- •2.24. Ранговый коэффициент корреляции Спирмена.
- •Вопросы прикладной (микробиологической) статистики
- •3.1 Кривая «доза-эффект»
- •Вопрос 3.2 методы количественной оценки иммуногенности вакцин.
- •Вопрос 3.3 количественный метод определения иммуногенности вакцин, основанный на испытании их постоянным уровнем
- •3.4 Количественный метод определения иммуногенности вакцин, основанный на испытании их постоянным уровнем иммунитета
- •3.5. Количественные закономерности связи между уровнем иммунитета и дозой антигена.
- •3.7 Метод Кербера.
- •3.8 Пробит-метод.
- •Вопрос 4.1 Факторы. Требования к ним.
- •Вопрос 4.2 Параметр оптимизации. Требования к нему.
- •4.3 Полный факторный эксперимент
- •Свойства матриц полного факторного эксперимента
- •Вопрос 4.5 Метод крутого восхождения.
- •Вопрос 4.6 Симплексный метод оптимизации.
- •5. Вопросы по методам математического моделирования в биологии
- •5.1 Исследование мат. Модели
- •5.2 Исследование моделей биологических систем, описываемых системами двух автономных дифференциальных уравнений.
- •Исследование устойчивости стационарных состояний моделей биологических систем.
- •5.4. Мультистационарные системы
- •5.5 Колебания в биологических системах. Предельный цикл. Теоремы, определение существование предельного цикла.
- •5.6 Анализ модели брюсселятор.
- •5.7 Модели взаимодействия двух видов
- •Вопрос 5,8 Уравнение конкуренции и их анализ ..
- •5.9 Уравнения системы «хищник – жертва» и их анализ.
- •5.10 Моделирование микробных популяций.
2.11. Анализ качественных признаков
Среднее
выборочных долей
Нормальное
распределение служит хорошим приближением,
если
и
В этом случае:
.
СРАВНЕНИЕ
ДОЛЕЙ
Критерий Z, аналогичный критерию Стьюдента t :
Z
=
Пусть
- выборочные доли.
Стандартная
ошибка разности долей:
Следовательно:
Объединяя выборки, чувствительность критерия Z можно повысить:
если
справедлива нулевая гипотеза, то
- оценки одной и той же доли, которую
можем оценить как
.
Тогда
:
или
с поправкой Йейтса на непрерывность:
Примеры сравнение качественных признаков.
1) Тромбозы шунта при приеме плацебо и аспирина
Группа |
Тромбоз есть |
Тромбоза нет |
Плацебо (25 чел.) |
18 |
7 |
Аспирин (19 чел.) |
6 |
13 |
Всего 44 чел. |
24 |
20 |
χ2 = 5,57 (без поправки 7,10)
2) Операционная летальность при галотановой и морфиновой анестезии
Группа |
Живы |
Умерли |
Галотан (61 чел.) |
53 |
8 |
Морфин (67 чел.) |
57 |
10 |
Всего 128 чел. |
110 |
18 |
χ2 = 0,09
χ2=
Замечание: С поправкой Йейтса только при ν = 1, т.е. для таблиц 2×2.
3) Частота обращения к врачу
Группа |
Обращались |
Не обращались |
Контрольная (54 чел.) |
14 |
40 |
Физкультурницы (23 чел.) |
9 |
14 |
Спортсменки (88 чел.) |
46 |
42 |
Всего 165 чел. |
69 |
96 |
χ2 = 9,63
2.12 Доверительный интервал для среднего.
(лишнее сами уберете)
Характеристика положения распределения на числовой оси называется средним. Среднее по совокупности обозначают греческой буквой μ (читается «мю») и вычисляют по формуле:
Сумма значений признака для всех
членов совокупности
Среднее по совокупности = -------------------------------------------
Число членов совокупности
Эквивалентное математическое выражение имеет вид
где X — значение признака, N — число членов совокупности. Как всегда, большая греческая буква ∑(читается «сигма») обозначает сумму.
Ясно, что для характеристики разброса все равно, в какую сторону отклоняется значение — в большую или меньшую. Иными словами, отрицательные и положительные отклонения должны вносить равный вклад в характеристику разброса. Воспользуемся тем, что квадраты двух равных по абсолютной величине чисел равны между собой, и вычислим средний квадрат отклонения от среднего. Этот показатель носит название дисперсии и обозначается σ2. Чем больше разброс значений, тем больше дисперсия. Дисперсию вычисляют по формуле:
Как видно из формулы, дисперсия измеряется в единицах, равных квадрату единицы измерения соответствующей величины. Например, дисперсия измеряемого в сантиметрах роста сама измеряется в квадратных сантиметрах. Это довольно неудобно. Поэтому чаще используют квадратный корень из дисперсии — стандартное отклонение σ (маленькая греческая буква «сигма»):
Стандартное отклонение измеряется в тех же единицах, что исходные данные.
Обследовать все объекты совокупности удается редко: обычно довольствуются изучением выборки, полагая, что эта выборка отражает свойства совокупности. Выборку, отражающую свойства совокупности, называют представительной. Имея дело с выборкой, мы, конечно, не узнаем точных значений среднего и стан дартного отклонения, но можем оценить их. Оценка среднего, вычисленная по выборке, называется выборочным средним. Выборочное среднее обозначают X и вычисляют по формуле:
где п — объем выборки.
Оценка стандартного отклонения называется выборочным стадартным отклонением (S) и определяется следующим образом:
Эта формула отличается от формулы для стандартного отклонения по совокупности. Во-первых, среднее μ заменяется его выборочной оценкой — X (с чертой наверху). Во-вторых, в знаменателе из числа членов выборки вычитается единица, т.к. разброс значений в пределах выборки никогда не бывает столь большим, как во всей совокупности, и деление не на n, а на n-1 компенсирует возникающее занижение оценки стандартного отклонения.
Величина SX служит мерой точности, с которой выборочное среднее X является оценкой среднего по совокупности μ Поэтому SX носит название стандартной ошибки среднего.
Истинная стандартная ошибка среднего по выборкам объемом n, извлеченным из совокупности, имеющей стандартное отклонение σ, равна:
Собственно стандартная ошибка — это наилучшая оценка величины σX по одной выборке:
где SX— выборочное стандартное отклонение.
Найдем доверительный интервал для среднего. Определив выборочное среднее X(c чертой наверху), мы понимаем, разумеется, что это всего лишь выборочная оценка истинного среднего μ, которое, впрочем, скорее всего находится где-то поблизости. «Где-то поблизости» можно охарактеризовать количественно, то есть указать интервал, в котором с заданной вероятностью k находится истинное среднее. Это и будет k-процентный доверительный интервал для среднего.
Примерно в 95% случаев выборочное среднее уклоняется от истинного не более чем на две стандартные ошибки среднего. Осталось внести некоторые уточнения.
Ранее мы выяснили, что величина
Разность выборочных средних - Разность истинных средних
t = ------------------------------------------------------------
Стандартная ошибка разности выборочных средних
подчиняется распределению Стьюдента. Можно показать, что
Выборочное среднее - Истинное среднее
t = ------------------------------------------------------------
Стандартная ошибка среднего
также подчиняется распределению Стьюдента. Математическая запись для последней величины выглядит так:
Дальнейший вывод аналогичен выводу доверительного интервала для разности истинных средних.
Далее вывод дов. интервала для разности истинных средних.
Критерий Стьюдента определяется как
Разность выборочных средних
t = -----------------------------------------------------------------
Стандартная ошибка разности выборочных средних
Вычислив t, его сравнивают с критическим значением tа для заданного уровня значимости α. Для двух случайных выборок из одной совокупности вероятность получить значение t, по абсолютной величине превышающее tа, весьма мала (а именно, не превышает α; уровень значимости α — это максимальная приемлемая вероятность ошибочно признать существование различий там, где их нет). Поэтому, получив «большое» значение t, мы делаем вывод о статистической значимости различий.
Для случайных выборок, извлеченных из одной совокупности, распределение всех возможных значений t (распределение Стьюдента) симметрично относительно среднего, равного нулю.
Если же выборки извлечены из двух совокупностей с разными средними, то распределение всех возможных значений t будет иметь среднее, отличное от нуля .
Формулу для t можно видоизменить так, чтобы распределение t было всегда симметрично относительно нуля:
Разность выборочных средних - Разность истинных средних
t = --------------------------------------------------------------------------------
Стандартная ошибка разности выборочных средних
Если обе выборки извлечены из одной совокупности, то разность истинных средних равна нулю и в этом случае новая формула совпадает с предыдущей.
Вот математическая запись новой формулы:
Поскольку истинных средних (то есть средних по совокупности) мы не знаем, то и вычислить значение t по этой формуле мы не можем. Но эта формула и не предназначена для нахождения t. Она позволяет сделать другое — оценить разность μ1 - μ2. то есть истинную величину различий. Для этого вместо вычисления t выберем его подходящее значение и, подставив в формулу, вы числим величину μ1 - μ2. Как выбрать «подходящее» значение?
По определению 100α процентов всех возможных значений t расположены левее -tа или правее +tа. Остальные 100(1 - α) процентов значений t попадают в интерл от -tа до +t„. Например, 95% значений t находится в интервале от -t0.05 до +t0.05 Значит, в 100(1 -а) процентах всех случаев
Преобразуя это неравенство получаем
Таким образом, разность истинных средних отличается от разности выборочных средних менее чем на произведение tа и стандартной ошибки разности выборочных средних. Это неравенство задает доверительный интервал для разности средних μ1 - μ2 K примеру, 95% доверительный интервал для разности средних определяется неравенством
В этот интервал разность истинных средних попадет в 95% случаев.
Формула 100(1 -а)-процентного доверительного интервала для среднего:
где tа — критическое значение (для уровня значимости а и числа степеней свободы V = n-1 (n — объем выборки).
Смысл доверительного интервала для среднего совершенно аналогичен смыслу доверительного интервала для разности средних. Приводя k-процентный доверительный интервал среднего, мы утверждаем, что вероятность того, что истинное среднее находится в этом интервале, равна к. Иными словами, если по лучить все возможные выборки из некоторой совокупности и для каждой рассчитать k-процентный доверительный интервал, то доля интервалов, содержащих среднее по совокупности (ис тинное среднее), составит к.
Вычислить доверительный интервал несложно, однако — ес ли объем выборки достаточно велик — можно пользоваться и приведенным выше «правилом двух стандартных ошибок». Для выборок, имеющих объем от 20 и выше, t0.05 приблизительно равно 2 (см. табл. 4.1), и мы получим достаточно точный результат. Если же объем выборки меньше 20, доверительный интервал окажется зауженным, а наше представление о точности, с какой мы можем судить об истинном среднем, — преувеличенным.
