- •Генеральная совокупность и выборка
- •Статистическое распределение выборки
- •1. Статистическое дискретное распределение. Полигон.
- •Генеральная средняя
- •Выборочная средняя
- •Включает ли ди какие-либо значения, представляющие особый интерес?
- •1. Способ оценки достоверности с помощью определения ошибок репрезентативности
- •2. Определение доверительных границ средних и относительных величин
- •Метод стандартизации
- •2. Проверка гипотезы о виде распределения
- •Задачи анализа.
- •Расчет теоретических данных.
- •Определение соответствия эмпирических и теоретических данных. Критерий χ2.
- •Критерий χ2 для произвольной таблицы.
- •Аналитические методы
- •Элементы теории корреляции
- •Линейная регрессия
- •Метод наименьших квадратов (мнк)
- •Проверка гипотезы о значимости коэффициента регрессии.
- •Корреляционный анализ.
- •Линейная корреляция
- •Выборочный коэффициент корреляции.
- •Проверка гипотезы о значимости коэффициента корреляции.
- •Проверка гипотезы о значимости коэффициента регрессии.
- •Проверка гипотезы о значимости коэффициента корреляции.
Определение соответствия эмпирических и теоретических данных. Критерий χ2.
Критерий χ2 для произвольной таблицы.
Для принятия или отклонения нулевой гипотезы используется непараметрический критерий χ2. Общая формула для вычисления критерия , где О – фактически наблюдаемое число, Е – теоретически ожидаемое число.
Следовательно, чтобы определить χ2 необходимо:
Найти ожидаемые величины;
Определить разности (отклонения) между фактическими и ожидаемыми величинами;
Возвести эти разности в квадрат;
Разделить полученные квадраты разностей на ожидаемые величины;
Суммировав результаты деления, получить χ2.
Полученную величину χ2 необходимо оценить, сравнив ее с табличными значениями, которые зависят от числа степеней свободы df и принятого уровня значимости. df =(число строк - 1)*(число столбцов - 1). Для таблицы 2х2 df =(2 - 1)*(2 - 1)=1.
Нулевая
гипотеза отвергается, если вычисленная
величина χ2
больше
табличного значения χ2 при уровне
значимости 0,01, т.е.
.
И принимается, если
.
При полном совпадении эмпирических и теоретических величин χ2 равен нулю. По мере увеличения различий между сравниваемыми частотами значение χ2 возрастает.
Критерий χ2 для таблицы 2х2.
|
+ |
- |
итого |
+ |
a |
b |
a+b |
- |
c |
d |
c+d |
всего |
a+c |
b+d |
a+b+c+d=n |
В
таблице 2х2 расчет χ2
можно
производить также по следующей формуле:
.
Указанная формула не требует определения ожидаемых величин.
Если
в таблице 2х2 число наблюдений хотя бы
в одной клетке меньше четырех, рекомендуется
вводить поправку
Йейтса:
.
5 пример. Руководствуясь тем, что аспирин препятствует образованию тромбов, Г.Харатер решил проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут.). Было проведено контролируемое испытание. Все больные, согласившиеся принять участие в испытании и не имевшие противопоказаний к аспирину, были случайным образом разделены на 2 группы: 1-я получала плацебо, 2-я – аспирин. Ни врач, дававший больному препарат, ни больной не знали, был это аспирин или плацебо. Такой способ проведения испытания (он называется «двойным слепым») исключает «подсуживание» со стороны врача или больного и, хотя он технически сложен, дает наиболее надежные результаты. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.
В 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й – у 6 из 19. Можно ли говорить о статистически значимом различии доли больных тромбозом, а тем самым об эффективности аспирина?
Н0 – аспирин не снижает риск тромбоза (существенные различия отсутствуют между сравниваемыми данными).
Н1 – аспирин снижает риск тромбоза (существенные различия присутствуют между сравниваемыми данными).
Занесем результаты испытания в таблицу.
1 таблица.
Препарат |
Тромбоз есть |
Тромбоза нет |
Плацебо |
18 |
7 |
Аспирин |
6 |
13 |
Во всех клетках больше 5-ти значений, следовательно, можно применять критерий хи-квадрат.
Числа, расположенные на диагонали, идущей из верхнего левого в нижний правый угол, заметно больше, чем числа в других клетках таблицы. Это наводит на мысль связи между приемом аспирина и риском тромбоза.
2 таблица
Препарат |
Тромбоз есть |
Тромбоза нет |
|
Плацебо |
18 |
7 |
25 |
Аспирин |
6 |
13 |
19 |
|
24 |
20 |
44 |
Вычислим ожидаемые числа, которые мы получили бы, если бы аспирин не влиял на риск тромбоза.
3 таблица.
Препарат |
Тромбоз есть |
Тромбоза нет |
|
Плацебо |
13,64 |
11,36 |
25 |
Аспирин |
10,36 |
8,64 |
19 |
|
24 |
20 |
44 |
.
Степень
свободы df
определяется размерностью таблицы:
,
где r
– число строк,
s-
число столбцов. В нашем примере
df=(2-1)(2-1)
=1.
Применим поправки Йейтса, так как таблица сопряженности размерности 2х2:
При уровне значимости α=0,05 и степени свободы df=1 имеем, что набл> крит. Следовательно, нулевая гипотеза отвергается и можно утверждать, что использование аспирина эффективно снижает риск тромбоза.
ЛИТЕРАТУРА:
Медик В.А.,Токмачев М.С.,Фишман Б.Б.Статистика в медицине и биологии. М.:
Медицина, 2000.
Лукьянова Е.А. Медицинская статистика.- М.: Изд. РУДН, 2002.
Рокицкий П.Ф. Биологическая статистика.- Высшая школа, 1973.
Задания.
t-критерий Стьюдента для независимых выборок
Препарат из группы антагонистов кальция, нифедипин, обладает способностью расширять сосуды, и его применяют при лечении ишемической болезни сердца. Измеряли диаметр коронарных артерий после приема нифедипина и плацебо и получили следующие две выборки данных диаметра коронарной артерии (в мм).
Плацебо: 2,5; 2,2; 2,6; 2,0; 2,1; 1,8; 2,4; 2,3; 2,7; 2,7.
Нифедипин: 2,5; 1,7; 1,5; 2,5; 1,4; 1,9; 2,3; 2,0; 2,6; 2,3; 2,2.
Позволяют ли приведенные данные полагать, что нифедипин влияет на диаметр коронарных артерий?
2. t-критерий Стьюдента для независимых выборок
Стремясь отделить действие тетрагидроканнабинолов от действия дыма, исследователи изучили их действие при внутривенном введении. После ингаляционного введения бактерий крысам вводили спиртовой раствор тетрагидроканнабинолов, контрольной группе вводили этиловый спирт. В обеих группах было по 36 животных. После введения тетрагидроканнабинолов доля погибших бактерий составила в среднем 51,4%, в контрольной группе – 59,4%. Стандартные ошибки среднего составили соответственно 3,2% и 3,9%. Позволяют ли эти данные утверждать, что тетрагидроканнабинолы ослабляют антибактериальную защиту?
3 . t-критерий Стьюдента для зависимых выборок
Скорость выделения слюны у детей (мл/мин.):
До операции |
0,18 |
0,19 |
0,14 |
0,22 |
0,15 |
0,17 |
После операции |
0,2 |
0,22 |
0,16 |
0,26 |
0,15 |
0,18 |
Считая, что выборка распределена нормально, определите статистически значимое различие между средними выборок.
4. U-критерий Манна-Уитни
Исследуется эффективность препарата, позволяющего сбросить лишнюю массу больным, страдающим ожирением. При этом группе добровольцев предписана определенная диета. Через месяц подобного режима, соблюдения диеты и регулярного приема препарата фиксируется величина потерянной массы в килограммах. Для проведения эксперимента отобрана группа из 8 добровольцев, причем из них действительно получали исследуемый препарат (экспериментальная группа), а 5 довольствовались плацебо (контрольная группа).
Экспериментальная группа (потерянная масса в кг) |
6,2 |
3,0 |
3,9 |
|
|
Контрольная группа (потерянная масса в кг) |
4,0 |
-0,5 |
3,3 |
1,5 |
3,0 |
Проверить гипотезу о неэффективности препарата.
5. Т-критерий Уилкоксона
В результате проведения исследования были получены 2 вариационных ряда по толщине слоя эмали в микронах до и после воздействия кислоты:
До |
0,16 |
0,129 |
0,135 |
0,15 |
0,125 |
0,13 |
После |
0,195 |
0,178 |
0,166 |
0,16 |
0,11 |
0,12 |
Считая, что выборка не подчиняется нормальному закону распределения, определите статистически значимое различие между выборками.
6. Критерий согласия Пирсона.
1000 человек классифицировали по признаку дальтонизма. По приведенным ниже данным проверить, есть ли зависимость между наличием дальтонизма и полом человека, при α=0,05.
-
Мужчины
Женщины
Дальтоники
38
6
Не дальтоники
442
514
7. Критерий согласия Пирсона.
Синдром внезапной детской смерти – основная причина смерти детей в возрасте от 1 недели до 1 года. Обычно смерть наступает на фоне полного здоровья незаметно, во сне, поэтому определение факторов риска имеет первостепенное значение. Считается, что синдром внезапной детской смертности чаще случается у недоношенных детей, негров, а также в семьях с низкими доходами. Исследователи собрали сведения о 19047 детях, родившихся в одном из роддомов Окленда, штат Калифорния, с 1960 по 1967 г. Судьбу детей проследили до одного года. Данных о 48 детях получить не удалось. От синдрома внезапной детской смертности умерли 44 ребенка. Проверить связана ли раса с риском синдрома внезапной детской смертности.
Раса |
синдром внезапной детской смертности |
|
+ |
- |
|
Белые |
31 |
12240 |
Негры |
9 |
4323 |
Другие |
4 |
2153 |
Основы дисперсионного анализа
Дисперсионный анализ был разработан в 20-х годах ХХ-го столетия английским математиком и генетиком Рональдом Фишером.
Это метод анализа для сравнения средних более чем двух групп. В центре внимания метода находится дисперсия, то есть мера изменчивости признаков.
Базовая идея Д.А. заключается в разложении общей диперсии изучаемых признаков на сооставляющие. Д.А. являетсяпараметрическим методом и предполагает, что выборки извлечены из совокупности, распределенной по нормальному закону.
Д.А. позволяет ответить на вопрос, равны ли все сравниваемые средние.
ОПРЕДЕЛЕНИЕ: То, что оказывает влияние на конечный результат, называется фактором или факторами если их несколько.
ОПРЕДЕЛЕНИЕ: Конкретную реализацию фактора называют уровнем фактора.
ОПРЕДЕЛЕНИЕ: Значение измеряемого признака называют откликом.
Для сравнения влияния факторов на результат необходим определенный статистический материал. Обычно его получают следующим образом: каждый k способов обработки применяют несколько раз к исследуемому объекту и регистрируют результаты. Итогом подобных испытаний являются k выборок разных объемов.
ОПРЕДЕЛЕНИЕ: Дисперсионным анализом называют группу статистических методов предназначенных для исследования двух и более выборок путем сравнения выборочных дисперсий.
ОПРЕДЕЛЕНИЕ: В зависимости от количества изучаемых факторов различают однофакторный и многофакторный дисперсионные анализы.
Дисперсионный анализ применяют для изучения влияния факторов, характеризующихся несколькими уровнями.
Пусть имеются генеральные совокупности X1,X2,…,Xk такие что
- все k генеральных совокупностей распределены нормально;
- дисперсии всех генеральных совокупностей одинаковы.
При этих условиях и заданном уровне значимости α требуется проверить нулевую гипотезу равенства средних.
H0:
(1)
Таким образом, извлекая из каждой генеральной совокупности по выборке, требуется установить значимость или незначимость различия полученных k выборочных средних.
Можно предполагать, что все k генеральных совокупностей в чистом виде идентичны, т.е. имеют не только равные дисперсии, но и одинаковые средние значения. Однако каждая из генеральных совокупностей подвержена влиянию одного или нескольких качественных факторов, входящих в эксперимент, которые могут изменять средние значения наших генеральных совокупностей.
Основная идея дисперсионного анализа состоит в разбиении этой выборочной дисперсии на две компоненты, одна из которых соответствует влиянию фактора на изменчивость средних значений (факторная дисперсия), а вторая обусловлена случайными причинами и не влияет на изменчивость средних (остаточная дисперсия).
ОПРЕДЕЛЕНИЕ: Выборочная дисперсия которая соответствует влиянию фактора на изменчивость средних значений называется факторной дисперсией.
ОПРЕДЕЛЕНИЕ: Выборочная дисперсия, обусловленная случайными причинами и не влияющая на изменчивость средних называется остаточной дисперсией.
Дальнейшее сравнение с помощью критерия Фишера этих компонент позволяет численно оценить влияние исследуемого фактора.
Источник вариации, дисперсии |
Сумма квадратов (отклонений) |
Число степеней свободы |
Средний квадрат MS |
|
|
Межгрупповая (фактор А) |
|
k-1 |
|
|
|
Внутригрупповая (остаточная) |
|
k(r-1) |
|
|
|
Общая |
|
kr-1 |
|
|
|
В случае нескольких факторов идея дисперсионного анализа остается той же (сравнение факторных и остаточной дисперсий), но усложняется.
ОПРЕДЕЛЕНИЕ: Общей суммой квадратов отклонений называют сумму
(3)
где
общая средняя для всей выборки объема
n.
ОПРЕДЕЛЕНИЕ: Факторной суммой квадратов отклонений называют сумму
(4)
Сумма
характеризует отклонения групповых
средних.
ОПРЕДЕЛЕНИЕ: Остаточной суммой квадратов отклонений называют сумму
(5)
Сумма
характеризует степень рассеяния
значений внутри групп.
Смысл введенных SS:
Если
фактор А на каком –то уровне оказывает
влияние на признак Х, то в выборке,
соответствующей этому уровню, он
изменяет групповую среднюю, и эта
групповая средняя
будет отличаться от общей средней
тем
сильнее,
чем больше воздействие фактора. А чем
больше различие групповой средней и
общей средней, тем больше и величина
.
Оказывается, имеет место прямая
зависимость степени воздействия фактора
и величины
.
Для введенных сумм квадратов справедливо равенство.
(6)
Для исследования влияния фактора на групповые средние можно использовать найденные суммы квадратов отклонений, однако более удобным представляется переход от SS к средним квадратам отклонений. Средний квадрат принято обозначать MS(Mean Sqare).
-общая
дисперсия (7)
где n-1 число степеней свободы, n-суммарное количество значений во всех к группах.
-
факторная дисперсия (8)
где к-1 число степеней свободы, к- количество групп (количество уровней фактора)
остаточная
дисперсия (9)
где к(r-1) число степеней свободы для , к-количество групп, r-количество значений в каждой группе.
Для вычисления SS формулы можно преобразовать к более простому виду.
где
,
(10)
(11)
(12)
Методика проведения дисперсионного анализа.
Формулируем нулевую и альтернативную гипотезы:
Н0: групповые генеральные средние равны a1=a2=…=ak, а также различие выборочных средних получилось случайно, реального влияния фактор не оказывает
H1: различие между выборочными средними не случайно и обусловлено влиянием фактора.
2. Задается уровень значимости α (например, α=0,05 или α=0,01)
3.
Вычисляются
и
Если
,
то признается нулевая гипотеза
Если
,
то вычисляется функция
(статистика,
которая имеет распределение Фишера)
4. После вычисления находится по таблицам критических значений распределения Фишера.
должно соответствовать числам степеней свободы k-1 и k(r-1) соответственно.
5. Сравниваются и . Если < , то при заданном уровне значимости нулевая гипотеза Н0 принимается и делают вывод, что фактор не влияет существенно на средние значения. Если > , то нулевая гипотеза отвергается и влияние фактора признается существенным.
6. Таким образом, поведение статистики F, являющейся критерием, напрямую связано с принятием или отвержением нулевой гипотезы о равенстве средних, расчитанных по выборкам. Также отметим, что критерий F называют дисперсионным отношением. Результат дисперсионного анализа сводят в таблицу.
Таблица дисперсионного анализа
Пример: Влияние курения на заболеваемость дыхательных путей.
Среди взрослого населения определенной возрастной категории фиксировалось число заболеваний дыхательных путей за два года. Цель исследования статистическое доказательство влияния курения на заболеваемость органов дыхания. Случайным образом были отобраны 3 группы по 4 человека каждая , из них: І-группа-некурящие; ІІ- стаж курильщика до 5 лет, ІІІ группа-стаж курильщика более 5 лет.
Таким образом, исследуемый фактор А-курение, уровни фактора, А1 А2 А3 –стаж курильщика. Отклик на фактор курения –число заболеваний дыхательных путей. Были получены 12 значений количества заболеваний- это значения хij , где j-номер уровня фактора (j=1,2,3), i-номер элемента в соответствующей выборке, i=1,2,3,4:
(16)
Предполагаем,
что
выборка из нормальной генеральной
совокупности.
Проведем дисперсионный анализ для установления влияния фактора курения на заболеваемость органов дыхания.
Формулируем гипотезы:
H0- курение не влияет на заболеваемость органов дыхания
H1-курение существенно влияет на заболеваемость органов дыхания.
Таблица 1
Номер испытания |
Уровень фактора |
||
A1 |
A2 |
A3 |
|
1 2 3 4 |
1 0 1 2 |
3 2 2 1 |
3 4 5 3 |
|
T1=4
R1=6
|
T2=8
R2=18
|
T3=15
R3=59
|
Для вычисления SS используем формулы (3-5) или (10-12).
1 метод |
2 метод |
T1=1+0+1+2=4 T2=3+2+2+1=8 T3=3+4+5+3=15
R1=12+02+12+22=6 R2=32+22+22+12=18 R3=32+42+52+32=59 R=6+18+59=83 Тогда
|
|
,
Найдем число степеней свободы для каждой суммы квадратов MS по формулам (7-9).
Полученные значения занесем в таблицу дисперсионного анализа (таблица 4), в которой также кстати привести наблюдаемое и критическое значения критерия Ғ.
Число
степеней свободы для
:
n-1=12-1=11
: k-1=2
: k(r-1)=3(4-1)=9
Составим таблицу
Таблица 2
Источник вариации |
Сумма квадратов SS |
Число степеней свободы df |
Средний квадрат MS |
|
|
Межгрупповая (фактор А) Случайные отклонения (остаточная) |
15,5
6,75 |
2
9 |
7,75
0,75 |
|
|
Общая |
22,25 |
11 |
- |
|
|
Как видим из таблицы, значения критерия , оказалось большим, чем , как при уровне значимости α=0,05, так и при α=0,01, то есть наблюдаемое значение критерия попало в критическую область, и, следовательно,нулевую гипотезу о равенстве групповых средних нужно отвергнуть. Вывод: фактор курения значимо влияет на заболеваемость дыхательных путей.
Задание. Получены следующие данные о плодовитости мышей при облучении рентгеновыми лучами:
Группы |
Число мышат от отдельных самок |
|||
Контроль |
10 |
12 |
11 |
10 |
Доза 100 р |
8 |
10 |
7 |
9 |
Доза 200 р |
7 |
9 |
6 |
4 |
Влияет ли облучение на плодовитость мышей?
АНАЛИЗ ВЫЖИВАЕМОСТИ
ОПРЕДЕЛЕНИЕ: Наблюдения, которые содержат неполную информацию, называются цензурированными наблюдениями (например, "пациент A был жив, по крайней мере, 4 месяца до того, как был переведен в другую клинику и контакт с ним был потерян"). Использование, в том числе и цензурированных наблюдений, составляет специфику рассматриваемых здесь методов (термин цензурирование был впервые использован в 1949г).
|
В общем, цензурированные наблюдения типичны, когда наблюдаемая величина представляет время до наступления некоторого критического события, а продолжительность наблюдения ограничена по времени.
ОПРЕДЕЛЕНИЕ: Время жизни – это время до появления некоторого заранее определенного события. Например, таким событием может быть развитие заболевания, реакция на лечение, рецидив (повторение) или смерть.
Т.о. временем жизни может быть время до начала развития заболевания, время от начала лечения до реакции на него, время ремиссии (от начала улучшения здоровья до рецидива), время до смерти.
ОПРЕДЕЛЕНИЕ: Исследование называется полным – если нет цензурированных данных.
Требования, которым должны удовлетворять все исследования выживаемости:
1. Для всех исследуемых известно время начала наблюдения.
2. Для всех исследуемых известно время окончания наблюдения, а также – наступило событие или исследуемый выбыл.
3. Выбор наблюдаемых произведен случайно.
