- •Тема. Числовые характеристики дискретного статистического распределения: выборочное среднее, выборочная дисперсия, среднее квадратичное отклонение, мода, медиана Базовые вопросы к теме
- •Дидактический блок
- •Работа с преподавателем
- •Базовые вопросы к теме
- •Информационно-дидактический блок Параметрические критерии для проверки гипотезы о различии (или сходстве) между средними значениями
- •Определение достоверности различия двух зависимых выборочных совокупностей.
- •Тема: Непараметрические критерии проверки статистических гипотез.
- •Информационно-дидактический блок
- •Тема: Анализ качественных признаков. Таблицы сопряженности
- •Информационно-дидактический блок
- •Тема: Линейная корреляция.
- •Информационно-дидактический блок
- •Коэффициент корреляции Пирсона
- •Коэффициент корреляции рангов к. Спирмена
- •Тема: Линейная регрессия
- •Тема: Дисперсионный анализ. Метод однофакторного дисперсионного анализа.
- •Тема: Статистические методы в эпидемиологическом анализе Метод стандартизованных коэффициентов
- •Тема: Метод анализа выживаемости
- •Примерный вариант заданий к рубежному контролю №1
- •Примерный вариант заданий к рубежному контролю №2
- •Задания по срс
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ СТУДЕНТОВ
по
БИОСТАТИСТИКЕ
ТЕМА: Анализ медико-биологических данных на основе их графического представления.
Правило построения гистограмм:
Элементы выборки объемом n расположить в ранжированный ряд (по возрастанию или убыванию)
Вычислить размах (разность между минимальным и максимальным значением случайной величины)
Разбить вариационный ряд на k непересекающихся интервалов. k выбирают произвольно в пределах от 6 до 15 или вычисляют по формуле Стерднесса, предусматривающую выделение оптимального числа интервалов:
k=1+3.322lg(n) (округлить до целого)
Определить длину одного интервала
Определить границы каждого интервала
Определить частоты - количество ni элементов выборки, попавших в i-й интервал (элемент, совпадающий с правой границей интервала, относится к последующему интервалу)
Наряду с частотами одновременно подсчитываются также накопленные частоты, относительные частотыи накопленные относительные частоты,i=1, 2, …, k.
Полученные результаты сводятся в таблицу, называемую таблицей частот группированной выборки.
Номер интервала, i |
Границы интервала |
Частота, nj |
Накопленная частота, |
Относительная частота |
Накопленная относительная частота , |
Для наглядного представления выборки используют гистограмму.
Гистограммой частот группированной выборки называется функция, постоянная на интервалах группировки, обычно по оси ординат откладывают значения частот nj (или относительная частота или проценты)
Работа с преподавателем.
Задача: Даны значения систолического артериального давления у 20 испытуемых. Представить выборку в виде таблицы частот и построить гистограмму.
110, 115, 130, 105, 110, 115, 115, 120, 120, 125, 125, 125, 110, 100, 105, 120, 120, 130, 135, 140
Номер интервала, i |
Границы интервала |
Частота, nj |
Накопленная частота, |
Относительная частота |
Накопленная относительная частота , |
2) Для наглядного представления выборки используют гистограмму.
Гистограммой частот группированной выборки называется функция, постоянная на интервалах группировки, обычно по оси ординат откладывают значения частот nj
Строим гистограмму частот:
В данном случае исследуемый признак – это систолическое артериальное давление, которое является случайной величиной X (x1, x2, x3 …..xi…… xn)
Этот график дает нам информацию о распределении случайной величины и носит название гистограммы распределения. Он показывает, насколько часто встречаются те или иные значения случайной величины.
По оси ординат могут откладываться
Абсолютная частота встречаемости
Процент относительно общего объема выборки
Относительная частота встречаемости
Огибающая гистограммы дает нам качественное представление о функции плотности распределения случайной величины (иногда просто говорят, распределение). Эта функция характеризует вероятность того, что случайная величина примет то или иное значение. Существует множество различных функций плотности распределения. Наиболее распространенным является нормальное распределение – оно имеет симметричный колоколообразный вид.
Самостоятельная работа: Согласно своему варианту для случайной величины из таблицы данных построить гистограмму распределения. Описать полученные результаты.
ВАРИАНТ | ||||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
Рост, см |
Рост, см |
Содержание Р в слюне, ммоль\л |
Содержание Р в слюне, ммоль\л |
Вес, кг |
Вес, кг |
Объем циркулирующей плазмы, мл\кг |
Объем циркулирующей плазмы, мл\кг |
Пульс, уд\мин |
Пульс, уд\мин |
Показатель гематокрита |
Показатель гематокрита |
Концентрация пролактина в крови (нг/мл) |
Содержание андростеронов в моче (мг/сутки) |
Концентрация пролактина в крови (нг/мл) |
196 |
167 |
7 |
2,2 |
65 |
58 |
45 |
34 |
66 |
76 |
0,26 |
0,48 |
25 |
0,82 |
36 |
175 |
177 |
3,7 |
4,5 |
70 |
70 |
36 |
32 |
72 |
72 |
0,12 |
0,1 |
120 |
0,9 |
120 |
181 |
165 |
5,5 |
4,7 |
75 |
75 |
37 |
39 |
77 |
82 |
0,2 |
0,22 |
75 |
0,98 |
88 |
181 |
195 |
3,1 |
2,3 |
68 |
88 |
38 |
42 |
80 |
80 |
0,28 |
0,16 |
50 |
1,06 |
50 |
184 |
181 |
3,9 |
3,8 |
92 |
92 |
41 |
46 |
58 |
90 |
0,29 |
0,41 |
185 |
1,2 |
166 |
154 |
194 |
4,5 |
5,7 |
88 |
81 |
42 |
41 |
75 |
75 |
0,21 |
0,23 |
125 |
1,29 |
125 |
173 |
178 |
5,7 |
2,9 |
76 |
76 |
26 |
38 |
82 |
88 |
0,45 |
0,14 |
70 |
1,48 |
82 |
169 |
177 |
4 |
5,9 |
73 |
66 |
31 |
28 |
78 |
78 |
0,38 |
0,33 |
145 |
1,42 |
145 |
169 |
191 |
3,7 |
3,1 |
77 |
77 |
35 |
39 |
71 |
76 |
0,29 |
0,34 |
170 |
1,4 |
144 |
163 |
175 |
6 |
6,7 |
102 |
90 |
40 |
27 |
62 |
62 |
0,24 |
0,35 |
80 |
1,08 |
80 |
174 |
155 |
3,8 |
4,4 |
85 |
85 |
43 |
43 |
78 |
66 |
0,27 |
0,27 |
110 |
1,11 |
57 |
192 |
175 |
5,4 |
4,7 |
69 |
100 |
36 |
33 |
76 |
76 |
0,18 |
0,24 |
87 |
1,32 |
87 |
176 |
165 |
6,1 |
3,6 |
70 |
70 |
37 |
44 |
82 |
80 |
0,23 |
0,3 |
115 |
1,12 |
99 |
177 |
170 |
3,9 |
6,9 |
77 |
52 |
36 |
34 |
82 |
82 |
0,3 |
0,17 |
130 |
1,26 |
130 |
177 |
161 |
4,4 |
5,6 |
82 |
82 |
30 |
40 |
66 |
85 |
0,32 |
0,11 |
58 |
0,88 |
69 |
180 |
178 |
5,6 |
3,5 |
66 |
77 |
26 |
31 |
60 |
78 |
0,18 |
0,15 |
122 |
1,16 |
122 |
177 |
178 |
3,8 |
6,4 |
75 |
75 |
44 |
26 |
75 |
75 |
0,42 |
0,3 |
78 |
1,3 |
80 |
155 |
176 |
2,4 |
3 |
69 |
88 |
30 |
33 |
78 |
75 |
0,36 |
0,28 |
110 |
1,2 |
110 |
174 |
178 |
2,5 |
6,6 |
83 |
83 |
40 |
36 |
72 |
72 |
0,26 |
0,4 |
66 |
0,84 |
70 |
167 |
185 |
3,6 |
4,7 |
74 |
70 |
31 |
37 |
68 |
80 |
0,29 |
0,23 |
92 |
0,96 |
92 |
Задание 1.Опишите гистограмму с указанием:
минимального и максимального значения анализируемой величины,
наиболее часто и редко встречающегося значения анализируемой величины (в процентах)
в каких пределах в основном лежит анализируемая величина (При описании приведите цифровые данные в процентах.
укажите сколько было всего обследованных.
дайте качественную оценку функции плотности распределения данной случайной величины (нормальное или отличное от нормального).
Тема. Числовые характеристики дискретного статистического распределения: выборочное среднее, выборочная дисперсия, среднее квадратичное отклонение, мода, медиана Базовые вопросы к теме
Цели биостатистики, предмет биостатистики
Применение статистического анализа в медицинских исследованиях
Понятие случайной величины
Генеральная совокупность и выборка
Классификация признаков: количественные и качественные признаки
Правила построения гистограмм
Дидактический блок
Среднее значение ()– характеристика положения значений случайной величины на оси измерений
Дисперсия (D) – характеристика разброса значений случайной величины относительно среднего значения
Среднеквадратичное отклонение (стандартное отклонение) – тоже, что и дисперсия, введена для того, чтобы избавиться от квадрата единицы измерения
Так как среднее значение, как правило, определяется по ограниченной выборке, а не по генеральной совокупности, то оно отличается от истинной (генеральной) средней, то есть имеет определенную ошибку, называемой ошибкой средней (стандартная ошибка)
Мода (Мо) – наиболее часто встречающееся значение случайной величины. Для того, чтобы определить моду все значения выборки выстраиваются в ранжированный ряд (по возрастанию или по убыванию). Может быть несколько значений моды.
По ранжированному ряду находим и медиану (Ме) – это значение случайной величины, которое делит выборку на две равные части. Если число объектов выборки четное, то медиана равна среднему двух соседних значений.
Нижний квартиль Q25 – это значение случайной величины, ниже которого находится 25% выборки.
Верхний квартиль Q75 – это значение случайной величины, выше которого находится 25% выборки.
Межквартильный (интерквартильный) размах – это разница Q75- Q25
50 % данных лежит в пределах от нижнего до верхнего квартилей.
Для нахождения квартилей необходимо ранжировать данные.
Работа с преподавателем
Анализ роста мальчиков | ||||||||||||
n=11 |
х1 |
х2 |
х3 |
х4 |
х5 |
х6 |
х7 |
х8 |
х9 |
х10 |
х11 |
∑ |
Рост мальч. |
184 |
178 |
164 |
170 |
168 |
172 |
182 |
175 |
170 |
188 |
170 |
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
|
|
| |
Dх |
|
|
|
|
|
|
|
|
|
|
|
|
σх |
|
|
|
|
|
|
|
|
|
|
|
|
mх |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ранж. ряд |
|
|
|
|
|
|
|
|
|
|
|
|
Мо |
|
|
|
|
|
|
|
|
|
|
|
|
Ме |
|
|
|
|
|
|
|
|
|
|
|
|
Q25 |
|
|
|
|
|
|
|
|
|
|
|
|
Q75 |
|
|
|
|
|
|
|
|
|
|
|
|
Q75- Q25 |
|
|
|
|
|
|
|
|
|
|
|
|
Анализ роста девочек | ||||||||||||
n=11 |
y1 |
y2 |
y3 |
y4 |
y5 |
y6 |
y7 |
y8 |
y9 |
y10 |
y11 |
∑ |
Рост девоч. |
165 |
168 |
164 |
163 |
165 |
160 |
165 |
166 |
169 |
167 |
168 |
1820 |
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
|
|
| |
Dy |
|
|
|
|
|
|
|
|
|
|
|
|
σy |
|
|
|
|
|
|
|
|
|
|
|
|
my |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ранж. ряд |
|
|
|
|
|
|
|
|
|
|
|
|
Мо |
|
|
|
|
|
|
|
|
|
|
|
|
Ме |
|
|
|
|
|
|
|
|
|
|
|
|
Q25 |
|
|
|
|
|
|
|
|
|
|
|
|
Q75 |
|
|
|
|
|
|
|
|
|
|
|
|
Q75- Q25 |
|
|
|
|
|
|
|
|
|
|
|
|
Самостоятельная работа: Согласно своему варианту для случайной величины из таблицы данных вычислить среднюю, дисперсию, стандартное отклонение, ошибку средней, моду, медиану, нижний и верхний квартиль, интерквартильный размах. Представить данные в графическом виде.
ВАРИАНТ | ||||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
Рост, см |
Рост, см |
Содержание Р в слюне, ммоль\л |
Содержание Р в слюне, ммоль\л |
Вес, кг |
Вес, кг |
Объем циркулирующей плазмы, мл\кг |
Объем циркулирующей плазмы, мл\кг |
Пульс, уд\мин |
Пульс, уд\мин |
Показатель гематокрита |
Показатель гематокрита |
Концентрация пролактина в крови (нг/мл) |
Содержание андростеронов в моче (мг/сутки) |
Концентрация пролактина в крови (нг/мл) |
196 |
167 |
7 |
2,2 |
65 |
58 |
45 |
34 |
66 |
76 |
0,26 |
0,48 |
25 |
0,82 |
36 |
175 |
177 |
3,7 |
4,5 |
70 |
70 |
36 |
32 |
72 |
72 |
0,12 |
0,1 |
120 |
0,9 |
120 |
181 |
165 |
5,5 |
4,7 |
75 |
75 |
37 |
39 |
77 |
82 |
0,2 |
0,22 |
75 |
0,98 |
88 |
181 |
195 |
3,1 |
2,3 |
68 |
88 |
38 |
42 |
80 |
80 |
0,28 |
0,16 |
50 |
1,06 |
50 |
184 |
181 |
3,9 |
3,8 |
92 |
92 |
41 |
46 |
58 |
90 |
0,29 |
0,41 |
185 |
1,2 |
166 |
154 |
194 |
4,5 |
5,7 |
88 |
81 |
42 |
41 |
75 |
75 |
0,21 |
0,23 |
125 |
1,29 |
125 |
173 |
178 |
5,7 |
2,9 |
76 |
76 |
26 |
38 |
82 |
88 |
0,45 |
0,14 |
70 |
1,48 |
82 |
169 |
177 |
4 |
5,9 |
73 |
66 |
31 |
28 |
78 |
78 |
0,38 |
0,33 |
145 |
1,42 |
145 |
169 |
191 |
3,7 |
3,1 |
77 |
77 |
35 |
39 |
71 |
76 |
0,29 |
0,34 |
170 |
1,4 |
144 |
163 |
175 |
6 |
6,7 |
102 |
90 |
40 |
27 |
62 |
62 |
0,24 |
0,35 |
80 |
1,08 |
80 |
174 |
155 |
3,8 |
4,4 |
85 |
85 |
43 |
43 |
78 |
66 |
0,27 |
0,27 |
110 |
1,11 |
57 |
192 |
175 |
5,4 |
4,7 |
69 |
100 |
36 |
33 |
76 |
76 |
0,18 |
0,24 |
87 |
1,32 |
87 |
176 |
165 |
6,1 |
3,6 |
70 |
70 |
37 |
44 |
82 |
80 |
0,23 |
0,3 |
115 |
1,12 |
99 |
177 |
170 |
3,9 |
6,9 |
77 |
52 |
36 |
34 |
82 |
82 |
0,3 |
0,17 |
130 |
1,26 |
130 |
177 |
161 |
4,4 |
5,6 |
82 |
82 |
30 |
40 |
66 |
85 |
0,32 |
0,11 |
58 |
0,88 |
69 |
180 |
178 |
5,6 |
3,5 |
66 |
77 |
26 |
31 |
60 |
78 |
0,18 |
0,15 |
122 |
1,16 |
122 |
177 |
178 |
3,8 |
6,4 |
75 |
75 |
44 |
26 |
75 |
75 |
0,42 |
0,3 |
78 |
1,3 |
80 |
155 |
176 |
2,4 |
3 |
69 |
88 |
30 |
33 |
78 |
75 |
0,36 |
0,28 |
110 |
1,2 |
110 |
174 |
178 |
2,5 |
6,6 |
83 |
83 |
40 |
36 |
72 |
72 |
0,26 |
0,4 |
66 |
0,84 |
70 |
167 |
185 |
3,6 |
4,7 |
74 |
70 |
31 |
37 |
68 |
80 |
0,29 |
0,23 |
92 |
0,96 |
92 |
ТЕМА: t-критерий Стьюдента для анализа биомедицинских данных