- •1 СТАТИСТИЧЕСКАЯ ОБРАБОТКА БИОМЕДИЦИНСКОЙ ИНФОРМАЦИИ
- •1.1 Биомедицинская информация и способы ее получения
- •1.2 Организация медико-статистических исследований
- •1.3 Относительные величины
- •1.4 Статистическая обработка вариационного ряда
- •1.4.1 Основные понятия и определения
- •1.4.2 Методика составления вариационного ряда
- •1.4.3 Методика статистической обработки вариационного ряда при нормальном законе распределения вариант
- •1.4.4 Расчет статистических характеристик при малом числе наблюдений
- •1.5 Выборочный метод исследований
- •1.5.1 Формирование выборочной совокупности
- •1.5.2 Определение объема выборочной совокупности
- •1.5.3 Сравнение средних арифметических величин двух выборок из совокупности с нормальным распределением вариант
- •1.6 Основы дисперсионного анализа
- •1.6.1 Общие положения
- •1.6.2 Методика однофакторного дисперсионного анализа
- •1.6.3 Методика двухфакторного дисперсионного анализа
- •1.6.4 Методика однофакторного дисперсионного анализа альтернативных признаков
- •1.7 Определение соответствия эмпирических и теоретических данных
- •1.7.1 Общие положения
- •1.7..2 Определение соответствия признаков альтернативных явлений
- •1.7.3 Определение критерия χ2 по данным, представленным в сложных таблицах
- •1.7.4 Проверка соответствия фактических частот вариационного ряда теоретическому распределению
- •1.8 Корреляционный анализ
- •1.8.1 Способы выявления корреляционной связи
- •1.8.2 Виды и теснота корреляционной связи
- •1.8.2 Определение коэффициент корреляции при малом числе наблюдений
- •1.8.3 Определение коэффициент корреляции при большом числе наблюдений
- •1.8.4 Средняя ошибка коэффициента корреляции
- •1.8.5 Определение тесноты связи между качественными признаками
- •1.8.6 Множественная корреляция
- •1.8.7 Понятие о корреляционном отношении
- •1.9 Основы регрессионного анализа
- •1.10 Непараметрические критерии в медицинских исследованиях
- •1.10.1 Критерии для характеристики одной совокупности
- •1.10.2 Критерии различия для двух сопряженных совокупностей
- •1.10.3 Критерии различия для двух несопряженных совокупностей
- •1.10.3 Непараметрические методы изучения связи
- •1.11 Современное программное обеспечение для статистической обработки биомедицинских исследований
- •2 ПРИНЦИПЫ ПОСТРОЕНИЯ БАНКОВ ДАННЫХ
- •2.1 Общие сведения о банках данных
- •2.2 Типы баз данных
- •2.2.1 Автономные базы данных
- •2.2.2 Файл-серверные базы данных
- •2.2.3 Многоярусные базы данных
- •2.2.4 Базы данных клиент/сервер
- •2.3 Реляционный подход к построению БД
- •2.3.1 Реляционная модель данных
- •2.3.1.1 Целостность данных
- •2.3.2 Реляционная алгебра
- •2.3.3 Реляционное исчисление
- •2.4 Иерархический и сетевой подходы
- •2.4.1 Иерархический подход.
- •2.4.2 Сетевой подход.
- •2.5 Инвертированные базы данных
- •2.6 Принципы построения реляционных баз данных
- •2.6.1 Процедура индексирования
- •2.6.2 Организация связи с базами данных прикладных программ
λ |
2 |
= D |
2 |
|
nx ny |
= 0,818 |
2 |
|
11 11 |
= 3,76 |
(1.64) |
|
|
nx + ny |
|
11+11 |
|||||||
|
|
|
|
|
|
|
|
|
7. Сопоставляем полученное значение λ2 с критическими значениями: λ205= 1,84 и λ201;=2,65. Если λ2<λ205, то принимается нулевая гипотеза, если λ2 > λ205 или λ2 > λ201, торазличия признаются существенными (p < 0,05 или р < 0,01). В нашем примере λ2 > λ201 Следовательно, различия в росте культур фибробластов существенны (р< 0,01).
Если число наблюдений в сравниваемых группах одинаково, то критерий Колмогорова — Смирнова можно рассчитать по формуле: λ2 = D2 n/2. Действительно в нашем случае; λ2 =0,684·11/2 =3,76.
1.10.3 Непараметрические методы изучения связи
Коэффициент корреляции рангов Спирмена. Рассмотрим методику вы-
числения этого коэффициента: на примере определения связи между количеством эритроцитов и процентом гемоглобина в крови у человек (табл. 1.53).
Таблица 1.53 - Вычисление коэффициента корреляции рангов Спирмена между количеством эритроцитов и процентом гемоглобина в крови
|
Количество |
Гемо- |
Ранги |
Разности |
Квадраты раз- |
|
Обследо- |
эритроцитов, |
глобин в |
вариант |
рангов, |
ностей рангов, |
|
ванные |
х |
%, у |
rx |
ry |
d |
d2 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
А. |
1,98 |
40 |
1 |
1 |
0 |
0 |
К. |
2,5 |
47 |
2 |
2 |
0 |
0 |
Б. |
2,94 |
60 |
3 |
3 |
0 |
0 |
З. |
3,25 |
62 |
4 |
4 |
0 |
0 |
С. |
3,64 |
74 |
5 |
6,5 |
-1,5 |
2,25 |
И. |
3,7 |
65 |
6 |
5 |
+1 |
1 |
Ж. |
3,86 |
78 |
7 |
8 |
-1 |
1 |
И. |
4,29 |
74 |
8 |
6,5 |
+1,5 |
2,25 |
|
n=8 |
|
|
|
|
∑d2=6,5 |
Методика расчета критерия коэффициент корреляции рангов Спирмена будет следующая:
1.Располагаем данные обследованных в порядке возрастания вариант первого признака (в нашем примере - количества эритроцитов) (графы 1, 2,3);
2.Заменяем значения вариант в каждом ряду их рангами (графы 4 и-5). Если встречаются одинаковые варианты, то каждой из них присваивается средний ранг. В нашем примере варианта 74% гемоглобина встречается 2 раза и занимает порядковые места 6 и 7, следовательно, средний ранг равен
88
6 +2 7 = 6,5 ;
3.Находим разности между смежными рангами сравниваемых рядов (графа 6) Сумма этих разностей должна равняться нулю;
4.Возводим п6лученные разности в квадрат и суммируем их (графа 7);
5.Вычисляем коэффициент корреляции рангов Спирмена по формуле:
|
|
|
|
|
ρ=1− |
6∑d 2 |
(1.65) |
|||||
|
|
|
|
|
n(n2 −1) |
|
|
|||||
где Σd2 —сумма квадратов разностей рангов; |
|
|
|
|||||||||
п—число сравниваемых пар. |
|
|
|
|
|
|
|
|
|
|||
В нашем примере: |
|
6*6,5 |
|
39,0 |
|
|
|
|
||||
ρ |
=1− |
=1− |
=1 |
−0,077 |
= 0,923 |
|||||||
8*(8 |
2 |
−1) |
504 |
|||||||||
|
|
|
|
|
|
|
|
Таким образом между числом эритроцитов и содержанием гемоглобина в крови существует высокая прямая корреляционная связь. Величина коэффициента корреляции рангов Спирмена оценивается так же, как и величина параметрического коэффициента корреляции.
Оценка надежности коэффициента корреляции рангов Спирмена при числе наблюдений 10 и более производится с помощью критерйя t по формуле
t = ρ n −22 |
(1.66) |
1− ρ |
|
Вероятность, соответствующую полученному t определяем по таблице Стьюдента при числе степеней свободы n-2. В тех случаях, когда число наблюдений меньше 10, оценка значимости производится по табл. 1.54. Если вычисленный коэффициент корреляции ρ больше табличного ρ05, то он значим с вероятностью 95%. В нашем примере при n=8 ρ>ρ01 (0,92>0,833) следовательно, полученный нами коэффициент корреляции значим с высокой вероятностью
(ρ<0,01).
Таблица 1.54 - Критические значения коэффициента корреляции рангов Спирмена ρ
Число парных |
Уровень значимости |
Число парных |
Уровень значимости |
||
наблюдений, |
|
|
наблюдений, |
|
|
n |
0,05 |
0,01 |
n |
0,05 |
0,01 |
4 |
1 |
▬ |
16 |
0,425 |
0,601 |
5 |
0,9 |
1 |
18 |
0,399 |
0,564 |
6 |
0,829 |
0,943 |
20 |
0,377 |
0,534 |
7 |
0,714 |
0,893 |
22 |
0,359 |
0,508 |
8 |
0,643 |
0,833 |
24 |
0,343 |
0,485 |
9 |
0,6 |
0,783 |
26 |
0,329 |
0,465 |
89
10 |
0,564 |
0,746 |
28 |
0,317 |
0,448 |
12 |
0,506 |
0,712 |
30 |
0,306 |
0,432 |
14 |
0,456 |
0,645 |
|
|
|
В ряде случаев коэффициент корреляции рангов, можно использовать для выяснения связи между качественными и количественными признаками (табл. 1.55). Коэффициент корреляции рангов в этом случае равен
ρ =1−8*6(*6444−,51) =1−504268 =0,470
Критическое значение ρ05 при n=8 равняется 0,643. Таким образом ρ < ρ05. Следовательно, результат оценки связи при данном числе наблюдений признать достоверным нельзя.
Таблица 1.55 - Вычисление коэффициента корреляции р между количеством креатинина в крови больных хронической уремией и выраженностью у них рвоты
Больные |
Количество креа- |
Выражен- |
Ранги |
Разность |
Квадраты |
|
|
тинина (мг %) |
ность рвоты |
|
|
рангов |
разности |
|
х |
у |
|
|
d |
d |
|
rx |
ry |
||||
|
|
|
|
|
||
А. |
2,1 |
+ |
1 |
3,5 |
-2,5 |
6,25 |
К. |
2,3 |
+ |
2 |
3,5 |
-1,5 |
2,25 |
Б. |
3,6 |
- |
3 |
1 |
2 |
4 |
С. |
3,7 |
++ |
4,5 |
7 |
-2,5 |
6,25 |
З. |
3,7 |
++ |
4,5 |
7 |
-2,5 |
6,25 |
И. |
4,4 |
+ |
6 |
3,5 |
2,5 |
6,25 |
Ж. |
4,5 |
+ |
7 |
3,5 |
3,5 |
12,25 |
Н. |
4,95 |
++ |
8 |
7 |
1 |
1 |
|
|
|
|
|
|
∑=44,5 |
Известно, что на величину коэффициента ранговой корреляции серьезно влияет усреднение рангов. Поэтому при наличии значительного числа усредненных рангов для вычисления коэффициента ρ применяется следующая формула:
|
|
|
|
|
n |
3 −n |
−(Tx +T y )−∑ d |
2 |
|
|
||||
|
ρ = |
|
|
|
6 |
|
|
|
(1.67) |
|||||
|
|
|
|
|
|
|
|
|
|
|||||
n 3 |
−n |
|
|
n 3 −n |
|
|
|
|||||||
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
−2T |
|
|
− |
2T |
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
6 |
|
|
x |
6 |
|
|
y |
|
||
|
|
|
|
|
|
|
|
|
|
|
||||
где Tx (Ty ) = ∑ |
t 3 −t |
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
90