
федеральное государственное автономное образовательное учреждение высшего образования «Сибирский федеральный университет»
Институт фундаментальной биологии и биотехнологии
Кафедра биофизики
Отчет
по дисциплине
Специальный биофизический практикум |
|||||
|
|||||
|
|||||
Статистическая обработка медицинских данных |
|||||
тема |
|||||
Студент |
|
|
|
|
Е.С. Ведешкина |
|
номер группы, зачетной книжки |
|
подпись, дата |
|
инициалы, фамилия |
|
|
|
|
|
|
Преподаватель |
|
|
|
К.В. Шадрин |
|
|
|
|
подпись, дата |
|
инициалы, фамилия |
Красноярск 2025 г.
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 4
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 5
МАТЕРИАЛЫ И МЕТОДЫ 6
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 10
ЗАКЛЮЧЕНИЕ 18
Введение
Статистическая обработка медицинских данных является важной частью многих медико-биологических исследований. Практически всегда возникает необходимость анализировать полученные данные, выявлять различные зависимости, ставить и проверять научные гипотезы, классифицировать данные и проводить многие другие операции, чтобы получить грамотный и обоснованный результат.
В нынешнее время данная тема очень актуальна, так как медицинским работникам ежедневно приходится сталкиваться с бесчисленными объемами медико-биологических данных (различные мониторинги, сводки, переписи и т.д.). Такое количество информации практически невозможно обрабатывать вручную, поэтому прибегают к использованию различных специализированных пакетов. В свою очередь, быстрый и качественный анализ данных может помочь улучшить методы диагностики и лечения заболеваний, и сделать это своевременно.
Из вышесказанного, целью, проводимой мною работы, будет являться использование статистических методов для анализа медико-биологических данных.
Для этого были поставлены задачи:
Провести первичную обработку полученных данных, исследовать распределения, визуализировать результаты при помощи графиков и сводных таблиц, используя программный пакет Excel.
Выявить и исследовать закономерности, различия, присущие совокупностям, с учетом особенностей параметров, используя программный пакет Excel.
Теоретическая часть
Объектом исследования, в данной работе, будут являться дети с воспалением пазух. Для чего была получена база данных, состоящая из 246 наблюдений.
Детские болезни занимают практические самое значимое место в современной медицине, так как грамотное и своевременное лечение таких пациентов может не только предотвратить дальнейшие осложнения, но и спасти многие жизни.
Таким образом, можно выделить и предмет исследования, чем будут являться показатели крови детей с данной патологией, а также их половозрастные характеристики и распространенность поражения (1 или 2-стороннее).
Материалы и методы
Статистический анализ данных проводился при помощи программного пакета MS Excel 2019.
Выборочное среднее значение наблюдаемой переменной определяется
по формуле:
(1)
где n – объем выборки (истинное число наблюдений переменной x).
Медиана делит ряд упорядоченных значений пополам с равным числом этих значений как выше, так и ниже её (левее и правее медианы на числовой оси).
Мода – это значение, которое встречается наиболее часто в наборе данных.
Асимметрия – это числовая характеристика, являющаяся показателем степени отклонения графика распределения случайной величины от симметричного графика распределения. Значение коэффициента асимметрии находится по формуле:
(2)
Эксцесс – это числовая характеристика, которая характеризует "крутизну" подъема кривой распределения по сравнению с нормальной кривой. Эксцесс вычисляется по формуле:
Значение эксцесса у нормального распределения приближается к нулю.
Для того, чтобы точнее описать распределение, необходимо найти среднеквадратическое отклонение и квартили.
Среднеквадратическое отклонение – статистическая характеристика распределения случайной величины, показывающая среднюю степень разброса значений величины относительно математического ожидания.
(4)
А квартиль – значение, ниже которого лежит часть распределения вероятностей случайной величины, кратная одной четвёртой или трем четвертым.
Для качественных признаков необходимо рассчитать долю признака в процентах и ошибки этих процентов по формуле:
(5)
где M – доля признака в процентах, N – общее число наблюдений.
Для определения наличия связи между показателями необходимо воспользоваться корреляционными методами Пирсона (6) – для нормального распределения и Спирмена (7) – для любого распределения. Значение коэффициента корреляции лежит в интервале от -1 до 1. Чем ближе это значение к границам интервала, тем сильнее связь. Знак определяет характер направления связи – прямая или обратная.
,
где D – разность между рангами двух показателей.
Для того, чтобы найти статистическую значимость коэффициентов корреляции, нужно применить формулу (критерий Стьюдента):
(8)
Для определения наличия различий между показателями с нормальным распределением необходимо сначала выяснить, имеется ли однородность дисперсий по формуле:
А, собственно, сам показатель наличия различий – двухвыборочный критерий Стьюдента для однородных дисперсий:
Для определения наличия различий в выборках, не подчиняющихся нормальному распределению, нужно использовать непараметрические методы: для независимых показателей – критерий Манна-Уитни (11) с аппроксимацией с учетом нормального распределения, так как число наблюдений в группах превышало 60; для зависимых показателей – G-критерий знаков (13).
(11)
где U – значение Манна-Уитни, которое можно рассчитать по формуле:
где
– наибольшая из 2-х ранговых сумм.
(13)
где
– значения положительных и отрицательных
разностей, меньшее из которых
рассматривается, как атипичное и
используется для вычислений.