Добавил:
tg: @Yr66gi4 Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
0
Добавлен:
12.05.2025
Размер:
73.28 Кб
Скачать

федеральное государственное автономное образовательное учреждение высшего образования «Сибирский федеральный университет»

Институт фундаментальной биологии и биотехнологии

Кафедра биофизики

Отчет

по дисциплине

Специальный биофизический практикум

Статистическая обработка медицинских данных

тема

Студент

Е.С. Ведешкина

номер группы, зачетной книжки

подпись, дата

инициалы, фамилия

Преподаватель

К.В. Шадрин

подпись, дата

инициалы, фамилия

Красноярск 2025 г.

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ 4

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 5

МАТЕРИАЛЫ И МЕТОДЫ 6

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 10

ЗАКЛЮЧЕНИЕ 18

Введение

Статистическая обработка медицинских данных является важной частью многих медико-биологических исследований. Практически всегда возникает необходимость анализировать полученные данные, выявлять различные зависимости, ставить и проверять научные гипотезы, классифицировать данные и проводить многие другие операции, чтобы получить грамотный и обоснованный результат.

В нынешнее время данная тема очень актуальна, так как медицинским работникам ежедневно приходится сталкиваться с бесчисленными объемами медико-биологических данных (различные мониторинги, сводки, переписи и т.д.). Такое количество информации практически невозможно обрабатывать вручную, поэтому прибегают к использованию различных специализированных пакетов. В свою очередь, быстрый и качественный анализ данных может помочь улучшить методы диагностики и лечения заболеваний, и сделать это своевременно.

Из вышесказанного, целью, проводимой мною работы, будет являться использование статистических методов для анализа медико-биологических данных.

Для этого были поставлены задачи:

  1. Провести первичную обработку полученных данных, исследовать распределения, визуализировать результаты при помощи графиков и сводных таблиц, используя программный пакет Excel.

  2. Выявить и исследовать закономерности, различия, присущие совокупностям, с учетом особенностей параметров, используя программный пакет Excel.

Теоретическая часть

Объектом исследования, в данной работе, будут являться дети с воспалением пазух. Для чего была получена база данных, состоящая из 246 наблюдений.

Детские болезни занимают практические самое значимое место в современной медицине, так как грамотное и своевременное лечение таких пациентов может не только предотвратить дальнейшие осложнения, но и спасти многие жизни.

Таким образом, можно выделить и предмет исследования, чем будут являться показатели крови детей с данной патологией, а также их половозрастные характеристики и распространенность поражения (1 или 2-стороннее).

Материалы и методы

Статистический анализ данных проводился при помощи программного пакета MS Excel 2019.

Выборочное среднее значение наблюдаемой переменной определяется

по формуле:

(1)

где n – объем выборки (истинное число наблюдений переменной x).

Медиана делит ряд упорядоченных значений пополам с равным числом этих значений как выше, так и ниже её (левее и правее медианы на числовой оси).

Мода – это значение, которое встречается наиболее часто в наборе данных.

Асимметрия – это числовая характеристика, являющаяся показателем степени отклонения графика распределения случайной величины от симметричного графика распределения. Значение коэффициента асимметрии находится по формуле:

(2)

Эксцесс – это числовая характеристика, которая характеризует "крутизну" подъема кривой распределения по сравнению с нормальной кривой. Эксцесс вычисляется по формуле:

(3)

Значение эксцесса у нормального распределения приближается к нулю.

Для того, чтобы точнее описать распределение, необходимо найти среднеквадратическое отклонение и квартили.

Среднеквадратическое отклонение – статистическая характеристика распределения случайной величины, показывающая среднюю степень разброса значений величины относительно математического ожидания.

(4)

А квартиль – значение, ниже которого лежит часть распределения вероятностей случайной величины, кратная одной четвёртой или трем четвертым.

Для качественных признаков необходимо рассчитать долю признака в процентах и ошибки этих процентов по формуле:

(5)

где M – доля признака в процентах, N – общее число наблюдений.

Для определения наличия связи между показателями необходимо воспользоваться корреляционными методами Пирсона (6) – для нормального распределения и Спирмена (7) – для любого распределения. Значение коэффициента корреляции лежит в интервале от -1 до 1. Чем ближе это значение к границам интервала, тем сильнее связь. Знак определяет характер направления связи – прямая или обратная.

(6)

,

(7)

где D – разность между рангами двух показателей.

Для того, чтобы найти статистическую значимость коэффициентов корреляции, нужно применить формулу (критерий Стьюдента):

(8)

Для определения наличия различий между показателями с нормальным распределением необходимо сначала выяснить, имеется ли однородность дисперсий по формуле:

(9)

А, собственно, сам показатель наличия различий – двухвыборочный критерий Стьюдента для однородных дисперсий:

(10)

Для определения наличия различий в выборках, не подчиняющихся нормальному распределению, нужно использовать непараметрические методы: для независимых показателей – критерий Манна-Уитни (11) с аппроксимацией с учетом нормального распределения, так как число наблюдений в группах превышало 60; для зависимых показателей – G-критерий знаков (13).

(11)

где U – значение Манна-Уитни, которое можно рассчитать по формуле:

(12)

где – наибольшая из 2-х ранговых сумм.

(13)

где – значения положительных и отрицательных разностей, меньшее из которых рассматривается, как атипичное и используется для вычислений.