Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект_АКОБМИ.pdf
Скачиваний:
176
Добавлен:
17.05.2015
Размер:
1.95 Mб
Скачать

Учреждение образования БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ

Кафедра электронной техники и технологии

Костюкевич А. А

КОНСПЕКТ ЛЕКЦИЙ

по курсу

«АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ ОБРАБОТКИ БИОМЕДИЦИНСКОЙ ИНФОРМАЦИИ»

для студентов специальности

39.02.03 «Медицинская электроника»

Минск 2006

1

 

СОДЕРЖАНИЕ

 

1 Статистическая обработка биомедицинской информации..................................

4

1.1

Биомедицинская информация и способы ее получения ................................

4

1.2

Организация медико-статистических исследований......................................

6

1.3

Относительные величины ...............................................................................

12

1.4

Статистическая обработка вариационного ряда...........................................

20

1.4.1 Основные понятия и определения ...........................................................

20

1.4.2 Методика составления вариационного ряда...........................................

21

1.4.3 Методика статистической обработки вариационного ряда при

 

нормальном законе распределения вариант ....................................................

23

1.4.4 Расчет статистических характеристик при малом числе наблюдений 29

1.5

Выборочный метод исследований..................................................................

32

1.5.1 Формирование выборочной совокупности.............................................

32

1.5.2 Определение объема выборочной совокупности...................................

33

1.5.3 Сравнение средних арифметических величин двух выборок из

 

совокупности с нормальным распределением вариант..................................

35

1.6

Основы дисперсионного анализа....................................................................

39

1.6.1 Общие положения......................................................................................

39

1.6.2 Методика однофакторного дисперсионного анализа............................

41

1.6.3 Методика двухфакторного дисперсионного анализа.............................

43

1.6.4 Методика однофакторного дисперсионного анализа альтернативных

 

признаков.............................................................................................................

49

1.7

Определение соответствия эмпирических и теоретических данных..........

52

1.7.1 Общие положения......................................................................................

52

1.7..2 Определение соответствия признаков альтернативных явлений........

54

1.7.3 Определение критерия χ2 по данным, представленным в сложных

 

таблицах...............................................................................................................

55

1.7.4 Проверка соответствия фактических частот вариационного ряда

 

теоретическому распределению........................................................................

59

1.8

Корреляционный анализ..................................................................................

61

1.8.1 Способы выявления корреляционной связи...........................................

62

1.8.2 Виды и теснота корреляционной связи...................................................

64

1.8.2 Определение коэффициент корреляции при малом числе наблюдений

...............................................................................................................................

 

64

1.8.3 Определение коэффициент корреляции при большом числе

 

наблюдений .........................................................................................................

65

1.8.4 Средняя ошибка коэффициента корреляции..........................................

66

1.8.5 Определение тесноты связи между качественными признаками.........

68

1.8.6 Множественная корреляция .....................................................................

71

1.8.7 Понятие о корреляционном отношении..................................................

72

1.9

Основы регрессионного анализа ....................................................................

76

1.10 Непараметрические критерии в медицинских исследованиях..................

79

2

1.10.1 Критерии для характеристики одной совокупности............................

79

1.10.2 Критерии различия для двух сопряженных совокупностей................

80

1.10.3 Критерии различия для двух несопряженных совокупностей............

83

1.10.3 Непараметрические методы изучения связи........................................

88

Таблица 1.54 - Критические значения коэффициента корреляции рангов

 

Спирмена ρ ..........................................................................................................

89

1.11 Современное программное обеспечение для статистической обработки

биомедицинских исследований............................................................................

91

2 ПРИНЦИПЫ ПОСТРОЕНИЯ БАНКОВ ДАННЫХ...........................................

95

2.1

Общие сведения о банках данных..................................................................

95

2.2

Типы баз данных ..............................................................................................

98

2.2.1 Автономные базы данных.........................................................................

99

2.2.2 Файл-серверные базы данных..................................................................

99

2.2.3 Многоярусные базы данных...................................................................

100

2.2.4 Базы данных клиент/сервер....................................................................

100

2.3

Реляционный подход к построению БД.......................................................

103

2.3.1 Реляционная модель данных ..................................................................

103

 

2.3.1.1 Целостность данных..........................................................................

107

2.3.2 Реляционная алгебра ...............................................................................

109

2.3.3 Реляционное исчисление.........................................................................

113

2.4

Иерархический и сетевой подходы..............................................................

116

2.4.1 Иерархический подход............................................................................

118

2.4.2 Сетевой подход. .......................................................................................

121

2.5

Инвертированные базы данных....................................................................

124

2.6

Принципы построения реляционных баз данных.......................................

126

2.6.1 Процедура индексирования....................................................................

128

2.6.2 Организация связи с базами данных прикладных программ..............

131

3

1 СТАТИСТИЧЕСКАЯ ОБРАБОТКА БИОМЕДИЦИНСКОЙ ИНФОРМАЦИИ

1.1 Биомедицинская информация и способы ее получения

Биомедицинская информация-это сведения о свойствах биологических объектов и явлениях, являющихся предметами медицинских исследований, а также представления и суждения об этих свойствах и явлениях.

Биомедицинская информация может быть следующих видов:

1)первичная информация используемая для получения изображения в медицинской диагностике. Информация получается с использованием сложных диагностических способов, например рентгеновской автоматизированной томографии (АТ), ультразвуковой автоматизированной томографии и других методов. В процессе проведения обследования приёмник излучения ( рентгеновского или ультразвукового ) диагностических установок накапливает необходимые данные об исследуемом объекте, но для получения изображения с требуемым ракурсом, необходимо производить реорганизацию этих данных. Это требует большего числа вычислений, объём которых зависит от необходимой пространственной и яркостной разрешающей способности. В настоящее время для получения типовой рентгеновской томограммы требуется выполнить несколько сотен миллионов отдельных вычислительных операций. При этом обработка первичных данных должна происходить в реальном масштабе времени, т.е. с минимальной длительности процедуры от облучения пациента до получения результатов анализа.

2)результаты индивидуального обследования отдельных пациентов в ле-

чебных учреждениях (поликлиника, клиника и т.д.). Это лабораторные исследования крови, мочи и др., общие рентгеновские обследования, ЭКГ и т.д. Данная информация необходима в комплексе для правильной и своевременной постановки диагноза и выбора метода лечения. Оперативное получение такой информации требует создания специализированных баз данных.

3)статистическая информация о биологических объектах, полученная в результате медико-статистического исследования.

Например, исследования количества лейкоцитов в крови детей для определения условий, уровень каких-либо вредных веществ в крови для различных физиологических условий и т. д.

Такая информация получается в лечебных учреждениях на фактическом материале обследования пациентов для изучения каких либо закономерностей

итенденций, в НИИ при проведении биологических исследований (например, изучение влияния нового препарата на биологическое существо), в клиниках при проведении клинических исследований и т. д.

4

Обработка такой информации требует применения математических методов, в частности математической статистики. В приложении к медицине эти методы назвали медицинской статистикой, и в приложении к биологии в це-

лом – биологической статистикой.

При обработке большого объема статистической информации требуется механизация и автоматизация вычислений.

Принципы, аппаратные и программные средства для проведения статистической обработки информации мы и будем изучать в этом курсе.

4) информация, получаемая в области биохимических исследований ве-

ществ, например, при синтезе новых лекарственных препаратов.

С помощью специализированных аппаратных и программных средств становиться возможным детально изучать структуры сложных макромолекул и их химически активные связывающие участки и исследовать как пространственное взаимодействие рецепторов с химически активными участками потенциально полезных лекарств, так и динамику этих молекулярных взаимодействий.

Большинство методов, используемых ранее для изучения этих свойств структуры и функций макромолекул, позволяло лишь косвенно исследовать молекулы. Только рентгеновская кристаллография могла прорисовать атомную структуру биологических молекул, таких как протеины. Основываясь на данных рентгеновской кристаллографии, исследователь был вынужден выполнять трудоемкую работу по созданию трехмерной физической модели молекулы из подручных средств (из палочек и проволоки).

Теперь стало возможным ввести кристаллографические данные любой макромолекулы в ЭВМ, затем изобразить молекулу в цвете и, поворачивая изображение, постепенно строить трехмерный образ структур или любых их частей. Кроме того, специальные программы могут заменить одни фрагменты структуры на другие. При обработке в реальном масштабе времени или близком к нему, как хотят биохимики, эти вычисления будут требовать большого быстродействия ЭВМ.

5

1.2 Организация медико-статистических исследований

При проведении научных исследований в медицине исследователь сталкивается с социально-биологическими явлениями, имеющими случайный, вероятностный характер. Изучение закономерностей, присущих подобным явлениям, производится с помощью методов математической статистики и требует для этого наличие определённого, иногда весьма значительного, числа наблюдений. Организация сбора, количественная характеристика и статистический анализ медицинских наблюдений получили название «медико-статистическое исследование».

В содержании медико-статистического исследования выделяют четыре последовательных этапа:

1-й – составление плана и программы исследования;

2-й – статистическое наблюдение;

3-й – статистическую группировку и сводку наблюдений;

4-й – статистическую обработку и анализ полученных материалов, оформление результатов исследования.

В процессе реализации 1-го этапа медико-статистического исследования формулируется цель (а в ряде случаев и более частные, детализированные задачи) исследования, составляется его организационный план, кратко излагается содержание последующих этапов статистического исследования (программа исследования).

Хорошо разработанный план медико-статистического исследования, заблаговременное ознакомление его автора с требованиями, предъявляемыми к организации сбора и обработки статистических данных, — одно из главных условий успешности научного исследования.

Рассмотрим основные элементы планирования медико-статистического исследования на тему: «Лечение больных вазомоторным ринитом в амбулаторных условиях».

В качестве цели исследования изберем: выявление наиболее эффективного комплекса мероприятий для лечения больных вазомоторным ринитом в условиях поликлиники.

Далее в процессе планирования медико-статистического исследования разрабатываются программа статистического наблюдения (содержание которой рассматривается ниже при изложении вопросов 2-го этапа статистического исследования), программа статистической группировки и сводки материалов наблюдения (которая рассматривается далее применительно к содержанию 3-го этапа статистического исследования), перечень обобщающих статистических показателей и важнейшие направления анализа полученных данных (что включает в себя 4-й этап статистического исследования).

6

Познакомимся с важнейшими элементами содержания 2-го этапа медико-

статистического исследования на основе разбираемого примера.

Объект наблюдения (т. е. совокупность единиц, о которых должны быть собраны статистические сведения, отграничиваемая по территориальному, административному, временному и другим признакам): больные вазомоторным ринитом, лечившиеся в поликлинике №. 8 в 2005 г.

Единица наблюдения (первичный элемент, из которых складывается объект исследования, подлежит чёткому определению в соответствии с целью и задачами исследования): больной вазомоторным ринитом, лечившийся в поликлинике № 8 у отоларинголога и закончивший лечение в 2005 г.

Программа наблюдения (перечень признаков, характеризующих единицу наблюдения с качественной и количественной сторон и подлежащих статистической регистрации): пол, возраст, профессия больного, диагноз, причина болезни, характер лечения, срок проявления рецидивов, характеристика носового дыхания и т. п. При составлении программы выбираются только те признаки, которые нужны для ответа на поставленные темой и определенные целью работы вопросы. Практика увеличения числа признаков «на всякий случай» осложняет обработку собранных данных, удлиняет сроки работы, а иногда и скрывает

еесмысл.

Всоответствии с программой наблюдения разрабатывается учетностатистический документ, с помощью которого осуществляется регистрация единиц наблюдения: карточка, журнал и т. д.

До утверждения программы наблюдения и ее носителя — учетностатистического документа, для окончательной отработки всех ее элементов весьма целесообразно провести пробное наблюдение. Оно состоит в том, что на небольшом числе наблюдений проверяется возможность получения ответов на поставленные в учетном документе вопросы. Лишь после проведения пробного наблюдения и необходимой корректировки программы можно приступить к сбору материала, т. е. к собственно статистическому наблюдению.

Вид наблюдения по времени его проведения может быть текущим или единовременным. Большинство явлений медицинского характера наблюдаются непрерывно по мере их возникновения (случаи заболеваний, травм, осложнений, смерти; проведенные лечебно-профилактические мероприятия и т. д.) и потому подлежат текущему учету. К этому виду наблюдения относится и регистрация случаев обращения в поликлинику больных вазомоторным ринитом из нашего примера. В ряде случаев в клинико-статистических и других медицинских исследованиях проводится единовременное наблюдение, т. е. регистрация данных по состоянию на определенный момент времени (на пример, перепись больных).

По степени охвата единиц исследуемого объекта различают сплошное и не сплошное наблюдение. При сплошном наблюдении регистрируются все единицы составляющие объект наблюдения, как, например, все больные вазомоторным ринитом, обратившиеся в поликлинику № 8 в 2005 г. При не сплошном,

7

частичном наблюдении берется только некоторая часть этих единиц, по которой затем судят о свойствах всего объекта наблюдения. Одним из видов не сплошного наблюдения является специально организуемое выборочное наблюдение, которое позволяет по части единиц, составляющих исследуемый объект, получить его наиболее достоверную характеристику.

Основными способами сбора медико-статистических материалов служат непосредственное наблюдение (например, регистрация врачами поликлиники больных вазомоторным ринитом), опрос и отчетный способ.

3-й этап медико-статистического исследования включает группировку и сводку собранных материалов наблюдения. При этом определяющее значение для раскрытия существа изучаемого явления имеет статистическая группировка, смысл которой заключается в расчленении статистической совокупности на однородные группы по важнейшим признакам. Выделение тех или иных групп не может быть произвольным делом исследователей, а вытекает из сущности и характера явления. Границы групп выбираются в зависимости от темы и цели исследования. Например, значения одного и того же признака — длительности пребывания на койке — могут быть по-разному разделены на группы при изучении лечения больных ангиной, язвенной болезнью желудка или туберкулезом легких.

Группировка может, осуществляться на основе количественных или качественных (атрибутивных) признаков. При группировке совокупности на равные части по количественному признаку (например, при построении вариационного ряда) важно определить наиболее целесообразное число групп к, которое зависит не только от цели исследования, но и от имеющегося числа наблюдений. Для этого можно воспользоваться следующей формулой:

к = 1+3,32 lg n,

где n число наблюдений.

Например, если n = 100, то число групп = 1+3,32 lg 100=7,648.

Из разных видов группировок в медицине особое место занимает типологическая группировка, назначение которой заключается в делении изучаемой совокупности на однородные группы в соответствии с основными типами явления (например, распределение больных по классам, группам и формам болезней).

Результаты группировки статистического материала по отдельным признакам и их различным сочетаниям находят выражение в статистических таблицах. Статистическая таблица представляет собой рациональную форму систематизации статистических данных.

Каждая таблица должна иметь общий заголовок, в котором четко, в сжатой форме раскрывается её содержание. В таблице обязательно следует предусмотреть проверочные итоги (как общие, так и групповые) для облегчения необходимых расчетов по данным таблицы. Наименования единиц измерения приведенных в таблице данных указываются в заголовках (обычно в скобках). Нулевые значения признака лучше обозначать знаком тире, чем оставлять клетку

8

пустой. При отсутствии каких-либо данных необходимо в соответствующей клетке писай «нет сведений».

В медицинской статистике принято деление таблиц на простые и сложные. Сложные таблицы разделяются на групповые и комбинационные. Простая таблица содержит в качестве главной группировки перечень наблюдавшихся объектов и их общие числовые значения. В простых таблицах признак главной группировки может быть систематизирован по времени, типам учреждений, территории и т. п. Эти таблицы имеют справочно-информационный характер и могут быть хронологическими, административными или перечневыми. Образец хронологической таблицы представлен в табл. 1.1.

Таблица 1.1 - Число больных вазомоторным ринитом, лечив-

шихся в 1970-1972 г.г.

Годы

Число больных

1970

293

1971

289

1972

317

Всего:

899

Групповая таблица обязательно содержит в главной группировке один группировочный признак (табл.1.2).

Таблица 1.2 - Распределение больных вазомоторным ринитом по возрасту (в абс. цифрах)

Возраст

Число больных

15-19 лет

7

20-29 «

23

30-39 «

47

40-49 «

150

50 лет и старше

90

Всего:

317

Наиболее сложной и ценной в аналитическом отношении является комбинационная таблица, которая в главной группировке (а иногда и в характеризующих признаках) содержит сочетание взаимосвязанных группировочных признаков (табл. 1.3).

По стадии исследования статистические таблицы подразделяют на разработочные (рабочие), содержащие только абсолютные данные, и окончательные, аналитические, в которых приводятся обобщающие показатели и результаты их статистической оценки. Аналитические таблицы могут быть получены только на последнем этапе медико-статистического исследования.

Содержанию 4-го этапа медико-статистического исследования посвящены последующие главы данного пособия. Важнейшие задачи статистической обра-

9

ботки и анализа материалов научного медицинского исследования и рекомендуемые для их реализации методы в сводном виде показаны в табл. 1.4.

Таблица 1.3 – Распределение больных по возрасту и полу

Диагноз

 

 

До 30 лет

30-49 лет

50 лет и стар-

 

Итого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ше

 

 

 

 

 

 

 

 

м.

 

ж.

всего

м.

ж.

всего

м.

 

ж.

 

всего

м.

ж.

всего

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Гипертони-

 

4

 

6

10

100

150

250

200

 

290

 

490

304

446

750

ческая бо-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лезнь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кардиоскле-

 

1

 

-

1

65

51

116

185

 

115

 

300

251

166

117

роз атеро-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

склеротиче-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ский

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ревматизм

 

50

 

80

130

40

65

105

20

 

30

 

 

50

110

175

285

Всего

 

 

55

 

86

141

205

266

471

405

 

435

 

840

665

787

1452

Таблица 1.4 – Статистические методы при решении задач научного меди-

 

 

 

 

 

 

 

 

цинского исследования

 

 

 

 

 

 

 

 

 

 

 

 

 

Статистические методы для ис-

 

Статистические

ме-

Задачи

 

 

 

 

следования количественно вы-

 

тоды

для

исследова-

 

 

 

 

 

 

раженных признаков

 

 

 

 

ния

качественных,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

атрибутивных

при-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

знаков, альтернативы

Определение

 

ха-

 

Метод χ2, графики

 

 

 

 

 

 

 

 

 

 

рактера распреде-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ления

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определение

 

 

 

 

Средние величины (арифмети-

 

Показатели частоты,

обобщенных

 

ха-

 

ческая, геометрическая, гармо-

 

структуры,

соотно-

рактеристик

сово-

 

ническая), мода, медиана. Гра-

 

шения. Графики.

 

купности

 

 

 

 

 

фики

 

 

 

 

 

 

 

 

 

 

 

 

Оценка

влияния

 

 

 

 

 

 

 

 

 

 

Методы стандартиза-

структуры явления

 

 

 

 

 

 

 

 

 

 

ции

 

 

 

на размеры

обоб-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

щенных

характе-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ристик

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Измерение

вариа-

 

Амплитуда вариационного ряда,

 

Дисперсионный ана-

бельности

 

явле-

 

среднее квадратическое откло-

 

лиз - критерий F,

 

ний, признаков

 

нение, дисперсия, дисперсион-

 

критерий флюктуа-

 

 

 

 

 

 

ный анализ - критерий F, крите-

 

ций

 

 

 

 

 

 

 

 

 

рий флюктуаций

 

 

 

 

 

 

 

 

 

 

10

Определение силы

Дисперсионный анализ - сила

Дисперсионный ана-

влияния

различ-

влияния η2

 

лиз - сила влияния η2

ных

факторов

на

 

 

 

 

 

вариабельность

 

 

 

 

 

 

явлений,

призна-

 

 

 

 

 

ков

 

 

 

 

 

 

 

 

 

Оценка

 

достовер-

Средняя ошибка средней ариф-

Средняя ошибка от-

ности обобщенной

метической, графики

 

носительного показа-

характеристики

 

 

 

 

теля, графики

(средней

арифме-

 

 

 

 

 

тической

относи-

 

 

 

 

 

тельного показате-

 

 

 

 

 

ля)

 

 

 

 

 

 

 

 

 

Оценка

 

значимо-

а) попарно сопряженные сово-

Средняя ошибка раз-

сти различий двух

купности: средняя ошибка раз-

ности показателей,

совокупностей

 

ности средних, критерий t, кри-

критерий Шеллинга –

 

 

 

 

 

терий

знаков,

максимум-

Вольфеля, методы

 

 

 

 

 

критерий,

критерий Вилкоксона

стандартизации, кри-

 

 

 

 

 

б) несопряженные совокупно-

терий χ2

 

 

 

 

 

 

сти: средняяя ошибка разности

 

 

 

 

 

 

 

средних, критерии t, Уайта,

 

 

 

 

 

 

 

Вилкоксона; критерий χ2, се-

 

 

 

 

 

 

 

рийный

критерий,

критерий

 

 

 

 

 

 

 

Колмогорова - Смирнова

 

 

Оценка

 

значимо-

Дисперсионный анализ, крите-

Дисперсионный ана-

сти

различий 3

и

рий F

 

 

лиз, критерий F, кри-

более

совокупно-

 

 

 

терий χ2

 

стей

 

 

 

 

 

 

 

 

 

Определение связи

Коэффициент корреляции, ко-

Коэффициент корре-

между явлениями

эффициент регрессии, корреля-

ляции,

критерий

 

 

 

 

 

ционное отношение, коэффици-

Спирмена,

критерий

 

 

 

 

 

ент сопряженности, графики

Кендела,

коэффици-

 

 

 

 

 

 

 

 

ент ассоциации, ко-

 

 

 

 

 

 

 

 

эффициент

сопря-

 

 

 

 

 

 

 

 

женности

 

Оценка

динамики,

Метод наименьших квадратов,

Показатели динами-

тенденции

 

метод расчета скользящей сред-

ческого ряда, графи-

 

 

 

 

 

ней, показатели динамического

ки

 

 

 

 

 

 

ряда, графики

 

 

 

11