Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2_kurs / информатика / informatika_metodichka,2016

.pdf
Скачиваний:
774
Добавлен:
03.09.2017
Размер:
16.72 Mб
Скачать

Результаты сохраните в текстовом файле. Сделайте выводы. Запишите в тетрадь.

Шаг – 16. Сохраните созданный текстовый документ в формате ...*odt в папке Documents, в разделе Student. Название файла должно соответствовать фамилии студента, который его создал.

Шаг – 17. Сделайте обобщенные выводы по практическому заданию и запишите результаты в тетрадь в виде Отчета к практическому заданию 2.

Шаг – 18. Представьте выполненное задание преподавателю.

Приложение 16

НАБОР ЗАДАНИЙ ДЛЯ ПРОВЕРКИ ДОСТИЖЕНИЯ КОНКРЕТНЫХ ЦЕЛЕЙ ОБУЧЕНИЯ

1. Тестовые задания для самоконтроля

Тест № 1. При проведении регрессионного анализа в программе StatMed были получены три разных модели. По каким критериям может быть избрана оптимальная модель:

А. Имеет наивысшую степень линейности В. Имеет наибольший коэффициент множественной корреляции

С. Имеет наименьший по модулю коэффициент корреляции. D. Имеет наибольший по модулю коэффициент корреляции. F. Приближена к нормальному распределению

Тест № 2. В научной публикации говорится о применении «ранговой корреляции». В каких случаях этот метод может использоваться?

А. Когда двухмерная совокупность имеет нормальное распределение В. Когда проверяется гипотеза о корреляционной связи переменных при

непараметрическом типе распределения С. Когда необходимо установить форму распределения случайных величин

D. В случае, когда коэффициент корреляции имеет значение менее 0,3 F. Когда нужно сравнить средние значения двух совокупностей

Тест № 3. В статистическом блоке Табличного редактора О. office при построении графиков предусмотренна возможность построения моделей «тренда», которые обозначают как:

191

А. Построение регрессионных зависимостей В. Построение функции детерминированной зависимости

С. Определение силы взаимосвязи между двумя исследуемыми переменными D. Определение справедливости нулевой гипотезы

Тест № 4. Необходимо выяснить наличие статистических различий между двумя выборками значений диастолического давления (одна из выборок подчиняются, а вторая не подчиняется нормальному закону распределения), используя пакет статистического анализа. Для решения задачи нужно выбрать тест:

А. Параметрические тесты. Корреляция Пирсона В. Непараметрические тесты. Корреляция Спирмена

С. Параметрические тесты. Тест Стьюдента и Фишера

D. Непараметрические тесты. Тест Вилкоксона. Тест Колмогорова-Смирнова F. Регрессионный анализ. Простая регрессия

Тест № 5 Необходимо проверить, подчиняется ли нормальному закону распределения значения систолического давления у пациентов по некоторой выборке, используя пакет статистического анализа StatMed. Для решения задачи нужно выбрать тест:

A.Параметрические тесты. Корреляция Пирсона.

B.Параметрические тесты. Гистограмма и нормальность.

C.Параметрические тесты. Описательная статистика.

D.Параметрические тесты. Тест Стьюдента и Фишера.

Тест № 6. Создается система дифференциальной диагностики заболеваний на основании 10 признаков с использованием формулы Байеса. Для построения этой системы необходимо иметь сведения о:

A. Частоте встречаемости каждого признака, условной вероятности каждого

заболевания для каждого из признаков.

 

 

В. Частоте встречаемости хотя бы для половины из признаков,

условной

вероятности каждого заболевания для этой половины.

 

 

С. Частоте встречаемости хотя бы для половины заболеваний,

условной

вероятности проявления каждого из признаков при этих заболеваниях.

 

D. Частоте встречаемости каждого заболевания.

 

 

F. Частоте встречаемости каждого заболевания,

условной

вероятности

проявления каждого из признаков для каждого заболевания.

 

 

Тест № 7 . Коэффициент корреляции между уровнем шума и снижением слуха с учетом стажа у рабочих механосборочного цеха равен r + 0,91. Установленная связь:

А. Обратная и слабая;

B.Обратная и сильная;

C.Прямая и слабая;

D.Прямая и сильная.

Тест № 8 . Для выявления зависимости между ростом и весом следует рассчитать:

А. Коэффициент вариации;

B.Коэффициент корреляции;

C.Коэффициент регрессии.

Тест № 9 . Уравнение регрессии используется для построения:

А. Параболы регрессии;

B.Линии регрессии;

C.Гистограммы регрессии.

192

2. Практические задания для индивидуальной подготовки

ПРАКТИЧЕСКОЕ ЗАДАНИЕ 1. В таблице (см. ниже) приведенные результаты исследования частоты сердечных сокращений (ЧСС) и частоты дыхательных движений (ЧДР) в группе больных с сердечной патологией. Нужно определить, существует ли связь между частотой сердечных сокращений и частотой дыхания при исследуемой патологии.

ЧСС

100

78

80

85

90

95

80

73

82

65

63

 

 

 

 

 

 

 

 

 

 

 

 

ЧД

25

16

18

19

19

21

15

13

14

14

17

 

 

 

 

 

 

 

 

 

 

 

 

ПРАКТИЧЕСКОЕ ЗАДАНИЕ 2. Корреляционный анализ двух случайных признаков. Согласно данным таблицы 6.5. Определить, существует ли связь между рождаемостью и смертностью (на 1000 лиц) в г. Одесса, сделать выводы относительно степени стохастической связи.

 

 

Таблица 6.5

Года

Рождаемость

Смертность

 

 

 

 

 

1990

7,2

15,8

 

1991

7,6

16,9

 

1992

8,1

13,1

 

1993

8,5

12,4

 

1994

9,1

11,2

 

1995

9,3

10,5

 

1996

7,4

15,5

 

1997

6,6

17,4

 

1998

7,1

15,2

 

1999

7,0

15,9

 

2000

6,6

17,2

 

 

 

 

 

ПРАКТИЧЕСКОЕ ЗАДАНИЕ 3. При обследовании эндокринологических больных было обнаружено влияние отдельных гормонов на длительность госпитализации при данной патологии. Проведите статистический анализ и определите характер влияния уровня Кр и Тс на длительность болезни в группах больных с разной патологией, оцените межгрупповые различия, используя прикладную программу “Statmed”. Проведите расчеты, запишите Ваши рассуждения. Постройте гистограммы и графики. Сделайте выводы.

Группа 1 – нарушение

группа 2 – нарушение

углеводного обмена

жирового обмена

Дб 1

Кр 1

Тс 1

Дб 2

Кр 2

Тс 2

10

460

17,25

11

276

20,44

10

457

16,02

8

479

5,82

11

457

2,58

9

704

19,96

12

610

27,37

9

524

19,16

5

234

8,97

10

604

21,58

5

350

7,15

5

558

12,33

193

 

6

350

17,7

4

 

345

6,47

 

 

16

1143

7,23

7

 

345

14,09

 

 

4

340

6,99

7

 

360

10,44

 

 

8

480

21,66

4

 

311

5,3

 

 

8

626

5,36

8

 

437

14,23

 

 

6

370

16,03

6

 

114

7,23

 

 

6

315

15,7

4

 

340

6,99

 

 

14

949

13,87

14

 

480

21,66

 

 

5

305

11,43

4

 

626

5,36

 

 

7

601

5,4

14

 

370

16,03

 

 

12

1577

6,58

12

 

315

15,7

 

 

5

266

8,1

11

 

949

13,87

 

 

5

266

14,21

16

 

461

12,2

 

 

7

522

17,2

16

 

489

27,66

 

 

8

428

5,79

10

 

502

13,54

 

 

8

442

13,03

6

 

345

7,12

 

 

6

345

7,12

7

 

255

5,92

 

 

7

321

10,85

5

 

480

3,2

 

 

4

194

13,34

7

 

321

10,85

 

 

4

305

11,43

10

 

194

13,34

 

 

10

601

5,4

14

 

460

17,25

 

 

16

1577

6,58

10

 

457

16,02

 

 

6

266

8,1

4

 

457

2,58

 

 

4

266

14,21

15

 

610

27,37

 

 

8

522

17,2

10

 

234

8,97

 

 

5

428

5,79

12

 

350

7,15

 

 

6

461

12,2

8

 

811

17,87

 

 

6

489

27,66

10

 

345

11,29

 

 

7

502

13,54

16

 

811

17,87

 

 

4

276

20,44

8

 

345

11,29

 

 

8

479

5,82

9

 

453

15,79

 

 

9

704

19,96

4

 

502

3,1

 

 

8

524

19,16

12

 

489

12,13

 

 

10

505

8,74

10

 

353

12,15

 

 

9

505

31,62

12

 

522

17,2

 

 

4

193

3,18

3

 

428

5,79

 

 

10

604

21,58

8

 

442

13,03

 

Дб ="Длительность заболевания"

Кр ="Кортизол"

Тс ="Тестостерон"

194

ТЕМА 17

ТЕОРЕТИЧЕСКИЕ ПРИНЦИПЫ СОЗДАНИЯ КОМПЬЮТЕРНЫХ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ

АКТУАЛЬНОСТЬ ТЕМЫ

Процесс принятия медицинских решений можно представить в виде цикла, состоящего из последовательных, следующих друг за другом 6 процедур. Первые три процедуры реализуют сбор, обработку и анализ медицинской информации. Четвертая процедура – это поддержка принятия решения, включающая концептуальное или математическое моделирование, выработку альтернатив и выбор тех моделей, которые в наибольшей степени удовлетворяют поставленным целям, что применительно к медицине означает выбор в конечном итоге оптимального пути лечения больного. Пятая и шестая процедуры включают выбор совокупности наиболее эффективных медицинских мероприятий и их реализацию. После чего цикл замыкается и начинается вновь со сбора информации и т. д.

ЦЕЛИ ОБУЧЕНИЯ

Общая цель - овладеть навыками выявлять статистические зависимости между параметрами биологической системы путем построения и коррекции регрессионных моделей с использованием современных универсальных статистических пакетов.

Конкретные цели:

1.Овладеть умением выбирать метод регрессионного анализа и реализовать избранный метод в пакетах прикладных программ.

2.Овладеть умением выбора нелинейного регрессионного уравнения параметров гемодинамики большого круга кровообращения человека.

3.Овладеть навыками коррекции нелинейных регрессионных моделей.

ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ

1.Многофакторная линейная регрессионая модель. Уравнение регрессии.

2.Методы оценки адекватности моделей регрессии: оценка адекватности по F- критерию, множественный коэффициент корреляции, доля необъясненной дисперсии.

3.Нелинейные модели регрессии. Нейросетевые модели регрессии.

4.Модели классификации. Логистическая регрессионная модель. Нейросетевые модели классификации.

ГРАФ ЛОГИЧЕСКОЙ СТРУКТУРЫ ТЕМЫ «ТЕОРЕТИЧЕСКИЕ ПРИНЦИПЫ СОЗДАНИЯ

КОМПЬЮТЕРНЫХ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ»

195

ИСТОЧНИКИ ИНФОРМАЦИИ

Основная литература

1.Лях Ю.Е., Гурьянов В.Г., Хоменко В.Н., Панченко О.А. Основы компьютерной биостатистики: анализ информации в биологии, медицине и фармации статистическим пакетом Medstat.–Д.: Папакица Е.К., 2006.–214 с.

2.Гланц С. Медико-биологическая статистика.– М.: Практика, 1999.– 459с.

3.Петри А., Сэбин К. Наглядная статистика в медицине / Пер. с англ. В.П. Леонова. – М.: ГЭОТАР-МЕД. 2003. – 144с.

4.Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях-2-оевид.перероб.и доп.-М.:ГЕОТАР-медіа,2006.-304с.

Дополнительная литература

5.Москаленко В.Ф., Гульчий А.П., Голубчиков М.В. и др. Биостатистика.– К.:

Книга Плюс, 2009.– 184 с.

6.Лобоцкая Н.Л. и др. Высшая математика. Минск1987. стр.132-146.

7.Минцер О.П. и др. Методы обработки медицинской информации. Киев - 1991.

стр. 16-19.

КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ К ТЕМЕ № 17

Методы многомерного анализа (англ. multivariate или multivariable analysis)

разработаны для оценки одновременного влияния более чем одного фактора на результат (исход). В отличие от одномерной статистики, которая дает оценку того, как каждая (одна) переменная связана с интересующим нас результатом, многомерная статистика дает информацию о степени влиянии на исход каждой из (многих) переменных, а также об эффекте взаимодействия этих переменных между собой. В отечественной литературе многомерный анализ часто называют многофакторным анализом.

Для примера, выдвигается предположение о том, что пациенты травматологического отделения, оперированные в 9 часов утра, имеют более высокий показатель смертности, чем пациенты, оперированные в 9 часов вечера. Анализируя смертность после операции одномерным (параметрическим или непараметрическим) статистическим методом, исследователь, допустим, действительно может обнаружить достоверную разницу. Однако было бы ошибочным полагать, что время суток является единственным определяющим фактором. В анализ должны быть включены и другие

196

переменные, такие как тяжесть травмы, возраст больного, плановые или срочные показания к операции, и т.п. После этого время операции, скорее всего, будет исключено из набора факторов, влияющих на смертность пациентов, или его вклад окажется очень малым по сравнению с истинными причинами. Лишь используя многомерный анализ, исследователь может сделать обоснованный вывод о причинах, влияющих на вариабельность результата и оценить степень одновременного влияния на него этих, нередко (в той или иной степени) взаимосвязанных, причин.

Факторы (причины), влияющие на исход, принято называть факторами риска

(risk factors), независимыми (independent) или объясняющими переменными

(explanatory variable), а сам исход (outcome) - зависимой (dependent) или переменной отклика (response variable) или эффектом.

Важным моментом, обусловливающим необходимость многомерного анализа, является именно многообразие потенциальных факторов риска, возможно связанных с исходом. Экспериментальная проверка совместного влияния многих факторов в клинической практике чаще всего просто невозможна или недопустима по этическим соображениям. Положим, нужно выяснить повышает ли курение вероятность ИБС в двух случайных выборках людей, одни из которых курят, другие - нет (заставить человека курить или не курить на протяжении долгого времени и невозможно, и неэтично). Хотя предварительный одномерный статистический анализ показывает, что ИБС у курящих развивается с большей вероятностью, чем у некурящих, этот результат сам по себе еще не является доказательством причинной связи курения с ИБС, хотя может и «намекать» на наличие таковой. В принципе нельзя исключить, что более вескими причинами развития ИБС у курящих является то, что в большинстве своем это мужчины, малообеспеченные и ведущие малоподвижный образ жизни. Привычка к курению характерна именно для такой категории лиц, а все перечисленные качества повышают риск ИБС, что известно из других исследований.

В рассмотренном примере на связь между курением и ИБС могут влиять так называемые мещающие факторы (конфаундеры; англ. confounders). О мешающих факторах говорят, когда на видимую связь между фактором риска и независимой переменной (результатом), оказывается влияние со стороны третьей переменной, влияющей как на фактор риска, так и непосредственно (причинно) на сам результат, как показано на Рис. 1. Мужской пол, малообеспеченность и малоподвижный образ жизни вполне могут оказаться мешающими факторами, поскольку они ассоциированы как с курением, так и с ИБС.

Фактор риска ----------------------------------------------------------

Результат

Мешающий фактор (конфаундер)

Рис. 1. Схема взаимодействия факторов, влияющих на результат (в данном случае, ИБС).

В итоге, многомерный анализ показывает, что даже с поправкой (учетом, нормализацией; англ. adjustment) на мужской пол, малообеспеченность или малоподвижный образ жизни, курение оказывает независимое влияние на развитие ИБС (см. Рис. 2).

Определить какая переменная является независимым фактором риска, а какая конфаундером иногда невозможно ввиду того, что один и тот же фактор может оказывать как независимый эффект на результат, так и быть мешающим фактором, влияющим на другую переменную. Возвращаясь к ситуации с ИБС, малообеспеченность является мешающим фактором взаимосвязи между курением и

197

заболеванием: вероятность того, что малообеспеченные люди злоупотребляют курением повышена, а у курящих повышена вероятность развития ИБС. С другой стороны, малообеспеченность сама по себе самостоятельно влияет на развитие ИБС: даже с учетом (поправки) курения, уровня холестерина крови, артериальной гипертензии и пр. у малообеспеченных лиц ИБС развивается с большей вероятностью, чем у людей с высоким достатком.

Мужской пол

Малообеспеченность ________________________________

Курение ^ZL^^^ c Малоподвижный образ жизни

Рис. 2. Оценка степени влияния различных потенциальных факторов на результат (в данном случае - ИБС)

Заметим, что многомерный анализ является не единственным статистическим методом учета влияния или исключения конфаундеров. Оценить влияние фактора риска на исход можно также с помощью условного анализа, при котором изучаемая группа последовательно разбивается на подгруппы (страты), в которых какая-либо потенциально мешающая переменная «фиксируется». При этом модель применяется отдельно на каждой группе данных. И на каждой группе данных, вообще говоря, будет получен разный эффект и разные оценки параметров модели. Например, мужской и женский пол: далее рассматривают только курящие или некурящие мужчины и только курящие или некурящие женщины. Условный анализ эффективен когда изучается относительно небольшое число факторов (два-три). Если же потенциально мешающих факторов много, дробление приводит к образованию большого числа малочисленных выборок, в которых оценки рисков могут оказаться нестабильными (см. раздел 1.4.).

Стратификация (stratification) является способом включения в одну модель всех групп данных с разными значениями мешающих факторов таким образом, чтобы зависимость эффекта от интересующих исследователя независимых переменных подгонялась по всему множеству данных, а зависимость от мешающих факторов - только по соответствующим подгруппам. Например, пропорциональная модель радиационного риска может состоять из произведения двух членов: фонового риска, который зависит от пола, и относительного радиационного риска, который считается одинаковым для обоих полов. В этом случае говорят, что в модели риска произведена стратификация фонового риска по полу. В общем случае, чтобы определить коэффициенты модели при интересующих независимых переменных, должна быть оценена вся модель, включая коэффициенты при мешающих факторах.

В случае применения стратификации иногда удаётся построить модель, в которой оценка интересующих исследователя переменных может быть проведена без оценки мешающих факторов. Построение таких моделей (а, соответственно, и схем исследования или выборок) с математической точки зрения весьма нетривиально. Примером является модель случай - контроль с подбором контролей к случаям по значениям мешающих параметров, разбитых на страты (matched case-control study). В этой модели отношение шансов по интересующему фактору определяется без оценки мешающих факторов. В силу математических обстоятельств, такие модели чаще всего применяются на условных выборках, которые абсолютно искажают величину эффекта в популяции, но позволяют всё-таки оценить степень статистической связи между изучаемой переменной и эффектом. Например, в условной подобранной модели случай

- контроль (conditional matched case-control model) к каждому из N случаев подбирается М контролей, по полу, возрасту, месту проживания и ряду других признаков. Ясно, что

198

вполученной выборке частота случаев не имеет никакого отношения к частоте случаев

висходной популяции. Но отношение шансов, как мера статистической связи между изучаемым фактором и эффектом, определяется независимо от мешающих факторов, по которым производился подбор контролей к случаям. Такой способ позволяет проводить анализ влияния факторов риска с высокой мощностью даже в сравнительно небольших выборках. Однако, надо отдавать себе отчёт в том, что условные модели, основанные на условных выборках - это не то же самое, что модели, основанные на натуральных выборках (не искажающих статистических свойств популяции), в которых оценивается полный набор всех переменных. Например, отношения шансов, полученные в когортной модели заболеваемости и в условной модели случай-контроль

– это разные отношения шансов, хотя и численно близкие в не слишком экзотических случаях.

Напомним, что терминологически не следует путать условный анализ путём независимой подгонки модели на независимых подгруппах и условные модели, основанные на условных выборках.

ЗАДАНИЯ ДЛЯ ДОСТИЖЕНИЯ КОНКРЕТНЫХ ЦЕЛЕЙ ОБУЧЕНИЯ ПО ТЕМЕ № 17

ПРАКТИЧЕСКОЕ ЗАДАНИЕ № 1. Построить многофакторную математическую модель для МОК (минутный объем крови) и определить его зависимость от параметров: возраст, масса, рост, систолическое артериальное давление, диастолическое артериальное давление. Создать корреляционную матрицу.

На базе этой матрицы провести отбор параметров, записывая ход рассуждений. Выявить параметры больше всего оказывающие влияние на МОК. Записать построенную одномерную или многомерную модель, необходимые уравнения, объясняя ход рассуждений. Данные представлени в файле ррр 1. mtv (ррр 1.ods).

Используемые компьютерные программы:

1.Операционные системы: Linux

2.Прикладные программы общего назначения: O. Office Write, O. Office Calc.

3.Прикладные программы «StatMed», «MedStat», «Statistica», «MedCalc»

Алгоритм выполнения практического задания 1:

Шаг – 1. Включите компьютер. Дождитесь загрузки установленной операционной системы. Зайдите в меню “Start”.

199

Шаг – 2. В разделе учебные программы для студентов найдите и запустите программу

«StatMed».

Шаг – 3. Откройте директорию «Данные», выберите «Загрузить данные».

Шаг – 4. В открывшемся окне выберите файл ррр 1.mtv. Нажмите «Открыть». Убедитесь в открытии файла ррр 1.

Шаг – 5. Используя функцию выбора переменных, скрыть все переменные за исключением возраста, массы, роста, систолического и диастолического давления, МОК.

200

Соседние файлы в папке информатика