
2_kurs / информатика / informatika_metodichka,2016
.pdf
Шаг – 2. Для проведения описательной статистики выберем соответствующий пункт в программе MedStat – Описательная статистика (таблицы 2 m).
Шаг – 3. Для проведения сравнения выберем соответствующий пункт в программе
MedStat – Сравнения доли (таблицы 2 2).
171
Шаг – 4. Полученные результаты представим в виде отчета к практической работе.
Отчет.
Практическое задание 2.
1) Представим интервальную оценку частоты встречаемости гипертензии для группы курящих и некурящих (таблица 1).
Таблица 1. Интервальная оценка частоты встречаемости гипертензии.
|
|
Частота встре- |
Частота встре- |
|
Группа |
Объем выборки |
чаемости |
чаемости |
|
патологии, |
патологии, % (95% |
|||
|
|
|||
|
|
абс. кол-во |
ДИ) |
|
Курящие |
111 |
66 |
59,5 (50,1–68,5) |
|
Некурящие |
69 |
21 |
30,4 (20,0–41,9) |
2)Для проведения сравнения частоты встречаемости гипертензии в двух группах используем метод углового преобразования Фишера (с учетом поправки Йейтса).
Получим: значение критерия T=3,70, число степеней свободы k=178; выявлено отличие на уровне значимости p<0,001.
3)ВЫВОД.
В результате проведенного статистического анализа выявлена связь курения с частотой возникновения гипертензии, установлено, что в группе курящих вероятность проявления патологии статистически значимо (p<0,001) выше, чем в группе некурящих.
ПРАКТИЧЕСКОЕ ЗАДАНИЕ № 3. В исследованиях пищевого рациона в трех группах мышей возрастом 1 месяц использовались различные добавки (к их стандартному рациону). Ниже, в таблице, приводится изменение их веса (% ) в течении последующего месяца проведения эксперимента. Оценить, отличаются ли пищевые добавки по их влиянию на увеличение веса мышей.
Д1 |
7,1 |
7 |
7 |
8,6 |
8,2 |
6,6 |
6,8 |
6,7 |
7,7 |
Д2 |
7,6 |
7,3 |
7,3 |
8,3 |
7,6 |
6,6 |
6,7 |
6,8 |
7 |
Д3 |
9,2 |
8,3 |
9,1 |
9 |
8,9 |
9 |
9,2 |
7,6 |
8,1 |
Используемые компьютерные программы:
1.Операционные системы: Linux
2.Прикладные программы общего назначения: Open Office Write, Open Office
Calc.
3. Прикладные программы «StatMed», «MedStat».
Алгоритм выполнение практического задания 3:
Шаг – 1. Представленные данные являются количественными – в программе MedStat
выберем пункт: Данные|Новые данные|Вариационный ряд и введем результаты.
172

Шаг – 2. Проведем проверку распределения значений привеса мышей на нормальность.
Шаг – 3. Т. к. для одной из групп выявлено отличие распределения значений от нормального на уровне значимости p=0,04, то для проведения описательной статистики выберем соответствующий пункт в программе MedStat – Описательная статистика.
173

Шаг – 4. Для проведения сравнения выберем непараметрические критерии сравнения, т.к. нас интересует сравнение всех групп между собой (а не сравнения с контрольной группой), то выберем соответствующий пункт в программе MedStat (рисунок Д) –
Множественные сравнения.
Шаг – 5. Полученные результаты представим в виде отчета к практической работе.
|
|
Отчет. |
|
|
Практическое задание 3. |
|
|
1) При проведении |
проверки |
распределения значений |
привеса мышей |
использовался критерий W Шапиро-Уилка. |
|
||
Установлено, что для |
рационов |
Д1 и Д2 распределения значений привеса не |
отличается от нормального на уровне значимости p>0,1. Для рациона Д3 распределение значений привеса отличается от нормального, p=0,04.
2) Для представления точечной оценки значений привеса в таблице 1 приведены медианные значения уровня лейкоцитов в крови животных (Me) и ошибка медианы
(m).
Таблица 1. Оценка среднего значения привеса мышей.
Рацион питания |
Количество |
Среднее значение привеса, Me m, |
|
мышей |
% |
||
|
|||
Д1 |
9 |
7,0±0,3 |
|
Д2 |
9 |
7,3±0,2 |
|
Д3 |
9 |
9,0±0,2 |
3) На рисунке 1 представлена интервальная оценка медианы показателей привеса для различных рационов питания.
174

Рисунок 1. Интервальная оценка медианы показателей привеса мышей для различных рационов питания (указана медиана, стандартная ошибка и 95% ДИ оценки медианы).
4)Т.к. распределение значений привеса в группе с рационом Д3 отличается от нормального (p=0,04), то для проведения сравнения используем непараметрические критерии.
Для ответа на вопрос о влиянии рациона питания на значения привеса используем ранговый однофакторный анализ Крускала-Уоллиса.
Получим: значение критерия H=13,6, число степеней свободы k=2. Выявлено отличие на уровне значимости p=0,001.
5)Для проведения множественных сравнений используем критерий Данна. Получим:
Переменные: Д1, Д2. Q=0,07. Различие не является статистически значимым, p>0,05. Переменные: Д1, Д3. Q=3,15. Различие является статистически значимым на уровне значимости p<0,01.
Переменные: Д2, Д3. Q=3,23. Различие является статистически значимым на уровне значимости p<0,01.
6) ВЫВОД.
Выявлено влияние рациона питания на увеличение веса мышей (p=0,001 по критерию Крускала-Уоллиса). Установлено, что рацион Д3 дает статистически значимо (p<0,01) больший привес, чем рационы Д1 и Д2. Статистически значимого различия привеса мышей между группами с рационом питания Д1 и Д2 не выявлено, p>0,05.
Приложение 15
НАБОР ЗАДАНИЙ ДЛЯ ПРОВЕРКИ ДОСТИЖЕНИЯ КОНКРЕТНЫХ ЦЕЛЕЙ ОБУЧЕНИЯ
1. Тестовые задания для самоконтроля
Тест № 1. Необходимо обнаружить наличие статистической связи между массой студентов и их ростом (данные подчиняются нормальному закону распределения), используя пакет статистического анализа. Для решения задачи нужно выбрать тест:
А. Корреляция Пирсона В. Корреляция Спирмена
175
С. Тест Стьюдента и Фишера
D. Тест Вилкоксона. Тест Колмогорова-Смирнова Е. Регрессионный анализ. Простая регрессия
Тест № 2. Необходимо обнаружить наличие статистической связи между ростом студента и его оценкой на экзамене по биологической физике (одна из выборок подчиняется нормальному закону распределения), используя пакет статистического анализа. Для решения задачи нужно выбрать тест:
А. Корреляция Пирсона В. Корреляция Спирмена
С. Тест Стьюдента и Фишера
D. Тест Вилкоксона. Тест Колмогорова-Смирнова Е. Регрессионный анализ. Простая регрессия
Тест № 3. Необходимо выяснить статистическую значимость разницы между двумя выборками значений минутного объема крови МОК (данные не подчиняются нормальному закону распределения), используя пакет статистического анализа. Для решения задачи нужно выбрать тест
А. Корреляция Пирсона В. Корреляция Спирмена
С. Тест Стьюдента и Фишера
D. Тест Вилкоксона. Тест Колмогорова-Смирнова Е. Регрессионный анализ. Простая регрессия
Тест № 4. Необходимо проверить, подчиняет ли нормальному закону распределения величины систолического давления у пациентов в некоторой выборке, используя пакет статистического анализа. Для решения задачи нужно выбрать тест:
А. Критерий Хи-квадрат, тест Пирсона В. Корреляция Спирмена С. Тест Стьюдента и Фишера
D. Тест Вилкоксона. Тест КолмогороваСмирнова Е. Регрессионный анализ. Простая регрессия
Тест № 5. Необходимо выяснить статистическую значимость разницы между данными масс тела двух групп пациентов (данные подчиняются нормальному закону распределения), используя пакет статистического анализа. Для решения задачи нужно выбрать тест:
А. Корреляция Пирсона В. Корреляция Спирмена
С. Тест Стьюдента и Фишера
D. Тест Вилкоксона. Тест Колмогорова-Смирнова Е. Регресийний анализ. Простая регрессия
Тест № 6. При проведении статистической обработки данных экспериментальных исследований у студента возникла необходимость в проведении многофакторного дисперсионного анализа. Какую программу лучше всего избрать:
A.Open Office Calc (Microsoft Excel)
B.Open Office Writer (Microsoft Word)
C.Open Office Base (Microsoft Access)
D.Statistica
E.Open Office Impress (Microsoft Front Page)
2. Практические задания для индивидуальной подготовки
ПРАКТИЧЕСКОЕ ЗАДАНИЕ № 1. При обследовании больных с церебральным атеросклерозом были обнаружены различные проявления болезни у мужчин и женщин. Проведите статистический анализ результатов исследований, докажите влияние ЛПВП на АД
176
с учетом гендерного признака, сравните значения АДс, АДд и уровень ЛПВП у мужчин и женщин, используя прикладную программу “Statmed”. Проведите расчеты описывая ход Ваших рассуждений. Постройте гистограммы и графики. Сделайте выводы.
|
Женщины |
|
Мужчины |
|
|
АД с |
АД д |
ЛПВП |
АД с |
АД д |
ЛПВП |
120 |
70 |
1,39 |
130 |
90 |
0,978 |
110 |
90 |
1,40 |
120 |
85 |
1,31 |
130 |
90 |
1,84 |
130 |
90 |
1,29 |
120 |
80 |
1,12 |
120 |
80 |
1,2 |
100 |
70 |
1,06 |
100 |
60 |
1,17 |
120 |
70 |
1,34 |
130 |
90 |
1,37 |
120 |
90 |
1,54 |
140 |
90 |
0,71 |
110 |
80 |
1,15 |
135 |
85 |
0,67 |
110 |
80 |
1,16 |
125 |
80 |
1,51 |
130 |
80 |
1,05 |
115 |
70 |
1,41 |
125 |
80 |
1,13 |
150 |
80 |
1,4 |
120 |
70 |
1,77 |
120 |
85 |
1,22 |
110 |
75 |
1,19 |
140 |
90 |
0,61 |
110 |
70 |
1,61 |
120 |
80 |
0,63 |
135 |
100 |
2,1 |
130 |
90 |
1,24 |
110 |
80 |
1,39 |
120 |
80 |
0,93 |
120 |
70 |
1,03 |
100 |
80 |
0,77 |
130 |
80 |
1,24 |
150 |
80 |
1,65 |
120 |
90 |
2,4 |
120 |
80 |
0,73 |
120 |
80 |
1,18 |
150 |
95 |
1,25 |
120 |
80 |
1,39 |
140 |
90 |
0,31 |
120 |
90 |
1,73 |
140 |
90 |
1,29 |
110 |
60 |
2,38 |
140 |
100 |
1,4 |
130 |
100 |
2,25 |
140 |
90 |
0,81 |
130 |
70 |
1,83 |
120 |
90 |
0,7 |
100 |
70 |
1,86 |
130 |
90 |
1,28 |
125 |
100 |
2,77 |
135 |
85 |
1,06 |
110 |
80 |
1,53 |
130 |
80 |
1,08 |
105 |
70 |
1,32 |
123 |
76 |
1,21 |
110 |
80 |
1,29 |
138 |
80 |
1,09 |
130 |
90 |
1,63 |
126 |
82 |
1,03 |
130 |
80 |
1,45 |
130 |
90 |
1,26 |
110 |
80 |
1,69 |
140 |
90 |
1,05 |
110 |
80 |
1,5 |
125 |
80 |
1,5 |
120 |
90 |
2,24 |
140 |
90 |
1,3 |
120 |
80 |
1,34 |
150 |
100 |
0,7 |
160 |
90 |
1,54 |
130 |
90 |
1,4 |
120 |
90 |
1,62 |
130 |
90 |
1,01 |
130 |
80 |
1,66 |
140 |
90 |
1,18 |
130 |
85 |
1,45 |
120 |
90 |
1,47 |
120 |
80 |
1,61 |
150 |
90 |
1,13 |
120 |
80 |
1,17 |
130 |
90 |
1,32 |
АД с = "артериальное давление систолическое", АД д = "артериальное давление диастолическое", ЛПВП = "липопротеиды высокой плотности"
177
РАЗДЕЛ № 8. ОСНОВЫ КОМПЬЮТЕРНОГО МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ
В современной информатике методы математического моделирования приобрели новое, более глубокое содержание и открыли широкие возможности для решения сложных многомерных задач в биологии, фармации и медицине. Многомерность, нестационарность и нелинейность биологических явлений таковы, что математические подходы дают практически единственную возможность для их достаточно полного теоретического исследования. Математическое моделирование невозможно без применения современных персональных ЭВМ. В связи с этим огромное значение в практической подготовке врача приобретают вопросы получения навыков работы с прикладными программами, которые позволяют осуществить не только статистическую обработку полученной информации, а также построение моделей, необходимых для исследования поведения биологических систем.
ТЕМА № 16
КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ
АКТУАЛЬНОСТЬ ТЕМЫ
Существующие между явлениями формы и виды связей весьма разнообразны по своей классификации. Предметом статистики являются только такие из них, которые имеют количественный характер и изучаются с помощью количественных методов. Рассмотрим метод корреляционно-регрессионного анализа, который является основным в изучении взаимосвязей явлений.
Данный метод содержит две свои составляющие части — корреляционный анализ и регрессионный анализ. Корреляционный анализ — это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Регрессионный анализ — это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами.
ЦЕЛИ ОБУЧЕНИЯ Общая цель – познакомиться с основными понятиями корреляционного и
регрессионного анализа, уметь их использовать для обработки медико-биологических данных.
Конкретные цели:
1.Уметь интерпретировать функциональную и корреляционную зависимости.
2.Уметь интерпретировать свойства коэффициента корреляции, его статистическую значимость
3.Уметь демонстрировать навыки построения регрессионного уравнения и корректировку модели на основе расчетных коэффициентов корреляции.
ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ
1.Функциональная и статистическая связь между признаками.
2.Корреляцонная связь. Коэффициент корреляции.
3.Коэффициент корреляции Пирсона. Свойства коэффициента корреляции, сила корреляционной связи.
178

4.Коэффициент ранговой корреляции Кендалла, ранговой корреляции Спирмена. Свойства коэффициента корреляции, сила корреляционной связи.
5.Корреляционная и причинно-следственная связь между признаками. (1 с.29-
32)
6.Регрессионный анализ. Предмет регрессионного анализа.
7.Однофакторная линейная регрессионная модель. Уравнение регрессии.
ГРАФ ЛОГИЧЕСКОЙ СТРУКТУРЫ К ТЕМЕ: «КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ»
ИСТОЧНИКИ ИНФОРМАЦИИ
Основная литература:
1.Лях Ю.Е., Гуръянов В.Г., Хоменко В.Н., Панченко О.А. Основы компьютерной біостатістики:анализинформациив биологии,медицинеифармациистатистическимпакетом
MedStat.-Д.:ПапакицаЕ.К.,2006.- С.214 с.
2.Гланц С. Медико-биологическая статистика.– М.: Практика, 1999.– 459с.
3.Петри А., Сэбин К. Наглядная статистика в медицине / Пер. с англ. В.П.
Леонова. – М.: ГЭОТАР-МЕД. 2003. – 144с.
Дополнительная литература:
4.Свердан П.Л. Висшая математика. Анализ информации в фармации и медицине: Учебник. - Львов: Свет, 1998.- 332 с.
5.Москаленко В.Ф., Гульчий О.П., Голубчиков М.В. та др. Биостатистика.– К.:
Книга Плюс, 2009.– 184 с.
6.Лобоцкая Н.Л. и др. Высшая математика. Минск1987. С.132-146.
7.Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях-2-оевид.перероб.и доп.-М.:ГЕОТАР-медіа,2006.-304с.
КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ К ТЕМЕ № 16
Определение корреляции. Корреляция представляет собой меру зависимости переменных. Наиболее известна корреляция Пирсона. При вычислении корреляции Пирсона предполагается, что переменные измерены, как минимум, в интервальной шкале. Некоторые другие коэффициенты корреляции могут быть вычислены для менее информативных шкал. Коэффициенты корреляции изменяются в пределах от -1,0 до +1,0. Обратите внимание на крайние значения коэффициента корреляции. Значение -1,0
179
означает, что переменные имеют отрицательную корреляционную связь. Значение +1,0 означает, что переменные имеют положительную корреляционную связь. Отметим, что значение 0 означает отсутствие корреляционной связи между переменными.
Простая линейная корреляция (Пирсона, r). Корреляция Пирсона (далее называемая просто корреляцией) предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале. Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу. Важно, что значение коэффициента корреляции не зависит от масштаба измерения. Например, корреляция между ростом и весом будет одной и той же, независимо от того, проводились измерения в дюймах и фунтах или в сантиметрах и килограммах. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость "можно представить" прямой линией (с положительным или отрицательным углом наклона).
Проведенная прямая называется прямой регрессии или прямой, построенной методом наименьших квадратов. Последний термин связан с тем, что сумма квадратов расстояний (вычисленных по оси Y) от наблюдаемых точек до прямой является минимальной. Заметим, что использование квадратов расстояний приводит к тому, что оценки параметров прямой сильно реагируют на выбросы.
Коэффициент корреляции Пирсона (r) представляет собой меру линейной зависимости двух переменных. Если возвести его в квадрат, то полученное значение коэффициента детерминации r2 представляет долю вариации, общую для двух переменных (иными словами, "степень" зависимости или связанности двух переменных). Чтобы оценить зависимость между переменными, нужно знать как "величину" корреляции, так и ее значимость.
Уровень значимости, вычисленный для каждой корреляции, представляет собой главный источник информации о надежности корреляции. Значимость определенного коэффициента корреляции зависит от объема выборок. Критерий значимости основывается на предположении, что распределение остатков (т.е. отклонений наблюдений от регрессионной прямой) для зависимой переменной Y является нормальным (с постоянной дисперсией для всех значений независимой переменной X).
Что делать, если корреляция сильная, однако зависимость явно нелинейная? К сожалению, не существует простого ответа на данный вопрос, так как не имеется естественного обобщения коэффициента корреляции Пирсона r на случай нелинейных зависимостей. Однако, если кривая монотонна (монотонно возрастает или, напротив, монотонно убывает), то можно преобразовать одну или обе переменные, чтобы сделать зависимость линейной, а затем уже вычислить корреляцию между преобразованными величинами. Для этого часто используется логарифмическое преобразование.
Другой подход состоит в использовании непараметрической корреляции, например, корреляции Спирмена. Иногда этот метод приводит к успеху, хотя непараметрические корреляции чувствительны только к упорядоченным значениям переменных, например, по определению, они пренебрегают монотонными преобразованиями данных. К сожалению, два самых точных метода исследования нелинейных зависимостей непросты и требуют хорошего навыка работы с данными.
Регрессионный анализ. Регрессией называется зависимость среднего значения одной случайной величины от некоторой другой (или от нескольких случайных величин), а регрессионным анализом раздел математической статистики, объединяющий прикладные методы исследования регрессионных зависимостей. Регрессионный анализ приобрел большую популярность в связи с распространением ЭВМ. При использовании регрессионного анализа важно правильно выбрать вид и степень сложности регрессионной модели. Классический путь состоит в учете биологических, физических и других предпосылок, а качество полученной модели оценивается по величине остаточных отклонений.
180