
2_kurs / информатика / informatika_metodichka,2016
.pdfРАЗДЕЛ № 7. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В КЛИНИЧЕСКИХ ИССЛЕДОВАНИЯХ
На протяжении всей своей истории медицина искала пути повышения эффективности результатов диагностики и лечения. Начиная с интуитивных обобщений, методом проб и ошибок, через осмысление разрозненного эмпирического опыта, она вступила в эпоху доказательности. В настоящее время каждый вывод, предлагаемый специалистам и общественности, основывается на убедительных аргументах, а данные, из которых этот вывод вытекает, должны быть получены в ходе четко спланированного исследования, использующего адекватные методы статистического анализа.
ТЕМА № 14
СТАТИСТИЧЕСКИЙ АНАЛИЗ РЕЗУЛЬТАТОВ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ
АКТУАЛЬНОСТЬ ТЕМЫ
Статистика широко используется при изучении вопросов, которые связаны с медициной, гигиеной и здравоохранением.
Современная практика прикладных статистических исследований показывает, что для решения медико-биологических задач необходимо хорошо ориентироваться в прикладной статистике, теории вероятностей, математическом моделировании и современном программном обеспечении. Это связано с тем, что с развитием медицинской техники и внедрением разнообразной диагностической и электронной аппаратуры, начали накапливаться новые данные, которые имеют количественные характеристики, и характеризуют как состояние и функции организма, так и состояние окружающей среды.
ЦЕЛЬ ОБУЧЕНИЯ
Общая цель - изучить основные понятия и определения биостатистики, уметь применять их для анализа медико-биологических данных.
Конкретные цели:
1.Уметь интерпретировать этапы статистического анализа данных, виды распределений и этапы проверки гипотез.
2.Уметь применять критерии проверки гипотез, оценивать результаты применения параметрических критериев.
3.Уметь демонстрировать навыки использования статистических методов обработки медико-биологических данных.
ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ
1.Цель статистическогно исследования. Прикладная цель исследования.
2.Структура данных в биостатистике. Качественные и количественные признаки. Вторичные данные. Цензурованные данные.
3.Случайные величины и законы их распределения. Нормальный закон распределения. Альтернативный закон распределения.
4.Классификация ошибок измерения. Проверка ошибок и выбросов.
151

5.Точечные оценки параметров распределения случайной величины для нормального закона распределения. Оценка математического ожидания, дисперсии, среднего квадратичного отклонения.
6.Точечные оценки параметров распределения количественной величины при отличии закона ее распределения от нормального. Оценка центра распределения, вариабельности признака. Понятия медианы, моды, квартильная оценка, процентили распределения.
7.Сравнение средних значений двух совокупностей в случае нормального закона распределения. Независимые выборки. Критерий Стьюдента для независимых выборок.
8.Сравнение средних значений двух совокупностей в случае нормального закона распределения. Связанные выборки. Критерий Стьюдента для связанных выборок.
9.Сравнение центров распределений двух совокупностей в случае отличия закона распределения от нормального. Независимые выборки. W–критерий Вилкоксона.
ГРАФ ЛОГИЧЕСКОЙ СТРУКТУРЫ ТЕМЫ № 14 «СТАТИСТИЧЕСКИЙ АНАЛИЗ РЕЗУЛЬТАТОВ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ»
152

ИСТОЧНИКИ ИНФОРМАЦИИ
Основная литература:
1. Гланц С. Медико-биологическая статистика.– М.: Практика, 1999.–
459с.
2.Петри А., Сэбин К. Наглядная статистика в медицине / Пер. с англ. В.П. Леонова. – М.: ГЭОТАР-МЕД. 2003. – 144с.
3.Лях Ю.Е., Гурьянов В.Г., Хоменко В.Н., Панченко О.А. Основы компьютерной биостатистики: анализ информации в биологии, медицине и фармации статистическим пакетом Medstat.–Д.: Папакица Е.К., 2006.–214 с.
4.Москаленко В.Ф., Гульчий А.П., Голубчиков М.В. и др. Биостатистика.– К.:
Книга Плюс, 2009.– 184 с.
Дополнительная литература
5.Лобоцкая Н.Л. и др. Высшая математика. Минск1987. С.132-146.
6.Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях-2-оевид.перероб.и доп.-М.:ГЕОТАР-медіа,2006.-304с.
КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ К ТЕМЕ № 14
Случайной называют такую величину, которая принимает значения в зависимости от стечения случайных обстоятельств. Различают дискретные и случайные
непрерывные величины.
Дискретной называют величину, если она принимает счетное множество значений. (Пример: число пациентов на приеме у врача, число букв на странице, число молекул в заданном объеме).
Непрерывной называют величину, которая может принимать значения внутри некоторого интервала. (Пример: температура воздуха, масса тела, рост человека и т.д.)
Законом распределения случайной величины называется совокупность возможных значений этой величины и, соответствующих этим значениям, вероятностей (или частот встречаемости).
ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН
Во многих случаях наряду с распределением случайной величины или вместо него информацию об этих величинах могут дать числовые параметры , получившие название числовых характеристик случайной величины. Наиболее употребительные из них:
1.Математическое ожидание - (среднее значение) случайной величины есть сумма произведений всех возможных ее значений на вероятности этих значений:
M X x1m1 x2m2 ... ximi x1m1 x2m2 ... ximi
n |
n |
n |
n |
n
x1 p1 x2 p2 x3 p3 ... xn pn xi pi
i 1
2.Дисперсия случайной величины:
153

D x x1 M X 2 m1 x2 M X 2m2 ... xi M X 2 mi n
n
x1 M X 2 p1 x2 M X 2 p2 ... xi M X 2 pi M X xi 2 pi
i 1
3.Среднее квадратичное отклонение:
D x
Правило “ТРЕХ СИГМ” - если случайная величина распределена по нормальному закону, то отклонение этой величины от среднего значения по абсолютной величине не превосходит утроенного среднего квадратичного отклонения
M X 3
ЗАКОН ГАУССА – НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ
Часто встречаются величины, распределенные по нормальному закону (закон Гаусса). Главная особенность: он является предельным законом, к которому приближаются другие законы распределения.
Случайная величина распределена по нормальному закону, если ее плотность вероятности имеет вид:
f x |
|
1 |
|
|
|
1 |
M x x |
2 |
|||
|
|
|
|
exp |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
2 |
|
|
|
2 |
|
|
|
||
|
|
|
|
|
где
M(X) - математическое ожидание случайной величины;- среднее квадратичное отклонение .
График плотности вероятности нормально распределённой величины
Плотность вероятности (функция распределения) показывает, как меняется вероятность, отнесенная к интервалу dx случайной величины, в зависимости от
значения самой величины: f x dP
dx
ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Математическая статистика - раздел прикладной математики, непосредственно примыкающий к теории вероятностей. Основное отличие математической статистики от теории вероятностей состоит в том, что в математической статистике рассматриваются не действия над законами распределения
154

и числовыми характеристиками случайных величин, а приближенные методы отыскания этих законов и числовых характеристик по результатам экспериментов.
Основными понятиями математической статистики являются:
1.Генеральная совокупность;
2.выборка;
3.вариационный ряд;
4.мода;
5.медиана;
6.процентиль,
7.полигон частот,
8.гистограмма.
Генеральная совокупность - большая статистическая совокупность, из которой отбирается часть объектов для исследования
(Пример: все население области, студенты вузов данного города и т.д.)
Выборка (выборочная совокупность) - множество объектов, отобранных из генеральной совокупности.
Вариационный ряд - статистическое распределение, состоящее из вариант (значений случайной величины) и соответствующих им частот.
Мода – значение случайной величины, которому соответствует наибольшая частота встречаемости. (В приведенном выше примере моде соответствует значение 24 кг, оно встречается чаще других: m = 20).
Медиана – значение случайной величины, которое делит распределение пополам: половина значений расположена правее медианы, половина (не больше) – левее.
Для характеристики разброса найдем значения, не выше которых оказалось 25 и 75% результатов измерения. Эти величины называются 25-м и 75-м процентилями. Если медиана делит распределение пополам, то 25-й и 75-й процентили отсекают от него по четвертушке.
Используют дискретное (точечное) статистическое распределение и непрерывное (интервальное) статистическое распределение.
Для наглядности статистические распределения изображают графически в виде
полигона частот или - гистограммы.
Отношение относительной частоты к ширине интервала носит название плотности вероятности f(x)=mi / n dx = p*i / dx
ТОЧЕЧНАЯ ОЦЕНКА СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Предположим, что генеральная совокупность является нормальным распределением. Нормальное распределение полностью определено математическим ожиданием (средним значением) и средним квадратичным отклонением. Поэтому,
если по выборке можно оценить, т.е. приближенно найти, эти параметры, то будет решена одна из задач математической статистики – определение параметров большого массива по исследованию его части.
Параметры генеральной совокупности можно указать по параметрам выборки с учетом ее объема n.
Если считать, что статистическое распределение является выборкой из
n
некоторой генеральной совокупности, при этом n 1 1, то можно заключить, что для этой генеральной совокупности приближенно:
хг хв |
г в |
155

ИНТЕРВАЛЬНАЯ ОЦЕНКА. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ. ДОВЕРИТЕЛЬНАЯ ВЕРОЯТНОСТЬ.
При достаточно большом объеме выборки можно сделать вполне надежные заключения о параметрах генеральной совокупности. Однако на практике часто имеют дело с выборками небольшого объема (n<30). При небольшом объеме выборки пользуются интервальными оценками. В этом случае указывается интервал
(доверительный интервал).
Доверительный интервал – интервал, в котором с заданной доверительной вероятностью находится истинное значение случайной величины (среднее значение генеральной совокупности).
Доверительная вероятность – вероятность, с которой в заданном интервале (доверительном интервале) находится истинное значение случайной величины (среднее значение генеральной совокупности). Обычно в медикобиологических исследованиях доверительную вероятность принимают равной 0,95.
Доверительный интервал математически записывают так:
xв mt ;n xг xв mt ;n , или
xв тt ;n , где
t ;n - коэффициент Стьюдента (величина табличная,
размерности не имеет),- доверительная вероятность, n – объем выборки;
m – ошибка среднего.
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Ни одно исследование не обходится без сравнений. Сравнивать приходится данные опыта с контролем, эффективность действия препаратов, продуктивность одной группы животных с продуктивностью другой и т.д.
Обычно, между сравниваемыми данными всегда имеются различия. Иногда различиями пренебрегают и утверждают, что, в целом, данные контрольной группы совпадают с данными опытной группы, другими словами различия между полученными данными недостоверны. В другом случае различиями пренебречь нельзя и в таком случае говорят, что различия между полученными данными достоверны. В каком случае делается тот или иной вывод?
Введём несколько основных понятий:
1. H0 - нулевая гипотеза, которая предполагает, что полученная в опыте разница
между исследуемыми параметрами случайна;
2. H1 - альтернативная гипотеза, которая противоречит нулевой и предполагает, что полученная в опыте разница между исследуемыми параметрами не случайна;
3.- уровень значимости, равен вероятности ошибки, допускаемой при оценке принятой гипотезы (обычно равен 0,05; 0,01; 0,001).
Принять или отклонить гипотезу можно после её проверки. Для этих целей служит величина, называемая статистическим критерием или просто критерием.
156

Критерии, которые вычисляются по исходным данным (выборкам) tф (фактические критерии) с р а в н и в а ю т с я с табличными критериями tкр. ОСНОВНОЙ ПРИНЦИП проверки статистических гипотез сводится к следующему:
если фактически установленная величина kф превзойдёт или окажется равной критическому значению kкр, kф kкр, то нулевую гипотезу отвергают. Если kф kкр, принимают нулевую гипотезу.
ПАРАМЕТРИЧЕСКИЕ И НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ
Вбиометрии применяют два вида статистических критериев:
1.п а р а м е т р и ч е с к и е;
2.н е п а р а м е т р и ч е с к и е.
Применение параметрических критериев для проверки статистических гипотез основано на предположении о нормальном распределении (закон Гаусса) совокупностей, из которых взяты сравниваемые выборки. К параметрическим критериям относятся: 1.критерий Стьюдента; 2.критерий Фишера.
Однако не всегда исходные данные подчиняются нормальному закону распределения. Кроме того, исходные данные могут быть представлены качественно (например, наличие или отсутствие боли, восприятие света - есть или нет и т.д.). В таком случае используют непараметрические критерии: например, критерий Уилкоксона, критерий Х2. Непараметрические критерии можно использовать и для нормально распределённых величин. Но при нормальном распределении признака параметрические критерии обладают большей мощностью, чем непараметрические.
ЗАДАНИЯ ДЛЯ ДОСТИЖЕНИЯ КОНКРЕТНЫХ ЦЕЛЕЙ ОБУЧЕНИЯ ПО ТЕМЕ 14
ПРАКТИЧЕСКОЕ ЗАДАНИЕ № 1. Исследовалось влияние цитоксического действия экстрактов на живые клетки. Контролем в опытах служили клетки костного мозга с добавлением 0,5 мл физиологического раствора. Время экспозиции составляло 15 мин. Данные представлены в таблице.
В-во |
Экстракт №0 |
Экстракт №1 |
Экстракт №2 |
Экстракт №3 |
|
№ опыта |
|||||
|
|
|
|
||
1 |
72,6 |
64,8 |
95,7 |
96,0 |
|
2 |
77,0 |
85,2 |
90,2 |
92,2 |
|
3 |
84,6 |
88,9 |
80,4 |
94,6 |
|
4 |
57,5 |
73,1 |
83,0 |
79,4 |
|
5 |
83,8 |
72,1 |
97,0 |
98,5 |
|
6 |
69,5 |
75,2 |
91,3 |
|
|
7 |
60,2 |
92,6 |
92,3 |
|
|
8 |
68,8 |
69,1 |
88,0 |
|
|
9 |
70,5 |
86,6 |
81,0 |
|
|
10 |
76,1 |
|
88,9 |
|
|
11 |
72,4 |
|
93,4 |
|
|
12 |
|
|
89,7 |
|
Дать точечную и интервальную оценки цитоксического действия экстрактов на живые клетки.
157

Используемые компьютерные программы:
1.Операционные системы: Linux
2.Прикладные программы общего назначения: Open Office Write, Open Office
Calc.
3. Прикладные программы «StatMed», «MedStat».
Алгоритм выполнения практического задания № 1:
Шаг – 1. Включите компьютер. Дождитесь загрузки установленной операционной системы. Зайдите в меню “Start”.
Шаг – 2. В разделе учебные программы для студентов найдите и запустите программу
«StatMed» или «MedStat»
Шаг – 3. Откройте директорию «Данные», выберите «Ввод новых данных».
Представленные данные являются количественными – в программе MedStat выберем пункт: Данные|Новые данные|Вариационный ряд – и введем результаты. Согласно таблице 1 заполните созданные таблицы в «MedStat» данными для каждой группы. Сохраните файл в папке Documents, в разделе Student с расширением *mtv.
Шаг – 4. Проведите оценку статистических совокупностей на принадлежность к нормальному закону распределения. Нажмите на иконку «N=?»
158

Шаг – 5. Результаты проверки на нормальность перепишите в тетрадь сделайте вывод.
Шаг – 6. Т. к. для всех показателей не выявлено отличия распределения значений от нормального, то для проведения описательной статистики выберем соответствующий пункт в программе – Описательная статистика.
159

Шаг – 7. Полученные результаты: среднее значение, погрешность среднего, стандартное отклонение, минимум и максимум, 95% доверительный интервал (ДИ).
Шаг – 8. Активируйте изображение графика распределения данных и 95% доверительного интервала.
Шаг – 9. Полученные результаты представим в виде отчета к практической работе.
Пример Отчета.
Задание 1.
1)При проведении проверки распределения значений цитоксического действия экстрактов на живые клетки использовался критерий W Шапиро-Уилка.
Установлено, что для всех экстрактов распределение не отличается от нормального на уровне значимости p>0,1.
2)Для представления точечной оценки в таблице А приведены средние значения
показателей цитоксического действия экстрактов на живые клетки (X) и стандартная ошибка среднего (m).
160