Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Карагандинский государственный медицинский университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

BIOSTATISTIKA_uchebnik_rus.docx

Скачиваний:

655

Добавлен:

19.03.2016

Размер:

2.07 Mб

Скачать

☆

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 21 22 2324 / 3424 25 26 27 28 29 30 31 32 33 34 > Следующая >>>

Прогнозирование на основе математических моделей

Наиболее распространенным методом прогнозирования является нахождение аналитического выражения (уравнения) тренда. Тренд экстраполируемого явления это основная тенденцию временного ряда, в некоторой мере свободная от случайных воздействий.

Разработка прогноза заключается в определении вида экстраполирующей функции y=f(t), которая выражает зависимость изучаемой величины от времени на основе исходных наблюдаемых данных. Первым этапом является выбор оптимального вида функции, дающей наилучшее описание тренда. Наиболее часто используются следующие зависимости:

• линейная (72)

• параболическая (73)

• показательная функция (74)

Проблемы нахождения коэффициентов линейной функции и прогноз на ее основе были рассмотрены в разделе «регрессионный анализ». Если форма кривой, описывающей тренд, имеет нелинейный характер, то задача оценки функции y=f(t) усложняется, и в этом случае необходимо привлечь к анализу специалистов по биостатистике и воспользоваться компьютерными программами по статистической обработке данных.

В большинстве реальных случаев временной ряд представляет собой сложную кривую, которую можно представить как сумму или произведение трендовой, сезонной, циклической и случайной компонент (рисунок 39).

Рисунок 39. График временного ряда

Тренд представляет собой плавное изменение процесса во времени и обусловлен действием долговременных факторов. Сезонный эффект связан с наличием факторов, действующих с заранее известной периодичностью (например, времена года, лунные циклы). Циклическая компонента описывает длительные периоды относительного подъема и спада, состоит из циклов переменной длительности и амплитуды (например, некоторые эпидемии имеют длительный циклический характер). Случайная составляющая ряда отражает воздействие многочисленных факторов случайного характера и может иметь разнообразную структуру.

Анализ всех компонентов временного ряда и прогнозирование на их основе задача нетривиальная и требует специальной подготовки.

Оценка факторов риска и прогнозирование на основе логистической регрессии

Оценка рисков и влияния факторов риска являются важными задачами медицинских исследований – на основании этих данных строятся профилактические мероприятия и прогнозируются исходы тех или иных методов лечения. Как правило, в поиске наиболее значимых анализируется множество факторов, которые могут быть измерены по разным шкалам – непрерывным, дискретным, ординальным, номинальным. В этом случае есть проблема подбора адекватного многомерного статистического метода, не ограниченного какимилибо особыми рамками.

Логистическая регрессия используется, когда зависимая величина является бинарной (т.е. принимает значения да/нет, имеет/не имеет, например, пациент может выздороветь, а может не выздороветь, нуждается в госпитализации или не нуждается и т.д.) и на ее исход влияют независимые переменные различного характера (качественные и/или количественные). Фактически оценивается вероятность принять одно из этих двух утверждений под влиянием изучаемых признаков. Логит этой вероятности – натуральный логарифм отношения вероятности «положительный эффект» (р) к вероятности «отрицательный эффект» (1 р).

(75)

Величина является непрерывной и принимает значения в интервале от 0 до 1 (от отрицательного эффекта к положительному эффекту).

Процедура логистической регрессии заключается в создании и оценке уравнения вида

(76)

где x₁, x₂, x₃, – независимые переменные, b₀ и b₁, b₂, b₃,… – постоянные коэффициенты

Тогда вероятность положительного эффекта

(77)

Рассмотрим пример построения логистической регрессии в программе «STATISTICA6».

В таблице 71 представлены некоторые факторы, которые возможно влияют на риск возникновения артериальной гипертензии (АГ).

Таблица 71. Факторы риска

Имя переменной	Расшифровка	Тип данных
АГ	0 – есть АГ, 1 – нет АГ	номинальный бинарный
Возраст, лет	возраст, лет	количественный
Курение	не курит 0, курит 1	номинальный
Потребление алкоголя	не потребл. – 0, потребл. 1	номинальный
Потребление соленой пищи	не потребл. – 0, потребл. 1	номинальный
Пол	1 мужской, 2 женский	номинальный
Вес	6 категорий	ординальный
Наследственный фактор АГ	нет 0, есть 1	номинальный

Необходимо определить какое влияние на вероятность АГ оказывают отобранные переменные. Исходные данные представляются в виде матрицы n×m, где n количество обследованных, mчисло признаков. Фрагмент этой матрицы показан в таблице 72. Общий объем выборки составил 607 человек.

Таблица 72. Данные к примеру

№	АГ	Возраст	Курение	Потребл. алкогол.	Потр. сол.пищи	Пол	Вес	Наследств. (АГ)
1	1	32	0	0	1	2	3	0
2	1	35	0	0	1	2	5	0
3	1	52	1	1	1	1	4	0
4	1	68	0	1	1	1	5	0
5	0	65	0	0	1	2	5	1
6	0	41	0	0	1	2	3	1
7	1	72	0	0	1	2	4	0
8	1	57	1	0	1	1	3	1
9	0	54	0	0	1	2	3	1
10	0	46	0	0	1	2	4	1
11	1	73	0	0	1	2	1	1
12	1	68	1	1	1	1	3	0
13	1	35	0	0	1	2	4	0
14	1	37	1	0	1	1	5	0
15	1	56	0	0	1	2	3	1
16	1	66	0	0	1	2	4	1

Анализ проводится в модуле Nonlinear Estimation, для запуска которого надо в меню Statistics выбрать команду Advanced Linear/Nonlinear Models (линейные/нелинейные модели). В открывшемся меню выбрать команду Nonlinear Estimation (нелинейная оценка), а затем опцию Quick Logit regression (логит регрессия) – «ОК».

В открывшемся окне необходимо указать зависимую и независимые переменные из списка переменных, щелкнув кнопкой Variables. Зависимой переменной (откликом) является «АГ», независимой – все остальные. Нажмите ОК. Программа возвратится в начальное диалоговое окно.

С помощью строки Input File contains (введите содержимое файла) отметьте вариант: Codes and no count (только коды) и вновь нажмите на ОК.

Откроется окно Model Estimation. Во вкладке Advanced можно выбрать процедуру оценивания — Estimation method. Выберем: quasiNewton. Поставьте птичку в окошке Asymptotic standart errors. ОК.

Появится диалоговое окно Results. Видно, что значение параметра Chisquare (хиквадрат) = 294,6 велико, а значение р=0,000000 мало. Это говорит о достаточной адекватности выбранной модели. Качество модели можно оценить и по классификационной матрице во вкладке Classification of cases and odds ratio (таблица 73)

Таблица 73. Результаты статобработки

Odds ratio (Отношение шансов) = 8,054
Наблюдаемый	Предсказа нный 0	Предсказанный 1	% корректных предсказаний
0	376	51	88
1	86	94	52

В целом информационная способность модели составляет

470/607*100%=77%

Отношение шансов показывает, что классификация по модели в 8 раз корректнее, чем если бы мы предсказывали исход случайным образом.

Кнопка Summary. Parameter estimates на вкладке Advanced предназначена для визуализации предсказанных значений коэффициентов b₀, b₁, b₂, b₃, b₄, b₅, b₆, b₇уравнения логит регрессии (таблица 74).

Таблица 74. Результаты статобработки

Model: Logistic regression (logit) N of 0's:427 1's:180 (ЛогитАГ) Dep. var: АГ? Loss: Max likelihood (MSerr. scaled to 1) Final loss: 294,57107701 Chi?(7)=148,85 p=0,0000
	Const.B0	Пол	Возраст	Курение	Потребл. алкогол.	Потр. сол.пищи	Вес	Наследств (АГ)
Estimate (оценка коэффициента)	4,725	0,278	0,030	0,014	0,270	0,614	0,122	1,921
Standard Error (ст.ошибка коэффициента)	0,690	0,237	0,007	0,298	0,252	0,233	0,055	0,209
tСтюдента (599)	6,849	1,174	4,256	0,048	1,073	2,637	2,241	9,213
plevel	0,000	0,241	0,000	0,961	0,284	0,009	0,025	0,000
95%ДИ	6,080	0,187	0,016	0,572	0,765	0,157	0,015	1,511
+95%ДИ	3,370	0,744	0,044	0,600	0,224	1,071	0,230	2,330
Wald's Chisquare (хиквадрат критерий Вальда)	46,910	1,379	18,114	0,002	1,152	6,955	5,020	84,874
plevel	0,000*	0,240	0,000*	0,961	0,283	0,008*	0,025*	0,000*
Odds ratio (unit ch) Отношение шансов	0,009	1,321	1,030	1,015	0,763	1,847	1,130	6,827
95%ДИ	0,002	0,829	1,016	0,565	0,465	1,170	1,015	4,533
+95%ДИ	0,034	2,104	1,045	1,823	1,252	2,918	1,258	10,282
Odds ratio (range) Отношение шансов		1,321	9,349	1,015	0,763	1,847	3,012	6,827
95%ДИ		0,829	3,333	0,565	0,465	1,170	1,146	4,533
+95%ДИ		2,104	26,224	1,823	1,252	2,918	7,915	10,282

Первые три строки таблицы дают нам значения коэффициентов логистической регрессии, их стандартные ошибки, статистическую значимость по критерию Стъюдента и доверительный интервал для каждого коэффициента.

Статистическую значимость можно оценить и по критерию хиквадрат Вальда. Из таблицы видно, что статистически незначимыми являются коэффициенты для факторов «пол», «курение» и «потребление алкоголя» (р>0,05), т.е. для них принимается нулевая гипотеза о равенстве отношения шансов единице, т.е. эти факторы не влияют на риск развития артериальной гипертензии.

Влияние всех других факторов можно оценить по величине отношения шансов (ОШ) и доверительным интервалам для них. Значительно повышает риск артериальной гипертензии наследственный фактор в 6,8 (4,510,3) раз. Далее идет «потребление соли» – в 1,9 (1,22,9) раз, «вес» – ОШ от 1,01,3, а возраст фактически не ассоциирован с риском АГ (ОШ=1,0161,045).

Теперь рассмотрим, как можно использовать полученную модель для прогнозирования. Пусть обследуется пациент со следующими признаками:

мужчина в возрасте 45 лет, вес 75 кг (3 весовая категория), курит, алкоголь не потребляет, любит соленую пищу, отец гипертоник.

Рассчитаем

=0,196

Вероятность положительного эффекта (отсутствия АГ)

Тогда вероятность развития АГ =10,45=0,55

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 21 22 2324 / 3424 25 26 27 28 29 30 31 32 33 34 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.05.201598.3 Кб16Bilety_Propedevtika_SDV_i_Ortodontia_rus_2010.doc
#
20.05.20151.18 Mб100biofizika_-_kopia.doc
#
20.05.201559.3 Кб17Biologicheskaya_fizika_RK1_1.docx
#
20.05.2015782.74 Кб113Biostat2013.docx
#
20.05.2015150.02 Кб83biostatistika12-2013.doc
#
19.03.20162.07 Mб655BIOSTATISTIKA_uchebnik_rus.docx
#
20.05.2015765.4 Кб123Biostat_stud_GM_2013_kz.docx
#
20.05.201565.39 Кб80bkh_test.docx
#
20.05.201566.19 Кб106BPR.docx
#
20.05.201544.23 Mб77Dolgopolov_A_B_Izbrannye_lektsii_po_Istorii.doc
#
20.05.201561.58 Кб46Ekonomika_RK_2.docx