Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Практикум в STATISTICA

.pdf
Скачиваний:
178
Добавлен:
10.04.2015
Размер:
4.14 Mб
Скачать

Переменная Hospital в файле данных Heart.sta есть (фиктивная) группирующая переменная, которая идентифицирует больницу, в которую пациент был принят для проведения трансплантации сердца.

В этом исследовании представлены три больницы: Hillview (код 1), St_Andreas (код 2), and Biner (код 3). На основе сравнения функций выживания в этих трех больницах применением некоторых двувыборочных критериев из модуля Анализ выживаемости можно сделать выводы, как о выживаемости пациентов, так и о возможностях этих тестов.

Спецификация анализа

Откройте файл данных Heart.sta через меню Файл - Открыть; скорее всего, он будет располагаться в каталоге /Examples/Datasets системы STATISTICA.

Затем выберите Анализ выживаемости из меню Анализ - Углубленные методы анализа для отображения стартовой панели модуля Анализ выживаемости. Дважды щелкните по строке Сравнение нескольких выборок, чтобы открыть диалоговое окно Сравнение выживаемости в нескольких группах.

Нажмите кнопку Переменные, чтобы появилось стандартное окно Выберите переменные. Выберите первые 6 переменных в качестве Времен жизни (1, 2 или 6). STATISTICA будет интерпретировать первую и четвертую переменные в этом списке как месяцы, вторую и пятую - как дни, а третью и шестую - как год.

Далее необходимо определить переменную Censored как Цензурирующую переменную и переменную Hospital как Группирующую переменную.

Нажмите кнопку OK для возвращения в диалоговое окно Сравнение выживаемости в нескольких группах. Дважды щелкните по полю ввода Код для полных наблюдений, чтобы появилось диалоговое окно Переменная 7. Здесь выберите Complete и нажмите OK. Затем дважды щелкните по полю Код для цензурированных наблюдений и выберите Censored.

Чтобы ввести коды для группирующей переменной, нажмите кнопку Коды (для групп) и потом в диалоговом окне сначала нажмите кнопку Все (чтобы отобрать все коды), а потом щелкните OK (чтобы ввести эти коды и завершить этот диалог).

Диалоговое окно Сравнение выживаемости в нескольких группах теперь выглядит следующим образом:

Теперь, чтобы продолжить, достаточно щелкнуть OK, и откроется диалоговое окно Результаты сравнения выживаемости в нескольких группах.

Критерий хи-квадрат дает почти значимое отклонение в этом примере (p<.06). Отсюда мы можем сделать предварительное заключение, что имеются определенные различия между больницами.

Чтобы увидеть эти различия, мы можем построить графики функций выживания для различных групп, для чего достаточно нажать кнопку

Кумулятивная доля выживших по группам.

Ясно видно, что функция выживания в больнице города Бинер медленнее уменьшается на начальном участке времени по сравнению с другими больницами.

Отсюда мы можем заключить, что по какой-то причине пациенты с трансплантированным сердцем в больнице Бинера имеют больше шансов выживания, в частности в течение критических первых 100 дней после трансплантации.

Вернитесь к диалоговому окну Результаты сравнения выживаемости в нескольких группах и нажмите на вкладку Дополнительно. Чтобы просмотреть таблицы времен жизни для этих трех больниц, нажмите кнопку Процент выживших по группам. Появятся отдельные электронные таблицы для каждой больницы. Данные таблицы подтверждают приведенное выше заключение.

Сравнение выживаемости в двух группах

Модуль Анализ выживаемости содержит различные методы для сравнения двух выборок.

Нажмите кнопку Отмена в диалоговом окне Результаты сравнения выживаемости в нескольких группах и в диалоговом окне Сравнение выживаемости в нескольких группах для возвращения в стартовую панель.

Выберите опцию Сравнение двух выборок на стартовой панели, чтобы появилось окно Сравнение выживаемости в двух группах. Нажмите кнопку

Переменные для задания всех переменных, как и ранее (см. выше). Также укажите Код для полных наблюдений и Код для цензурированных наблюдений,

как и ранее.

Чтобы сравнить группы, дважды щелкните по полю ввода Код для первой группы для отображения диалогового окна Переменная 11. Выберите здесь первую группу для сравнения (в нашем примере выбрана Hillview) и нажмите

OK.

Потом дважды щелкните по полю ввода Код для второй группы и выберите

Biner. Диалоговое окно Сравнение выживаемости в двух группах теперь выглядит следующим образом:

Теперь нажмите кнопку OK, чтобы перейти к диалоговому окну

Двувыборочные критерии.

В данном примере некоторые из критериев демонстрируют уровень значимости p около 0.05, в то время как другие - незначимы.

Поэтому с некоторой долей уверенности мы можем заключить, что выживаемости пациентов с трансплантированным сердцем в этих двух больницах отличаются значимо, притом в больнице Бинера выживаемость выше.

http://www.statsoft.ru/home/portal/applications/medicine/example5.htm

2. Модель Кокса с зависящими от времени ковариатами

Знаменитая модель Кокса, предложенная в 1972 году, интенсивно используется в самых различных областях, особенно в медицине и страховании, для оценки условного риска заболевания при заданных значениях исходных признаков

Модель Кокса основана на предположении, что функцию риска (или функцию интенсивностей отказов, выражаясь на техническом сленге), можно факторизовать, т.е. представить в виде произведения двух функций:

h(t) = h0(t) y (z1,…,zm),

где h0(t) - базовая функция интенсивности, зависящая, например, от возраста пациента или от времени, прошедшего после осмотра, y (z1,…, zm) - функция изучаемых признаков, например, пол пациента, семейное положение или время года, класс отеля, страна поездки, если речь идет о туроператорских рисках.

Втехнических приложениях признаками могут быть, например, температура окружающей среды, сезон, уровень влажности.

Вобщем случае функция признаков, как и сами признаки, выбираются из соображений предметной области и целей исследования.

Часто модель записывается в следующем виде:

h[(t),(z1, z2, ..., zm)] = h0(t)*exp(b1*z1 +...+ bm*zm).

Базовая функция интенсивности h0(t) может рассматриваться теперь как функция интенсивности при равенстве нулю всех независимых переменных или ковариат.

Общая задача состоит в том, чтобы по наблюдениям за временами жизни оценить h0 и неизвестные коэффициенты b1... bm.

Модель можно линеаризовать последнюю модель, поделив обе части соотношения на h0(t) и взяв натуральный логарифм от обеих частей:

log{h[(t),(z...)]/h0(t)} = b1*z1 +...+ bm*zm

Факторизованная модель обладает тем замечательным свойством, что оценки ее параметров требуется не столько много наблюдений, как потребовалось бы для не факторизованной модели.

Существенное в этой модели то, что зависимость является мультипликативной. Это предположение иногда называется гипотезой пропорциональности.

Покажем, как проверить эту гипотезу. Пример основан на данных Pike (1966) времен жизни двух групп крыс, одна из которых контрольная, а другая подвергалась воздействию канцерогена.

Предположим, что у вас есть сомнение в гипотезе пропорциональности, то есть об отсутствии зависящих от времени ковариат.

Идея проверки гипотезы очень проста.

Рассмотрим еще одну модель, более общую, чем модель пропорциональных интенсивностей, и с помощью критерия хи-квадрат сравним их.

Более общая модель функции интенсивности содержит как постоянную (не зависящую от времени) ковариату (в данном примере Группа - Group), так и зависящую от времени ковариату (в данном примере ковариату, определяемую как:

Group*Log (время) - 5.4 - Group*Log (Time) - 5.4).

Значение 5.4 использовано лишь из соображений нормировки, для того, чтобы среднее значение логарифма времени жизни было приближенно равно 5.4.

Проверку проведем в модуле Анализ выживаемости.

Задание анализа

Откройте файл с данными Pike.sta.

Выберите анализ Регрессионные модели. В предлагаемом списке моделей выберите Модель Кокса с зависящими от времени ковариатами.

В этом анализе зависимая переменная Времена жизни (переменная 1) - Survival (variable 1), индикатор цензурирования Censored.

Поскольку, по умолчанию, код для цензурированных наблюдений тот же самый, что используется в файле данных, то остается задать только ковариаты.

Диалоговое окно имеет редактируемые поля. Левая часть поля (Ковариата) может быть использована, чтобы ввести метку для ковариаты.

Правая (Выражение) может быть использована для определения ковариаты с помощью арифметического выражения.

В данном анализе мы, на самом деле, будем рассматривать 2 модели: первая модель с постоянными ковариатами, вторая модель с зависящими от времени ковариатами. Введите переменные этих моделей, сделав установки, как показано на рисунке:

Нажмите OK, откройте диалоговое окно Оценивание регрессионной модели.

Приняв в этом диалоге все условия по умолчанию, просто нажмите OK, чтобы перейти к оцениванию параметров моделей.

Нажмите OK и из диалогового окна Результаты регрессии выберите опцию

Оценки параметров.

В таблице показаны оценки параметров двух моделей. Обе модели значимы (см. уровни значимости в последнем столбце), но как показывает критерий хи- квадрат в заголовке таблицы между моделями значимого отличия нет (хи-квадрат = 2.89, число степеней свободы = 2, р = 0.23527).

http://www.statsoft.ru/home/portal/applications/medicine/med2.htm

3. Множественный анализ выживаемости

Данные по множественным отказам или многомерной выживаемости часто встречаются в биомедицинских и прочих исследованиях. Эти данные возникают в исследовании времени до появления нескольких событий для одного объекта, или времени до появления одинаковых событий для связанных объектов (например, для родственников или одноклассников). В таких исследованиях критические события коррелированны друг с другом, нарушая требование независимости классического анализа выживаемости.

Различают два принципиальных случая: критические события рассматриваются для одного объекта в определенном порядке (например, регресс заболевания) и критические события разных типов, которые нельзя считать независимыми: например, побочные эффекты в одной группе по лечению (treatment).

Простейший подход к анализу таких данных – исследовать время до первого события, игнорируя остальные эффекты. Обычно такой подход неадекватен и приводит к потере дополнительной информации, потому в последнее время становятся популярны два подхода: модели с уязвимостью (frailty models) и модели с поправкой на корреляции факторов.

В первой модели связь между событиями реализуется как случайный фактор с известным типом распределения, обычно гамма со средним 1 и неизвестной дисперсией, она не будет рассмотрена в этой главе.

Во втором подходе зависимости между критическими событиями исключены из модели, вместо этого используется корреляция оценок.

Чаще всего используются оценки, полученные из модели пропорциональных рисков Кокса.

Вычислительные методы

Пусть , – время события и цензурирования для k-го типа событий и i- го объекта (события и объекты понимаются в обоих смыслах).

Введем и , - вектор регрессионных коэффициентов.

Интенсивность будет равна в первом и во втором случае. Целевые коэффициенты оцениваются методом максимума правдоподобия.

Модель для неупорядоченных событий. События одного типа. Пример

В качестве примера смоделируем исследование эффективности фотокоагуляции при лечении диабетической ретинопатии.

Подобные задачи возникают при изучении семейных заболеваний.

У каждого из испытуемых из группы риска один случайно выбранный глаз был подвержен фотокоагуляции (воздействию), второй глаз оставлен в контрольной группе.

Цель исследования – показать, что профилактика значимо влияет на заболевание и увеличивает время до потери зрения.

Переменная ID указывает на семью испытуемого, TREAT – на тип глаза («контрольный» или «исследуемый»), N – номер пациента, CENS – индикатор цензурирования.

На каждого пациента в таблице приходится по две строки: «контрольный» глаз (TREAT = 0) и «исследуемый» (TREAT = 1); в переменной CENS указано произошло ли поражение сетчатой оболочки глазного яблока к моменту завершения исследования, в переменной TIME указано время (в годах), которое пациент состоял на учете до наступления события, N – идентификатор пациента, ID – идентификатор семьи.

Задача состоит в том, чтобы показать, что потеря зрения глазом, на который оказано воздействие, наступает позже, чем у глаза без терапевтического лечения.

Воспользуемся регрессионной моделью Кокса со временами жизни, факторами и цензурированием: