Практикум в STATISTICA
.pdfПеременную ID используем для оценки вариаций и воспользуемся оценкой правдоподобия по Эфрону:
Графики функции выживаемости выглядят следующим образом (красный – контроль, синий – лечение):
Модели для упорядоченных событий.
Для событий, появляющихся только в строго определенном порядке (рекуррентные события) используют другие модели:
AG (Андерсена-Гилла)
Вэтой модели для каждого объекта должно быть по одному наблюдению на каждое событие или временной интервал. Если произошло одно событие, то наблюдений должно быть 2: одно для события и одно для интервала после этого события. Модель предполагает, что базовые функции риска одинаковы для всех событий.
Пример
В этом и последующих примерах будут изучаться результаты лечения псориаза с помощью снятия стресса. Пример основан на данных из (Kabat-
Zinn J. et al; 1998).
В окне «Регрессионные модели Кокса» выберем «Считающий процесс»:
Зададим переменные анализа:
Вариации будут оцениваться по каждому пациенту (переменная ID):
Итоговые оценки параметров в таком случае выглядят следующим образом:
Следующие две модели – «условные» (события в них стратифицированы по порядку (первое, второе, ...), для каждой страты – своя базовая функция).
PWP-CT (Прентнис, Вильямс и Петерсон, используются номинальные значения времени).
Для использования этой модели переключите «Входные переменные» на
«Считающий процесс»:
PWP-GT (Прентнис, Вильямс и Петерсон, используются значения временных интервалов).
Для использования этой модели переключите «Входные переменные» на
«Времена жизни, ковариаты, факторы, цензурирование»
Переменные выбираются аналогично:
WLW (Вей, Лин и Вайсфельд)
Модель считает каждое событие отдельным процессом и игнорирует зависимости между порядком событий – для ее применения необходимо иметь данные по каждому объекту и событию. Если у пациента, например, записано только два события, а всего их не больше 4, то необходимо добавить события 3 и 4, произошедшие в то же время, что и событие 2.
http://statsoft.ru/solutions/ExamplesBase/branches/detail.php?ELEMENT_ID=942#s1
Исследование гемограмм пациентов
Исходные данные
Исходная таблица данных содержится в формате Excel. Таблица содержит информацию о 100 пациентах. Четыре столбца содержат значения показателей их гемограмм – количество эритроцитов (в 1012/л), тромбоцитов (109/л), лейкоцитов (109/л), гемоглобин (г/л).
Импорт из Excel в STATISTICA
Шаг 1. При попытке открытия файла в системе STATISTICA (через меню Файл/Открыть) программа предложит нам на выбор несколько вариантов.
Выберем второй пункт.
Шаг 2. Далее необходимо выбрать номер листа в таблице Excel, который содержит нужную нам информацию. Выберем Лист 1 и нажмём OK.
Шаг 3. Далее необходимо:
•указать диапазон значений во внешнем файле данных, который будет импортирован,
•решить, надо ли импортировать имена наблюдений и переменных,
•сохранить (или нет) формат ячеек из исходной таблицы.
Поставим галочки во все поля и нажмём OK.
Шаг 4. Теперь в программе STATISTICA открыта таблица.
Сохраним её под именем Гемограмма (Ваша фамилия № группы).sta.
Шаг 4. Введём дополнительную информацию о переменных.
Для этого выберем в меню пункт Данные/Все спецификации переменных.
В появившемся диалоге Редактор спецификаций переменных можно: указать длинные имена, изменить типы данных, коды пропущенных данных, добавить новые переменные или удалить старые, и т. д…
Визуальный анализ
Система STATISTICA включает широкий спектр графических методов для визуального представления результатов исследований. Все графические средства системы STATISTICA обеспечивают возможность выбора встроенного аналитического интерактивного метода анализа и содержат большой набор программ настройки, позволяющих пользователю интерактивно управлять отображением информации на экране.
Диаграмма рассеяния
Построим диаграмму рассеяния для переменной Тромбоциты.
Из медицинской практики известно, что увеличение числа тромбоцитов в крови может привести к тромбозу.
Для выявления больных со слишком большим уровнем тромбоцитов в крови, построим диаграмму рассеяния переменных Номер пациента и Тромбоциты.
Врач определяет критический уровень количества тромбоцитов в крови для проведения операции. Пусть это значение равно 250.
Проведём горизонтальную прямую, соответствующую данному значению.
Это можно сделать двумя способами.
Способ 1.
Выберем из раскрывающегося списка пункт Параметры графика. В появившемся окне перейдём на закладку Ось: Дополнительные риски.
Выберем Ось – Левая Х, укажем Положение = 250, поставим галочку в окне
Сетка.
Можно также настроить тип и толщину линии. Для внесения изменений нажмём на кнопку Сетка.
В итоге на диаграмме рассеяния отобразится прямая: Тромбоциты = 250.
Способ 2.
Воспользуемся панелью Графические инструменты.
Выберем рисование стрелки, и проведём соответствующую прямую на графике.
Как и раньше, можно настраивать опции построенного объекта.
Теперь выделим пациентов, количество тромбоцитов, в крови которых превышает данный уровень.
Для этого воспользуемся средством Кисть.
Средство Кисть
Средство Кисть является очень удобным для визуального анализа данных.
Нажмём на кнопку 2M Закрашивание на панели инструментов.