Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции с 1 по 4.docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
764.12 Кб
Скачать

Подгонка распределения

  • Общее знакомство

  • Оценивание

  • Согласие

  • Графики

В общем случае таблица времен жизни дает хорошее представление о распределении отказов или смертей объектов во времени. Однако для прогноза часто необходимо знать форму рассматриваемой функции выживания. Наиболее важны следующие семейства распределений, которые используются для описания продолжительности жизни или наработки до отказа: экспоненциальное (в том числе, линейное экспоненциальное) распределение, распределение Вейбулла экстремальных значений и распределение Гомперца. Оценивание. Процедура оценивания параметров использует алгоритм метода наименьших квадратов (см. работу Gehan and Siddiqui, 1973). Для проведения оценивания применима модель линейной регрессии, поскольку все четыре перечисленных семейства распределений могут быть "сведены к линейным" (относительно параметров) с помощью подходящих преобразований. Такие преобразования приводят иногда к тому, что дисперсия остатков зависит от интервалов (т.е. дисперсия различная на различных интервалах). Чтобы учесть это, в алгоритмах подгонки используют оценки взвешенных наименьших квадратов двух типов. Согласие. Зная параметрическое семейство распределений, можно вычислить функцию правдоподобия по имеющимся данным и найти ее максимум. Такие оценки называются оценками максимального правдоподобия. При весьма общих предположениях эти оценки совпадают с оценками наименьших квадратов.

Аналогичным образом находится максимум функции правдоподобия при нулевой гипотезе, т.е. для модели, допускающей различные интенсивности на разных интервалах. Сформулированная гипотеза может быть проверена, например, с помощью критерия отношения правдоподобия, статистика которого имеет (по крайней мере, асимптотически) хи-квадрат распределение. Графики. В модуле можно строить графики как эмпирических, так и теоретических функций распределения и интенсивности. Эти графики представляют собой прекрасное средство проверки согласия данных с теоретическим распределением. Ниже показана эмпирическая функция выживания и функции из семейства распределений Вейбулла.

На этом графике три линии обозначают теоретические распределения, полученнные с помощью трех различных процедур оценивания (методом наименьших квадратов и двумя методами взвешенных наименьших квадратов).

 

Множительные оценки Каплана-Мейера

Для цензурированных, но не группированных наблюдений времен жизни, функцию выживания можно оценить непосредственно (без таблицы времен жизни). Представьте, что вы создали файл, в котором каждое наблюдение содержит точно один временной интервал. Перемножая вероятности выживания в каждом интервале, получим следующую формулу для функции выживания:

S(t) = jt= 1 [(n-j)/(n-j+1)] ( j )

В этом выражении S(t) - оценка функции выживания, n - общее число событий (времен окончания), j - порядковый (хронологически) номер отдельного события, d(j) равно 1, если j-ое событие означает отказ (смерть) и (j) равно 0, если j-ое событие означает потерю наблюдения (цензурирование). означает произведение по всем наблюдениям j, завершившимся к моменту t. Данная оценка функции выживания, называемая множительной оценкой, впервые была предложена Капланом и Мейером (1958).

Преимущество метода Каплана-Мейера (по сравнению с методом таблиц жизни) состоит в том, что оценки не зависят от разбиения времени наблюдения на интервалы, т.е. от группировки. Метод множительных оценок и метод таблиц времен жизни приводят, по существу, к одинаковым результатам, если временные интервалы содержат, максимум, по одному наблюдению.