Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Matlab_МБС.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
1.73 Mб
Скачать

Лабораторная работа № 3 «Исследование точности оценок параметров модели распределения длительности события, построенных методом максимального правдоподобия»

Цель работы:

  • Знакомство с методами построения оценок максимального правдоподобия и их доверительных интервалов.

  • Построения оценок максимального правдоподобия параметров модели с экспоненциальным распределением длительности события, модели Вейбулла, модели Гомпертца.

  • Знакомство с основами 3D графики в Matlab.

Задание для домашней подготовки:

  1. Ознакомиться с основами метода максимального правдоподобия [3], с.229-233.

  2. Ознакомиться с формулами для построения доверительных интервалов оценок максимального правдоподобия [3], с.213 – 216, [4], c.38-41.

  3. Изучить построение оценок максимального правдоподобия и их доверительных интервалов для различных моделей распределения длительности событий при цензурировании [4], с.41 - 46.

  4. Изучить операторы Matlab построения 3D графиков и поверхностей [1], c.442-448, [2], с.58 -60.

Порядок выполнения лабораторной работы.

  • Вызвать MATLAB.

  • Открыть новый файл для редактирования, записав в первой комментарий:

% программа выполнения лабораторной работы № 3

% работу выполнил студент ….. группы ….. задание ....

Операторы, реализующие выполнение задания по лабораторной работе должны заноситься в этот файл.

  • Сохранить файл под именем Lab3.m

Задание 1. Построение оценки максимального правдоподобия и её доверительного интервала для параметра экспоненциального распределения длительности события

Экспоненциальное распределение характерно для длительности электронных приборов и элементов при отсутствии дрейфа параметров – старения. Длительность события, имеющая экспоненциальное распределение, описывается плотностью вероятности вида

и функцией дожития

Логарифм функции правдоподобия, построенной по независимой выборке длительностей с цензурированием, имеет вид

, (3.1)

где , если наблюдение нецензурировано, , если наблюдение цензурировано, m – число нецензурированных наблюдений (случаев). Необходимым условием максимума выражения (3.1) является равенство нулю первой производной LnL по a

,

откуда получаем, что оценка максимального правдоподобия параметра экспоненциального распределения равна

.

При отсутствии цензурирования и оценка максимального правдоподобия параметра экспоненциального распределения принимает вид

(3.2)

Убедимся, что найден именно максимум логарифма правдоподобия. Вычислим вторую производную LnL по a

.

Поскольку вторая производная LnL по a в точке отрицательна, то найден максимум логарифма правдоподобия.

Построение доверительного интервала

1. При отсутствии цензурирования, построение доверительного интервала для оценки максимального правдоподобия параметра a основывается на асимптотической нормальности первой производной LnL по a. Согласно этому свойству, при большом числе наблюдений случайная величина при истинном значении параметра a имеет приближённо нормальное распределение с математическим ожиданием 0 и дисперсией . Вторая производная также вычисляется при истинном значении параметра a. Нормальность распределения обозначается записью . По свойству нормального распределения, при большом числе наблюдений для случайной величины , вычисленной при истинном значении параметра a, с вероятностью 0.95 справедливо

Выражение для первой производной логарифма правдоподобия без цензурирования запишем в виде

,

а в выражение для второй производной логарифма правдоподобия без цензурирования подставим вместо истинного значения параметра a его оценку . Получим

.

Подставляя найденные выражения в (3.3), получим

.

Преобразуя, получим, что с вероятностью 0.95 истинное значение параметра a лежит между границами

. (3.3)

2. При наличии цензурирования для построения доверительного интервала оценки параметра экспоненциального распределения можно использовать метод профиля логарифма правдоподобия. Этот метод основан на том, что при большом числе наблюдений случайная величина имеет распределение с одной степенью свободы. Из свойств распределения следует, что с вероятностью 0.95 справедливо неравенство .

Метод профиля логарифма правдоподобия иллюстрирует рис. 1. Вычисления проводятся в следующем порядке:

  1. строится график функции ;

  2. максимальное значение графика достигается при ;

  3. вычисляется критическое значение и решается неравенство ;

  4. интервал, соответствующий решению неравенства, с доверительной вероятностью 0.95 является доверительным интервалом для параметра экспоненциального распределения.

Рисунок 1. Иллюстрация вычисления доверительного интервала по профилю логарифма правдоподобия.

    1. Получите у преподавателя значения параметров a и n. Запишите оператор для генерации независимой выборки значений экспоненциально распределённой случайной величины с параметром a

X=exprnd(1/a,1,n);

    1. По формуле (3.2) вычислить оценку максимального правдоподобия для параметра a, обозначив её a0. Вывести на экран точное значение параметра а, полученное в задании, и построенную оценку a0. Для вывода использовать оператор

disp([‘a=’,num2str(a),’ estimate a=’,num2str(a0)]);

    1. По формуле (3.3) вычислить границы 95% доверительного интервала для параметра a, обозначив их a1 и a2. Вывести a1 и a2 на экран компьютера с помощью оператора

disp([num2str(a1),’ < a < ‘,num2str(a2)]);

    1. Считая, что цензурирования нет, построить по формуле (3.1) график логарифма правдоподобия, вычислить критическое значение t, найти приближённое решение неравенства , вывести результат на экран компьютера. Для вычислений можно использовать следующие операторы

at1=0.05; at2=0.2; % величины at1 и at2 могут изменяться

% в зависимости от сгенерированной выборки

at=at1:0.001:at2;

i=0;

for a=at

i=i+1;

LnL(i)=n*log(a)-a*sum(X);

end

t=n*log(a0)-a0*sum(X)-1.92;

plot(at,LnL,'k',[at(1),at(end)],[t t],’--’)

box off; xlabel('a')

at=at(LnL>=t);

disp([num2str(at(1)),’ < a < ‘,num2str(at(end))]);

    1. С помощью команды run Lab3 выполните записанные операторы. Значения параметров, построенный график и выведенные на экран числа внесите в отчёт о выполнении лабораторной работы. Сделайте вывод о близости оценки параметра экспоненциального распределения, построенной методом максимального правдоподобия, к истинному значению параметра. Убедитесь, что истинное значение параметра экспоненциального распределения попадает в 95% доверительный интервал, вычисленный двумя методами.

Задание 2. Построение оценок максимального правдоподобия и их доверительной области для параметров модели Вейбулла распределения длительности события

Модель Вейбулла используется при описании длительности безотказной работы технических систем при наличии постепенных отказов, вызванных дрейфом параметров системы в процессе эксплуатации. Случайная величина, имеющая распределение, которое задаётся моделью Вэйбулла, описывается функцией распределения

,

где a – масштабный множитель, k – параметр формы. Плотность вероятности имеет вид

.

Логарифм функции правдоподобия, построенной по независимой выборке длительностей с цензурированием, имеет вид

, (3.4)

где , если наблюдение нецензурировано, , если наблюдение цензурировано, m – число нецензурированных наблюдений (случаев). Необходимым условием максимума выражения (3.4) является равенство нулю первых частных производных LnL по a и по k

,

откуда получаем, что оценка максимального правдоподобия параметра масштаба a равна

(3.5).

Для получения оценки максимального правдоподобия параметра формы k необходимо решить другое уравнение. Запишем

.

Подставив выражение для оценки , получим уравнение для определения оценки k, которое решается численными методами

(3.6).

Подставляя найденное значение оценки в (3.5) получим оценку параметра .

То, что найденные оценки доставляют логарифму правдоподобия максимум, а не минимум доказывается с помощью того факта, что матрица, составленная из вторых частных производных, является отрицательно определённой. Доказательство этого факта здесь не рассматривается.

Модель Вейбулла содержит два параметра и точность их одновременной оценки определяется доверительной областью на плоскости значений параметров. Для построения этой доверительной области используется метод построения поверхности логарифма правдоподобия. Этот метод основан на том, что при большом числе наблюдений случайная величина имеет распределение с двумя степенями свободы. Из свойств распределения следует, что с вероятностью 0.95 справедливо неравенство .

Метод профиля логарифма правдоподобия иллюстрирует рис. 3.2. Вычисления проводятся в следующем порядке:

  1. строится поверхность функции ;

  2. максимальное значение поверхности достигается при ;

  3. вычисляется критическое значение и определяется область, задаваемая неравенством ;

  4. найденная область является 95% доверительной областью для параметров модели Вейбулла.

Рисунок 3.2. Иллюстрация вычисления доверительной области по поверхности логарифма правдоподобия.

    1. Получите у преподавателя значения параметров a, k и n. Запишите оператор для генерации независимой выборки значений случайной величины, имеющей распределение, описываемое моделью Вейбулла с параметрами a и k

X=wblrnd(1/a,k,1,n);

    1. Считая, что цензурирования нет, построить по формуле (3.4) поверхность логарифма правдоподобия,

% значения переменных a1, a2, k1 и k2 могут зависеть от сгенерированных данных и параметров модели Вейбулла

a1=1.5;a2=3; k1=0.8; k2=1.4;

at=a1:0.01:a2;

kt=k1:0.01:k2;

LnL=zeros(length(at),length(kt));

for i=1:length(at)

for j=1:length(kt)

LnL(i,j)=n*log(at(i)*kt(j))+(kt(j)-1)*sum(log(at(i)*X))-sum((at(i)*X).^k(j));

end

end

    1. Вычислить критическое значение t, нарисовать область, ограничивающую множество решений неравенства

maxLnL=max(LnL(:));

t=maxLnL-3.0;

contour(a,k,LnL',[lev lev]);

xlabel(‘a’); ylabel(‘k’);

    1. Найти приблизительное положение максимума поверхности логарифма правдоподобия, вывести результат на экран компьютера.

ah=a(max(LnL,[],2)==maxLnL); % оценка масштаба

kh=k(max(LnL,[],1)==maxLnL); % оценка параметра формы

disp([‘a=’,num2str(ah),’ k=’,num2str(kh)])

    1. Нанести на плоскости, построенной в пункте 2.3, символ * зелёного цвета с координатами a и k, а также символ О красного цвета с координатами ah и kh

hold on;

plot(a,k,’*g’);

plot(ah,kh,’Or’);

    1. С помощью команды run Lab3 выполните записанные операторы. Значения параметров, построенный график и выведенные на экран числа внесите в отчёт о выполнении лабораторной работы. Сделайте вывод о близости оценок параметров модели Вейбулла, построенных методом максимального правдоподобия, к их истинным значениям.

Задание 3. Построение оценок максимального правдоподобия и их доверительной области для параметров модели Гомпертца распределения длительности события

Модель Гомпертца используется при описании длительности событий в живых организмах, например, при описании продолжительности жизни. Случайная величина, имеющая распределение, которое задаётся моделью Гомпертца, описывается функцией распределения

,

где a – «начальная смертность», b – «темп старения». Плотность вероятности имеет вид

.

Логарифм функции правдоподобия, построенной по независимой выборке длительностей с цензурированием, имеет вид

, (3.7)

где , если наблюдение нецензурировано, , если наблюдение цензурировано. Необходимым условием максимума выражения (3.7) является равенство нулю первых частных производных LnL по a и по b

,

откуда получаем, что оценка максимального правдоподобия параметра a равна

, (3.5)

m – число нецензурированных наблюдений (случаев).

Для получения оценки максимального правдоподобия параметра b необходимо решить другое уравнение. Запишем

.

Подставив выражение для оценки , получим уравнение для определения оценки b, которое решается численными методами

(3.6).

Подставляя найденное значение b в (3.5) получим оценку .

То, что найденные оценки доставляют логарифму правдоподобия максимум, а не минимум доказывается с помощью того факта, что матрица, составленная из вторых частных производных, является отрицательно определённой. Доказательство этого факта здесь не рассматривается.

Для построения доверительной области значений параметров модели Гомпертца используется метод построения поверхности логарифма правдоподобия. Этот метод основан на том, что при большом числе наблюдений случайная величина имеет распределение с двумя степенями свободы. Из свойств распределения следует, что с вероятностью 0.95 справедливо неравенство .

Вычисления проводятся в следующем порядке:

  1. строится поверхность функции ;

  2. максимальное значение поверхности достигается при ;

  3. вычисляется критическое значение и определяется область, задаваемая неравенством ;

найденная область является 95% доверительной областью для параметров модели Гомпертца.

    1. Получите у преподавателя значения параметров a, b и n. Запишите оператор для генерации независимой выборки значений случайной величины, имеющей распределение, описываемое моделью Гомпертца с параметрами a и b. Для этого сначала генерируется независимая выборка из n чисел, имеющих экспоненциальное распределение со средним значением 1. Элементы выборки вычисляются по формуле .

z=exprnd(1,1,n);

x=log(b/a*z+1)/b;

    1. Считая, что цензурирования нет, построить по формуле (3.7) поверхность логарифма правдоподобия,

% значения переменных a1, a2, b1 и b2 могут зависеть от сгенерированных данных и параметров модели Гомпертца

a1=0.00001;a2=1.5; b1=1; b2=12;

at=a1:0.01:a2;

bt=b1:0.1:b2;

LnL=zeros(length(at),length(bt));

for i=1:length(at)

for j=1:length(bt)

LnL(i,j)=n*log(at(i))+bt(j)*sum(x)-at(i)/bt(j)*(sum(exp(bt(j)*x))-n);

end

end

    1. Вычислить критическое значение t, нарисовать область, ограничивающую множество решений неравенства

maxLnL=max(LnL(:));

t=maxLnL-3.0;

contour(a,b,LnL',[lev lev]);

xlabel(‘a’); ylabel(‘b’);

    1. Найти приблизительное положение максимума поверхности логарифма правдоподобия, вывести результат на экран компьютера.

ah=a(max(LnL,[],2)==maxLnL); % оценка a

bh=b(max(LnL,[],1)==maxLnL); % оценка b

disp([‘a=’,num2str(ah),’ b=’,num2str(bh)])

    1. Нанести на плоскости, построенной в пункте 3.3, символ * зелёного цвета с координатами a и b, а также символ О красного цвета с координатами ah и bh

hold on;

plot(a,b,’*g’);

plot(ah,bh,’Or’);

    1. С помощью команды run Lab3 выполните записанные операторы. Значения параметров, построенный график и выведенные на экран числа внесите в отчёт о выполнении лабораторной работы. Сделайте вывод о близости оценок параметров модели Гомпертца, построенных методом максимального правдоподобия, к их истинным значениям.

Контрольные вопросы.

  1. Чем отличаются модели Вейбулла и Гомпертца?

  2. По каким формулам вычисляется логарифм правдоподобия для экспоненциального распределения, модели Вейбулла и модели Гомпертца?

  3. Что такое цензурирование справа и как оно учитывается при построении правдоподобия?

  4. По каким формулам вычисляются оценки параметров модели в методе максимального правдоподобия?

  5. В чём заключается сущность метода определения 95% доверительной области через поверхность логарифма правоподобия?

  6. Как в MATLAB построить 3D поверхность?

  7. Как в MATLAB нарисовать контурное представление поверхности?

  8. Опишите результат выполнния оператора at=at(LnL>=t). Здесь at и LnL – векторы одинаковой длины, t – число.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]