Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
RCoreTeam2014.docx
Скачиваний:
46
Добавлен:
08.10.2015
Размер:
539.13 Кб
Скачать
      1. Метод максимального правдоподобия

Максимальное правдоподобие - метод подгонки нелинейной модели, который применяется, даже если ошибки не нормальны. Метод находит значение параметра, которое максимизирует логарифмическое правдоподобия, или что эквивалентно, которое минимизируют отрицательное логарифмическое правдоподобие. Вот пример от Добсона (1990), стр 108-111. Этот пример подгоняет логистической модели к данным отклика дозы, которые ясно могли также быть подогнаны glm(). Данные таковы:

> x <- c(1.6907, 1.7242, 1.7552, 1.7842, 1.8113,

1.8369, 1.8610, 1.8839)

> y <- c( 6, 13, 18, 28, 52, 53, 61, 60)

> n <- c(59, 60, 62, 56, 63, 59, 62, 60)

Отрицательная логарифмическая функция правдоподобия, подлежащая минимизации, равна: > fn <- function(p)

sum( - (y*(p[1]+p[2]*x) - n*log(1+exp(p[1]+p[2]*x))

+ log(choose(n, y)) ))

Возьмем разумное начальное значение для подгонки:

> out <- nlm(fn, p = c(-50,20), hessian = TRUE)

После подгонки out$minimumравно отрицательному логарифмическому правдоподобию, иout$estimateявляется наибольшим правдоподобием оценки параметров. Чтобы получить приблизительную оценку SE, выполним:

> sqrt(diag(solve(out$hessian)))

95% доверительный интервал получим при SE ±1.96

    1. Некоторые нестандартные модели

Завершается эта глава кратким упоминанием о некоторых других средствах, доступных в R, для специальной регрессии и проблем анализа данных.

  • Смешанные модели.Рекомендуемый пакетnlmeобеспечивает функцииlme()иnlme()для линейных и нелинейных моделей смешанных эффектов, который является линейными и нелинейными регрессиями, в которых некоторые из коэффициентов соответствуют случайным эффектам. Эти функции интенсивно используют формулы для спецификации модели.

  • Локально подогнанные регрессии.Функцияloess()подгоняет непараметрическую регрессию использованием локально взвешенной регрессии. Такие регрессии полезны для выделения тренда в зашумленных данных или для снижения объема данных для обзора большого набора данных.

Функция loess() находится в стандартном пакетеstatsвместе с кодом для прогноза следящей регрессии.

  • Устойчивая (робастная) регрессия. Есть несколько функций для подгонки моделей, устойчивых к влиянию экстремальных выбросов в данных. Функцияlqsв рекомендуемом пакете MASS обеспечивает современные алгоритмы для чрезвычайно устойчивой подгонки. Менее устойчивые, но статистически более эффективные методы, доступны в пакетах, например функцияrlmв пакете MASS.

  • Аддитивные модели.Этот метод стремится создавать функцию регрессии из аддитивных функций сглаживания детерминированных переменных, как правило, по одной для каждой независимой переменной. Функцииavasиaceв пакетеacepackи функциях brutoиmars в пакетеmdaобеспечивают некоторые примеры этих методов в пользовательских пакетахR. Расширением является Обобщено Аддитивная Модель, реализованная в пользовательских пакетахgam и mgcv.

  • Древовидные модели. Вместо поиска явно глобальной линейной модели для прогноза или интерпретации, древовидные модели стремятся рекурсивно разбить данные в критических точках независимых переменных для раздела данных, в конечном счете, на группы, которые являются настолько однородны, насколько возможно внутри группы, и настолько неоднородными, насколько возможно между группами. Результаты часто приводят к пониманию, к которому другие методы анализа данных не предоставляют.

Модели еще специфицируются в обычной форме линейной модели. Функция подгонки называется tree(), но много других универсальных функций, таких какplot() и text(), хорошо адаптированных к отображению результатов древовидной модели в графической виде. Древовидные модели доступны в R через пользовательские пакетыrpartиtree.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]