Скачиваний:
110
Добавлен:
01.05.2014
Размер:
10.78 Mб
Скачать

6.4.3. Случай 2. Все параметры неизвестны

Если i,i Р(i) неизвестны и на матрицу ковариаций ограничения не наложены, то принцип максимума правдоподобия дает бесполезные вырожденные решения. Пусть p(x|, 2) — двух­компонентная нормальная плотность смеси

Функция правдоподобия дляп выборок, полученная согласно этому вероятностному закону, есть просто произведение п плотностей p(xk|,2). Предположим, что =x1, так что

Ясно, что для остальных выборок

так что

Таким образом, устремляя к нулю, мы можем получить про­извольно большое правдоподобие, и решение по максимуму правдо­подобия будет вырожденным.

Обычно вырожденное решение не представляет интереса, и мы вынуждены заключить, что принцип максимума правдоподобия не работает для этого класса нормальных смесей. Однако эмпирически установлено, что имеющие смысл решения можно все-таки получить, если мы сосредоточим наше внимание на наибольшем из конечных локальных максимумов функции правдоподобия. Предполагая, что функция правдоподобия хорошо себя ведет на таких максиму­мах, мы можем использовать соотношения (9)—(11), чтобы получить оценки для i, i и Р(i). Когда мы включаем элементы матрицы i, в элементы вектора параметров i, мы должны помнить, что толь­ко половина элементов, находящихся вне диагонали, независимы. Кроме этого, оказывается намного удобней считать неизвестными параметрами независимые элементы матрицы -1i, а не матрицы i. После этого дифференцирование

по элементам i, и -1i не представляет труда. Пусть xp(k)p-й. элемент xk, p(i) p-й элемент i, pq(i)-pq-й элемент i и pq(i) — pq-й элемент -1i. Тогда

гдеpq символ Кронекера. Подставляя эти результаты в (10) и проделав некоторые алгебраические преобразования, мы получим следующие выражения для оценок `i,`i,Р`(i) по локальному максимуму правдоподобия:

где

Хотя обозначения внешне весьма усложняют эти уравнения, их интерпретация относительно проста. В экстремальном случае при (i|xk,), равном единице, если xk принадлежит классу i, и равном нулю в противном случае, оценка (i) есть доля выборок из i, оценка i— среднее этих выборок и i— соответствующая матрица ковариаций выборок. В более общем случае, когда (i|xk,) находится между нулем и единицей, все выборки играют некоторую роль в оценках. Однако и тогда оценки в основном — это отношения частот, средние выборок и матрицы ковариаций выборок.

Проблемы, связанные с решением этих неявных уравнений, сходны с проблемами, рассмотренными в п. 6.4.1. Дополнительная сложность состоит в необходимости избегать вырожденных решений. Из различных способов, которые можно применить для получения решения, самый простой состоит в том, чтобы, используя начальные оценки в (17), получить (i|xk,) и затем, используя соотношения (14)—(16), обновить эти оценки. Если начальные оценки очень хорошие, полученные, возможно, из достаточно большого множества помеченных выборок, сходимость будет очень быстрой. Однако результат зависит от начальной точки, и всегда остается проблема неединственности решения. Более того, повторные вычисления и обращение матриц ковариаций может потребовать много времени.

Значительного упрощения можно достичь, если предположить, что матрицы ковариаций диагональны. Это дает возможность умень­шить число неизвестных параметров, что очень важно, когда число выборок невелико. Если это предположение слишком сильно, то еще возможно получить некоторое упрощение, предполагая, что с матриц ковариаций равны, что тоже снимает проблему вырожденных ешений. Вывод соответствующих уравнений для оценки по максимуму правдоподобия для этого случая рассматривается в задачах 5 и 6.

Соседние файлы в папке Анализ и интерпретация данных