Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Анализ и интерпретация данных / Глава_4.doc

Скачиваний:

108

Добавлен:

01.05.2014

Размер:

4.12 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1410 11 12 13 14 > Следующая >>>

4.9. Аппроксимация для бинарного случая

4.9.1. Разложение Радемахера - Уолша

Когда составляющие вектора х дискретны, задача оценки плотности распределения становится задачей оценки вероятности Р(х=v_k). По идее задача эта еще проще, нужно только считать, сколько раз наблюдается х, чтобы получить значение v_k, и воспользоваться законом больших чисел. Однако рассмотрим случай, когда d составляющих вектора х бинарны (имеют значения 0 или 1). Поскольку имеется 2^d возможных векторов v_k, мы должны оценить 2^d вероятностей, что представляет собой огромную задачу при больших значениях d, часто возникающих в работе по распознаванию образов.

Если составляющие вектора х статистически независимы, задача намного упрощается. В этом случае можем написать

(40)

(41)

(42)

Таким образом, в этом частном случае оценка для Р(х) сводится к оценке d вероятностей p_i. Более того, если мы возьмем логарифм Р(х), то увидим, что он является линейной функцией от х, что упрощает как запоминание данных, так и вычисление:

(43)

где

(44)

Естественно поинтересоваться, существуют ли какие-либо компромиссные решения между полной строгостью, для достижения которой требуется оценка 2^d вероятностей, и вынужденным принятием статистической независимости, что сведет всю проблему к оценке только d вероятностей. Разложение для Р(х) и аппроксимация Р(х) частичной суммой дают один ответ. Когда имеются бинарные переменные, естественно использовать полиномы Радемахера — Уолша в качестве базисных функций. Такое множество 2^d полиномов можно получить путем систематического образования произведений различных сомножителей 2х_i—1, которые получаются следующим образом: ни одного сомножителя, один сомножитель, два и т. д. Таким образом, имеем

(45)

Нетрудно заметить, что эти полиномы удовлетворяют отношению ортогональности

(46)

где суммирование проводится по 2^d возможным значениям х. Итак, любую функцию Р(х), определенную на единичном d-кубе, можно разложить как

(47)

где

(48)

Рассматривая Р(х) как вероятностную функцию видим, что

(49)

Поскольку функции Радемахера — Уолша (х) — полиномы, видим, что коэффициенты , являются в сущности моментами. Так что, если Р(х) неизвестна, но имеется n выборок x₁, . . ., х_n коэффициенты можно оценить, вычисляя моменты выборок :

(50)

В пределе с устремлением п к бесконечности эта оценка по закону больших чисел должна сойтись (по вероятности) к истинному значению .

Теперь выражение (47) дает нам точное разложение для Р(х), и в этом случае оно не упрощает наши вычисления. Вместо оценки совместных вероятностей мы должны оценитьмоментов — коэффициентов . Можно, однако, аппроксимировать Р(x), усекая разложение и вычисляя только моменты низкого порядка. Аппроксимация первого порядка, полученная с помощью первых 1+d членов, будет линейной относительно х. Аппроксимация второго порядка, содержащая первые 1+d+a(d—l)/2 членов, будет квадратичной относительно х ^⁶. В целом выражение (47) показывает, что для аппроксимации полиномами Радемахера — Уолша степени k требуется оценка моментов порядка k и ниже. Эти моменты можно оценить, исходя из данных, или вычислить непосредственно из Р(х). В последнем случае тот факт, что можно суммировать сначала по переменным, не включенным в полином, говорит о том, что нужно знать только вероятности каждой переменной порядка k. Например, разложение первого порядка определяется вероятностями р_i=P(x_i= l):

где

Естественно поинтересоваться, насколько хорошо такое усеченное разложение аппроксимирует действительную вероятность Р(х). В общем, если мы аппроксимируем Р (х) с помощью рядов, включающих подмножество полиномов Радемахера — Уолша,

то можно использовать отношения ортогональности, чтобы показать, что сумма квадратичной ошибки (Р(х) — (х))² минимизируется выбором =. Таким образом, усеченное разложение является оптимальным в смысле среднеквадратичной ошибки. Кроме того, коль скоро в аппроксимацию входит постоянный полином , можно легко показать, что(х)=1, что и требуется. Однако ничто не может предотвратить превращение(х) в отрицательную величину для некоторого х. Действительно, еслине входит в полином, то(х)=0 и по крайней мере одна из вероятностей должна быть отрицательной. Этого досадного результата можно избежать путем разложенияlog Р (х), а не Р (х), хотя в этом случае мы уже не сможем больше быть уверены в том, что суммирование полученной аппроксимации для Р (х) даст единицу.

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1410 11 12 13 14 > Следующая >>>

Соседние файлы в папке Анализ и интерпретация данных

#
01.05.20142.53 Mб114Глава_3.doc
#
01.05.20144.12 Mб108Глава_4.doc
#
01.05.20142.76 Mб106Глава_5.DOC
#
01.05.201410.78 Mб110Глава_6.DOC