Скачиваний:
108
Добавлен:
01.05.2014
Размер:
4.12 Mб
Скачать

4.8. Аппроксимации путем разложения в ряд

Все описанные до сих пор непараметрические методы имеют тот недостаток, что требуют хранения в памяти всех выборок. А так как для получения хороших оценок необходимо большое количество выборок, потребность в памяти может быть слишком велика.

Кроме того, может потребоваться значительное время вычисле­ния каждый раз, когда один из этих методов используется для оценки величины р(х) или классификации нового х. При опреде­ленных обстоятельствах процедуру окна Парзена можно несколь­ко видоизменить, чтобы значительно сократить эти требования. Основная идея заключается в аппроксимации функции окна пу­тем разложения ее в конечный ряд, что делается с приемлемой точностью в представляющей интерес области. Если нам сопутствует удача и мы можем найти два множества функций (x) и (х), ко­торые допускают разложение

(37)

тогда

и из уравнения (8) имеем

(38)

где

(39)

Этот подход имеет некоторые очевидные преимущества в том случае, когда можно получить достаточно точное разложение с приемле­мым значением т. Информация, содержащаяся в n выборках, сво­дится к т коэффициентам bj. Если получают дополнительные вы­борки, соотношение (39) для bj можно легко обновить, причем коли­чество коэффициентов остается неизменным 5.

Если функции (x) и (х) являются полиномами от компонент х и хi, то выражение для оценки рn (х) есть также полином, который можно довольно эффективно вычислить. Более того, использование этой оценки для получения разделяющих функций p(x|) P() при­водит к простому способу получения полиномиальных разделяющих функций.

Тут все же следует отметить одну из проблем, возникающую при применении этого способа. Основным достоинством функции окна является ее тенденция к возрастанию в начале координат и сниже­нию в других точках. Так что (х—хi)/hn) будет иметь резкий мак­симум при х=хi, и мало влиять на аппроксимацию рn (х) для х, удаленного от хi. К сожалению, полиномы обладают досадным свой­ством, заключающимся в том, что они могут содержать неограничен­ное количество членов. Поэтому при разложении полинома могут обнаружиться члены, ассоциируемые с хi, удаленным от х, но силь­но, а не слабо влияющим на разложение. Следовательно, важно убедиться, что разложение каждой функции окна действительно точное в представляющей интерес области, а для этого может по­требоваться большое число членов.

Существует много видов разложения в ряд. Читатели, знакомые с интегральными уравнениями, вполне естественно интерпретируют соотношение (37) как разложение ядра (x, хi) в ряды по собствен­ным функциям. Вместо вычисления собственных функций можно выбрать любое приемлемое множество функций, ортогональных в интересующей нас области, и получить согласие по методу наимень­ших квадратов с функцией окна. Мы применим еще более непосред­ственный подход и разложим функцию окна в ряд Тейлора. Для простоты ограничимся одномерным случаем с гауссовской функцией ок­на:

Самым точным это разложение будет в окрестности и=0, где ошибка будет составлять менее u2m/m!. Если мы подставим

то получим полином степени 2 1) от х и хi. Например, если m=2, то

и, таким образом,

где

,

,

Это простое разложение «сжимает» информацию из п выборок в три коэффициента , и. Оно будет точным, если наибольшее значение |ххi| не превышает h. К сожалению, это заставляет нас пользоваться очень широким окном, которое не дает большого раз­решения. Беря большое количество членов, мы можем использовать более узкое окно. Если мы считаем r наибольшим значением |ххi|, то, пользуясь тем фактом, что ошибка в m-членном разложении функ­ции меньше, чем , и пользуясь аппрок­симацией Стирлинга длят!, найдем, что ошибка в аппроксимации pn(x) будет меньше, чем

Таким образом, ошибка мала только тогда, когда m>e(r/h)2. Это говорит о том, что требуется много членов, если ширина окна h невелика по сравнению с расстоянием r от х до наиболее удален­ной выборки. Несмотря на то, что этот пример элементарен, анало­гичные рассуждения действительны и для многомерного случая, даже при использовании более сложных разложений; процедура вы­глядит более привлекательной, когда ширина окна относительно велика.

Соседние файлы в папке Анализ и интерпретация данных