- •Глава 4 непараметрические методы
- •4.1. Введение
- •4.2. Оценка плотности распределения
- •4.3. Парзеновские окна
- •4.3.1. Общие соображения
- •4.3.2. Сходимость среднего значения
- •4.3.3. Сходимость дисперсии
- •4.3.4. Два примера
- •4.4. Оценка методом kn ближайших соседей
- •4.5. Оценка апостериорных вероятностей
- •4.6. Правило ближайшего соседа
- •4.6.1. Общие замечания
- •4.6.2. Сходимость при использовании метода ближайшего соседа
- •4.6.3. Уровень ошибки для правила ближайшего соседа
- •4.6.4. Границы ошибки
- •4.7. Правило k ближайших соседей
- •4.8. Аппроксимации путем разложения в ряд
- •4.9. Аппроксимация для бинарного случая
- •4.9.1. Разложение Радемахера - Уолша
- •4.9.2. Разложение Бахадура - Лазарсфельда
- •4.9.3. Разложение Чоу
- •4.10. Линейный дискриминант Фишера
- •4.11. Множественный дискриминантный анализ
- •4.12. Библиографические и исторические сведения
4.6.2. Сходимость при использовании метода ближайшего соседа
Теперь мы хотим оценить среднюю вероятность ошибки для правила ближайшего соседа. В частности, если Рn(е) есть уровень ошибки с п выборками и если
(27)
то мы хотим показать, что
Р*РР*. (28)
Начнем с замечания, что при использовании правила ближайшего соседа с конкретным множеством п выборок результирующий уровень ошибки будет зависеть от случайных характеристик выборок. В частности, если для классификации х используются различные множества п выборок, то для ближайшего соседа вектора х будут получены различные векторы . Так как решающее правило зависит от ближайшего соседа, мы имеем условную вероятность ошибки, которая зависит как от х, так и от . Усредняя по , получаем
(29)
Обычно очень трудно получить точное выражение для условной плотности распределения p(|х). Однако, поскольку, по определению является ближайшим соседом х, мы ожидаем, что эта плотность будет очень большой в непосредственной близости от х и очень малой во всех других случаях. Более того, мы ожидаем, что по мере устремленияп к бесконечности р(|х) будет стремиться к дельта-функции с центром в х, что делает оценку, задаваемую (29), тривиальной. Для того чтобы показать, что это действительно так, мы должны допустить, что плотность р для заданного х непрерывна и не равна нулю. При таких условиях вероятность попадания любой выборки в гиперсферу S с центром в х есть некое положительное число
Таким образом, вероятность попадания всех n независимо взятых выборок за пределы этой гиперсферы будет (1—PS)n, стремящейся к нулю по мере устремления п к бесконечности. Итак, сходится к х по вероятности ир (| х) приближается к дельта-функции, как и ожидалось. Вообще говоря, применяя методы теории меры, можно получить более убедительные (и более строгие) доказательства сходимостик х, но для наших целей достаточно полученного результата.
4.6.3. Уровень ошибки для правила ближайшего соседа
Обратимся теперь к вычислению условной вероятности ошибки Рn(е|х, ). Чтобы избежать недоразумений, необходимо поставить задачу более тщательно, чем это делалось до сих пор. Когда мы говорим, что у нас имеетсяп независимо сделанных помеченных выборок, то мы имеем в виду n пар случайных переменных (x1, ), (x2, ), . . ., (хn , ), где может быть любым изс состояний природы , . . . , . Мы полагаем, что эти пары получались путем выбора состояния природы для с вероятностьюP(), а затем путем выбора хi в соответствии с вероятностным законом p(х|), причем каждая пара выбирается независимо. Положим теперь, что природа выбирает пару (х,) и что , помеченноеесть ближайшая к х выборка. Поскольку состояние природы при выборене зависит от состояния при выборе х, то
(30)
Теперь, если применяется решающее правило ближайшего соседа, мы совершаем ошибку всякий раз, когда =. Таким образом, условная вероятность ошибки Рn(е|х, ) задается в виде
(31)
Чтобы получить Рn(е), надо подставить это выражение в (29) вместо Рn(e|х), а затем усреднить результат по х. Вообще это очень трудно сделать, но, как мы уже замечали ранее, интегрирование в (29) становится тривиальным по мере устремления n к бесконечности, а р(, х) к дельта-функции. ЕслиР(, х) непрерывна в х, получаем
(32)
Так что асимптотический уровень ошибки правила ближайшего соседа, если можно поменять местами интегрирование и переход
к пределу 4, задается выражением
(33)