
- •Модуль 1
- •Преобразуем выражение
- •1. Выбор коэффициента размытости из условия минимума оценки квадратического критерия.
- •2. Выбор коэффициента размытости из условия максимума функции правдоподобия
- •3. Выбор коэффициентов размытости с помощью метода ближайших соседей
- •4. Выбор коэффициента размытости из условия максимума функции правдоподобия для псевдодискретной случайной величины
1. Выбор коэффициента размытости из условия минимума оценки квадратического критерия.
Рассмотрим
статистику, характеризующую меру
близости между
и
,
.
Чем
меньше
,
тем точнее оценка
аппроксимирует
.
Проведём несложные преобразования
.
Третье
слагаемое
не зависит от коэффициента размытости
и является константой, поэтому не влияет
на положение минимума
.
Тогда критерий оптимальности принимает вид
.
Заметим,
что второе слагаемое
представляет собой математическое
ожидание функции
,
которое можно оценить по исходной
выборке
.
В
результате критерий оптимизации (оценка
меры близости
)
по
принимает вид
.
(2.6)
В одномерном случае первое слагаемое (2.6) записывается в виде
.
Его значение вычисляется в соответствии со следующими ситуациями:
Рис.
2.8. Соотношения между ядерными функциями
для варианта
.
Рис.
2.9. Соотношения между ядерными функциями
для варианта
Приведём правило вычисления интеграла
Второе слагаемое представляется выражением
.
Здесь
для устранения смещения анализируемой
статистики необходимо принять условие
.
Примеры зависимости оценки (2.6) от коэффициента размытости и объёма выборки представлены на рис. 2.10-2.11.
Рис. 2.10. Зависимость критерия (2.6) от
коэффициента размытости для нормального
закона распределения случайной величины
в интервале
.
Кривая 1 соответствует объёму выборки
,
кривая 2 –
,
Кривая 3 -
.
Рис. 2.11. Зависимость критерия (2.6) от
коэффициента размытости для равномерного
закона распределения случайной величины
в интервале
.
Кривая 1 соответствует объёму выборки
,
кривая 2 -
,
кривая 2 –
,
Кривая 3 -
.
2. Выбор коэффициента размытости из условия максимума функции правдоподобия
Рассмотрим статистический критерий
оптимизации коэффициента размытости
вида
,
(2.7)
где
.
В предыдущем критерии (2.6) минимальное
значение
соответствует оптимальному коэффициенту
размытости. Для функции (2.7) наоборот,
максимальному значению
соответствует оптимальной коэффициент
размытости.
а б
в г
Рис. 2.12. Зависимость критерия (2.7) от
коэффициента размытости для нормального
закона распределения случайной величины
в интервале
.
График а соответствует объёму
выборки
,
б -
,
в –
,
г -
.
а б
в г
Рис. 2.13. Зависимость критерия (2.7) от
коэффициента размытости для равномерного
закона распределения случайной величины
в интервале
.
График а соответствует объёму
выборки
,
б -
,
в –
,
г -
.
3. Выбор коэффициентов размытости с помощью метода ближайших соседей
Пусть имеется выборка
наблюдений непрерывной случайной
величины
распределённой с неизвестной плотностью
.
Сопоставим каждому элементу обучающей
выборки
коэффициент размытости
.
Для этого зафиксируем целую положительную
величину
,
.
Определим для каждого наблюдения
интервал
,
таким образом, чтобы в него попало
соседних наблюдений. В результате для
обучающей выборки
получим выборку коэффициентов размытости
.
Тогда непараметрическая оценка плотности типа Розенблатта-Парзена (2.2) принимает вид (2.8)
.
(2.8)
Рис. 2.14. Непараметрическая оценка
плотности вероятности типа (2.8) для
равномерного закона распределения
случайной величины объёмом
в интервале
при критерии оптимизации коэффициента
размытости
.
Кривая 1 соответствует оценке плотности
вероятности для ступенчатой ядерной
функции, кривая 2 - параболической.
Рис. 2.15. Непараметрическая оценка
плотности вероятности типа (2.8) для
нормального закона распределения
случайной величины объёмом
в интервале
при критерии оптимизации коэффициента
размытости
.
Кривая 1 соответствует оценке плотности
вероятности для ступенчатой ядерной
функции, кривая 2 - параболической.
Оптимальное количество
ближайших соседей можно определить из
максимума функции правдоподобия (2.7)
.
Рис. 2.16. Зависимость критерия
от количества ближайших соседей для
равномерного закона распределения
случайной величины в интервале
и объёма выборки
.