
- •Тема: «Представление информации»
- •Статистическая обработка данных.
- •Статистическая оценка законов распределения Статистическая оценка плотности вероятности.
- •Статистическая оценка функции распределения
- •Статистическая оценка числовых характеристик случайной величины
- •Точечные оценки числовых характеристик
- •Регрессионный анализ
- •Проверка статистических гипотез
- •Критерий качества оценки решающего правила
- •Интеллектуальный анализ данных
- •Предварительная обработка
- •Предварительная обработка при мультипликативной помехе
- •Локализация объекта распознавания
- •Идентификация
Статистическая оценка числовых характеристик случайной величины
Оценки параметров распределения бывают точечные и интервальные.
Точечные оценки указывают конкретное число (оценку истинного значения).
Интервальные указывают интервал истинного значения (вероятность попадания).
Точечные оценки числовых характеристик
Введем понятия теоретического и эмпирического момента.
Начальные теоретические
моменты определяется следующим образом
– вектор числовых характеристик распределения.
– плотность вероятностей.
Мы выделили плотность распределения
– математическое ожидание.
Если
равно единицы, то это формула математического
ожидания. Математическое ожидание
является начальным моментом первого
порядка.
Допустим,
известен закон распределения случайной
величины. Однако параметры распределения
неизвестны. Имеется случайная выборка
из этой случайной величины, то-есть
конкретных измерений -
,
,…,
.
Целью обработки является статистическая
оценка вектора параметров
(для нормального закона, математическое
ожидание и дисперсия)
Так как полученные каждого измерения равновероятно, то эмпирический момент первого порядка оценивается с помощью следующей формулы:
Известно,
что при увеличении объема выборки n
(количество измерений), теоретическое
и эмпирическое значения сходятся по
вероятности, поэтому можно записать
У нас получилось одно уравнение с двумя неизвестными. И решить его невозможно.
Поэтому формируем начальный момент второго порядка.
…
Количество составленных таким образом уравнений, должно соответствовать количеству оцениваемых параметров. Решение системы уравнений обозначим следующим образом:
– статистическая оценка параметров полученная по случайной выборке .
Кроме начальных моментов каждого порядка, для составления системы уравнений используются центральные моменты -ого порядка.
(функция)
Центральный момент второго порядка называется дисперсия.
Эмпирический центральный момент второго порядка:
Для оценки параметров нормального распределения, целесообразно использовать следующую систему уравнений:
Тогда решение будет математическое ожидание и дисперсия. Рассмотренный выше метод получили название метода момента.
Этот методы был применен для оценки параметров нормального закона распределения. Решение этой системы уравнений дало следующие результаты.
Для нормального закона эти результаты получили специальное название
– средне выборочное.
– выборочная
дисперсия.
Метод максимального правдоподобия.
Исходные данные:
- имеется
измерений.
Целью обработки является, как и в предыдущем случае – статистическая оценка параметров полученная по случайной выборке .
Наносим результаты измерений на оси абсцисс:
…
Придаем вектору значение наобум и рисуем на графике.
– это вероятность того, что измерения
относятся к закону распределения
.
– вероятность того, что все пять измерений
относятся к закону распределения 1.
Проводим второй вектор.
Лучше соответствует тот результат измерения закон распределения, у которого вероятность измерений больше. Самый лучший это тот который обеспечивает максимум этой вероятности.
- функция
правдоподобия.
Статистической оценкой вектора параметра будем считать
– это аргумент
функции правдоподобия, при котором она
достигает максимума.
Это классическая задача исследования функции (правдоподобия) на экстремумы.
В рамках этой задачи составляется следующая система уравнений:
Для нормального закона распределения статистические оценки закона совпадают со статистическими оценками методами моментов, но это правило исключительно для нормального закона.
Как уже указывалось ранее, статистическая оценка должна отвечать следующим требованиям:
Несмещённость
Состоятельность
Эффективность
Результат оценки зависит от свойств анализируемых данных. Чаще всего эти методы оценки отличаются по эффективности. Кроме этих двух методов на практике используется:
Метод наименьших квадратов.
Метод наименьших абсолютных отклонений.
Метод наименьшего максимального абсолютного отклонения.
Каждый из этих методов имеет свою область применений.
Базовым среди этих методов является метод максимального правдоподобия.
Результат точечного оценивания широко используется в практике информационных управляющих систем. Они используются для адаптивного управления (Теория управления), для идентификации объекта (Система искусственного интеллекта), техника обработки сигналов и изображений.
Второй модуль (?)
01.01.12