- •Тема: «Представление информации»
- •Статистическая обработка данных.
- •Статистическая оценка законов распределения Статистическая оценка плотности вероятности.
- •Статистическая оценка функции распределения
- •Статистическая оценка числовых характеристик случайной величины
- •Точечные оценки числовых характеристик
- •Регрессионный анализ
- •Проверка статистических гипотез
- •Критерий качества оценки решающего правила
- •Интеллектуальный анализ данных
- •Предварительная обработка
- •Предварительная обработка при мультипликативной помехе
- •Локализация объекта распознавания
- •Идентификация
Статистическая обработка данных.
При статистической обработке данных пользуется частичной информацией о случайной величине, которую мы в дальнейшем будем называть случайной выборкой. Случайную величину в полном объеме в дальнейшем будем называть генеральной совокупностью. Если из генеральной совокупности выбрано n его значений, то X1, X2,…, Xn называется случайной выборкой объема n.
Оценки в числовых
характеристиках (параметрах), случайной
величины, полученной при генеральной
совокупности, мы будем в дальнейшем
обозначать буквой
,
или в случае многомерной оценки -
.
В частном случае
.
Статистическая оценка
,
полученная по выборке n,
является случайной величиной.
Требования к статистической оценке :
Не смещённость
– среднее значение статистических
оценок математического ожидания должно
равняться истинному значению параметра.Состоятельность.
– в пределе, при объеме выборки n
стремящееся к бесконечности, вероятность
того, что модуль отклонения статистической
оценки, полученной по выборке объема
n, от истинного объема
меньше заданной величины равна единице.
– называется сходимостью
по вероятности.Эффективность. Свойство эффективности заключается в том, что среди всех методов статистической оценки данного класса должен быть выбран тот, дисперсия которого минимальна. Такая оценка называется эффективной.
Уровень значимости. Так как статистическая оценка является величиной случайной, то она имеет собственный закон распределения (в данном случае плотность вероятности).
…
На плотности вероятности
выделяется интервал
.
Вероятности
,
обозначенные на графики показывают,
что статистическая оценка
выйдет за пределы интервала. Сумма этих
двух площадей называется
или уровень значимости, а
называется уровнем доверия.
Для того чтобы снизить уровень значимости (повысить уровень доверия) нужно:
Увеличить объем выборки n.
Увеличить интервал .
Понятие уровня значимости широко используется в метрологии, для обоснования выбора измерительного прибора и обработки данных измерения. Кроме того этот аппарат используется при планировании эксперимента для оценки параметра n объема выборки.
Статистическая оценка законов распределения Статистическая оценка плотности вероятности.
Действия для оценки плотности вероятности:
Диапазон – определяем минимальное и максимальное значение.
Мы разбиваем диапазон на интервалы.
Строим график, по количеству попаданий выборок в данные интервалы.
. Полученный результат называется
гистограммой.
…
Другая форма представления закона:
Отмечаем в каждом прямоугольнике центр и соединяем их. Получается полигон частот. Для непрерывной случайной величины.
…
Статистическая оценка функции распределения
Действия:
Результаты измерения упорядочиваются по возрастанию. Пишется количество градаций величины m, в общем случае отличается от объема выборки n, так как результаты измерений могут повторяться. – вероятность случайной величины X будет меньше значения x. … …
Величина
– характеризует сколько раз попала
величина
в диапазон.
Результат всего называем вариационным рядом случайной величины
Для того, чтобы улучшить статистическую оценку плотности вероятности необходимо:
Уменьшать величину интервала (увеличивать их количество).
Увеличивать объем выборки.
На практике объем выборки и количество интервалов выбирается в соответствии с требуемым уровнем значимости. Формулы связывающие уровень значимости с этим параметром приведены в соответствующих статистических таблицах.
11.10.12
