Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
вопросы госы 2021.docx
Скачиваний:
105
Добавлен:
01.06.2021
Размер:
10.49 Mб
Скачать
  1. Смещенность симметричного распределения: выборочное среднее, выборочная медиана, усеченное среднее

Выборочное среднее является простейшей оценкой смещения случайной величины:

В случае, если дисперсия случайной величины равна бесконечности, скорость сходимости оценки к истинному значению может быть существенно медленнее, чем ~1n. В случае же, если не существует математическое ожидание, выборочное среднее является несостоятельной оценкой смещения симметричного распределения и не применимо в принципе.

В частности, это справедливо для так называемых "тяжелохвостных" распределений, пример одного из которых (распределения Коши) приведен на рис. 1. На графике видно, что, не смотря на кажущуюся схожесть, плотность вероятности Коши имеет одно важное отличие от нормальной плотности, а именно существенно более медленную скорость спадания "хвостов" (обведено на рисунке).

Рисунок 1 – Сравнение распределения Коши и нормального распределения

Таким образом, случайная величина, распределенная по закону Коши, с высокой вероятностью принимает значения, существенно отклоняющиеся от точки смещения. Эти большие значения (выбросы) сильно искажают результирующую сумму (1) и делают оценку несостоятельной. Данный негативный эффект может быть частично устранен при помощи метода усечения выборки.

Усечённое среднее

Основной идеей данного метода является предварительное удаление из выборки т.н. выбросов, сильно отклоняющихся от центра распределения величин. Для этого элементы выборки вначале упорядочиваются в порядке возрастания. Получившаяся в результате последовательность называется вектором порядковых статистик, а ее i-й элемент - i-й порядковой статистикой. После этого из выборки удаляются kN первых и kN последних элементов, а от оставшихся считается среднеарифметическое:

(2)

Доля удаляемых элементов k называется коэффициентом усечения и обычно выбирается в диапазоне 0.05-0.2. Чем больше величина k, тем устойчивее оценка к наличию выбросов в выборке, но тем меньше ее эффективность в случае, когда выборка выбросов не содержит. Классическим примером использования усеченного среднего является подсчет среднего балла на спортивных соревнованиях: из выставленных судьями оценок отбрасывается самая маленькая и самая большая оценки. Таким образом, организаторы соревнований борются с намеренным занижением или завышением балла в случае ангажированности судей.

Предельным случаем усеченного среднего, когда из вектора порядковых статистик удалены все элементы кроме центрального, называется метод выборочной медианы.

Выборочная медиана

Выборочная медиана получается путем отбрасывания из вектора порядковых статистик всех элементов, кроме центрального (в случае, если N – нечетное), либо двух центральных (если N – четное):

Здесь символ ⌈ ⌉ обозначает округление вверх до ближайшего целого. Выборочная медиана является одной из наиболее устойчивых к выбросам оценок, однако неприменима в случае, когда медиана исходного распределения не может быть однозначно определена (т.е. когда в окрестности точки смещения c).

Соседние файлы в предмете Государственный экзамен