Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТВИМС - экзамен.docx
Скачиваний:
93
Добавлен:
01.04.2022
Размер:
18.56 Mб
Скачать

37. Выборочные числовые характеристики: выборочная средняя, выборочная дисперсия, исправленная выборочная дисперсия.

38. Точечное оценивание неизвестного параметра. Свойства оценок: состоятельность, несмещенность, эффективность.

ТОЧЕЧНАЯ ОЦЕНКА – оценка, имеющая конкретное числовое значение. Например, среднее арифметическое:

X = (x1+x2+...+xn)/n,

где: X - среднее арифметическое (точечная оценка МО); x1,x2,...xn - выборочные значения; n - объем выборки.

Когда оценка определяется одним числом, она называется точечной оценкой. Точечная оценка, как функция от выборки, является случайной величиной и меняется от выборки к выборке при повторном эксперименте. К точечным оценкам предъявляют требования, которым они должны удовлетворять, чтобы хоть в каком-то смысле быть «доброкачественными». Это несмещённость, эффективность и состоятельность.

39. Интервальные оценки. Доверительный интервал. Доверительный интервал для оценки математического ожидания нормально распределенной случайной величины.

В математической статистике интервальной оценкой называется результат использования выборки для вычисления интервала возможных значений неизвестного параметра, оценку которого нужно построить. Следует отличать от точечной оценки, которая даёт лишь одно значение. Самым распространенным видом интервальных оценок являются доверительные интервалы.

Доверительный интервал для математического ожидания - это такой вычисленный по данным интервал, который с известной вероятностью содержит математическое ожидание генеральной совокупности. Естественной оценкой для математического ожидания является среднее арифметическое её наблюденных значений.

40. Метод моментов.

Метод моментов состоит в приравнивании теоретических и эмпирических моментов. Составляется столько уравнений, сколько неизвестных параметров нужно оценить.

Теоретические моменты выражаются через параметры распределения.

Так. если распределение зависит от одного параметра, то для нахождения его оценки надо решить относительно него одно уравнение:

Если распределение зависит от двух параметров

41. Метод максимального правдоподобия.

Суть метода: составить по специальной формуле функцию правдоподобия L, и найти оценку параметра θ из условия максимизации функции правдоподобия (ФП) на определенной выборке {xi} Иногда ФП заменяют на логарифмическую функцию правдоподобия l=lnL (ЛФП), что облегчает расчеты (вычисление производных).

42. Метод наименьших квадратов.

Задача заключается в нахождении коэффициентов линейной зависимости, при которых функция двух переменных а и b принимает наименьшее значение. То есть, при данных а и b сумма квадратов отклонений экспериментальных данных от найденной прямой будет наименьшей. В этом вся суть метода наименьших квадратов.

Формулы для нахождения коэффициентов по методу наименьших квадратов (МНК).

43. Проверка статистических гипотез. Ошибки первого и второго рода.

Статистической называют гипотезу о законе распределения статистической совокупности либо о числовых параметрах известных распределений. Выдвинутая гипотеза нуждается в проверке, которая осуществляется статистическими методами, поэтому гипотезу называют статистической. Для проверки гипотезы используют критерии, позволяющие принять или опровергнуть гипотезу.

Например:

– рост танкистов распределен нормально;

дисперсии стрельбы двух танковых дивизий равны между собой, при этом известно*, что точность стрельбы распределена нормально.

* из многочисленных ранее проведённых исследований.

В первом случае была проведена выборка танкистов (например, 100 человек) и в результате её исследования появилось обоснованное предположение, что рост ВСЕХ танкистов распределён нормально. Во втором случае исследовались выборочные данные по точности стрельбы двух дивизий, в результате чего возник интерес проверить – а одинакова ли генеральная результативность, или же какая-то дивизия стреляет точнее?

В обеих гипотезах речь идёт о генеральных совокупностях, и выдвигаются эти гипотезы на основании анализа выборочных данных. Это распространенная схема, но она не единственна, бывают и другие статистические гипотезы.

Выдвигаемую гипотезу называют нулевой и обозначают через . Обычно это наиболее очевидная и правдоподобная гипотеза (хотя это вовсе не обязательно). И в противовес к ней рассматривают альтернативную или конкурирующую гипотезу .

В рассмотренных выше примерах альтернативные гипотезы очевидны (отрицают нулевую), но существуют и другие варианты, так, например, к гипотезе : генеральная средняя нормально распределенной совокупности равна , можно сформулировать разные конкурирующие гипотезы: или конкретно , это зависит от условия и данных той или иной задачи.

Поскольку нулевая гипотеза выдвигается на основании выборочных данных, то она может оказаться как правильной, так и неправильной – мы не знаем! И поэтому она подлежит статистической проверке.

Проверка осуществляется с помощью статистических критериев – это специальные случайные величины, которые принимают различные действительные значения. В разных задачах критерии разные, и мы рассмотрим их в конкретных примерах.

В результате проверки нулевая гипотеза либо принимается, либо отвергается в пользу альтернативной. При этом есть риск допустить ошибки двух типов:

Ошибка первого рода состоит в том, что гипотеза будет отвергнута, хотя на самом деле она правильная. Вероятность допустить такую ошибку называют уровнем значимости и обозначают буквой («альфа»).

Ошибка второго рода состоит в том, что гипотеза будет принята, но на самом деле она неправильная. Вероятность совершить эту ошибку обозначают буквой («бета»). Значение называют мощностью критерия – это вероятность отвержения неправильной гипотезы

Вася поиграл с котами и зарегистрировался в почтовике. По умолчанию, – он считается добропорядочным пользователем. Так считает антиспам фильтр. И вот Вася отправляет письмо. После чего фильтр может совершить ошибку двух типов: 1) ошибочно отклонить нулевую гипотезу (счесть нормальное письмо за спам и Васю за спаммера) или 2) ошибочно принять нулевую гипотезу (хотя Вася редиска).

Какая ошибка более «тяжелая»? Васино письмо может быть ОЧЕНЬ важным для адресата, и поэтому при настройке фильтра целесообразно уменьшить уровень значимости , пожертвовав вероятностью , в результате чего в основной ящик будут чаще попадать письма особо талантливых спаммеров. …Такое и почитать даже можно, ведь сделано с любовью :)

Существует примеры, где наоборот – более тяжкие последствия влечёт ошибка 2-го рода, и вероятность следует увеличить (в пользу уменьшения вероятности ).

Процесс проверки статистической гипотезы состоит из следующих этапов:

1) Обработка выборочных данных и выдвижение основной и конкурирующей гипотез. К нулю, кстати, нулевая гипотеза не имеет никакого отношения, это просто историческое название, оно могло оказаться каким угодно.

2) Выбор статистического критерия . Это непрерывная случайная величина, принимающая различные действительные значения. В разных задачах критерии разные.

3) Выбор уровня значимости , о дилемме выбора этого значения я чуть-чуть рассказал выше.

4) Нахождение критического значения – это значение случайной величины , которое зависит от выбранного уровня значимости и опционально от других параметров. Критическое значение определяет критическую область. Она бывает левосторонней, правосторонней и двусторонней (красная штриховка):

Критическая область – это область отвержения нулевой гипотезы. Незаштрихованную область называют областью принятия гипотезы.

Следует отметить, что это только одна из графических моделей. Существуют статистические критерии, которые принимают далеко не все действительные значения.

5) Далее на основании выборочных данных рассчитывается наблюдаемое значение критерия: . И вердикт:

– Если в критическую область НЕ попадает, то гипотеза на уровне значимости принимается. Здесь мы с вероятность рисковали отвергнуть правильную гипотезу. Однако не нужно думать, что нулевая гипотеза доказана и 100% правильна, ведь существует вероятность – того мы совершили совершить ошибку 2-го рода (приняли неверную гипотезу).

– Если попадает в критическую область, то гипотеза на уровне значимости отвергается (при этом, если, например, , то в среднем в 5 случаев из 100 мы отвергнем правильную гипотезу, т.е. совершим ошибку 1-го рода).