Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТВМС Шпоры.doc
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
1.48 Mб
Скачать

33. Оценка параметров. Понятие оценки. Несмещённые оценки. Статистика. Состоятельность оценок. Свойства точечных оценок. Исправленная дисперсия.

Несмещённые оценки

Для того что бы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определённым требованиям.

Если выборку определенного объёма повторить и заново вычислить оценку , то получим новое значение. Т.о. оценка Q* сама является случайной величиной.

Как и любая случайная величина Q* имеет своё среднее значение, Матожидание M(Q*). Это значение может совпадать со значением ген. совокупности, а может и ген совпадать.

Если M(Q*)=Q*, то такая оценка называется несмещённой. Если же M(Q*)=Q*,то это смещённая оценка.

Теорема: Если М* для обеспечения состоятельности вычисляется обычной формулой для мат. ожидания, но с замен6ой р на р*, то такая оценка несмещённая.

Статистика

Величиной статистика называется любая функция, которая зависит от многих аргументов, а этими аргументами являются выборочные значения вел-ны х.

Например, статистикой, то есть функцией, которая зависит от выборочных значений вел-ны х, млжно назвать след. ф-ю:

Главная задача статистики оценить неизвестные характеристики ген.совокупности.

Состоятельность оценок

Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещённой оценки при стремится к нулю, то такая оценка оказывается и состоятельной.

Исправленная дисперсия

Выборочная дисперсия, вычисленная обычным образом, то есть с заменой р на р* и М на М*, то есть по формуле то будучи случайной величиной при повторении выборок D* будет принимать различные значения.

Если вычислить среднее значение случ. вел-ны D*, то теорема гласит, что

D* является смещённой оценкой.

Так как в случае дисперсии ситуацию можно исправить введением дополнительного множителя, то определяют новую оценочную вел-ну: исправленная дисперсия. Обозначается

Исправленная дисперсия является, конечно, несмещённой оценкой генеральной дисперсии. Действительно,

34. Доверительные интервалы. Доверительный интервал для среднего значения нормального распределения при известной дисперсии. Доверительный интервал для среднего значения нормального распределения при неизвестной дисперсии.

Доверительный интервал для среднего значения нормального распределения при известной дисперсии. Пусть количественный признак Х генеральной совокупности распределён нормально, причём среднее квадратическое отклонение этого распределения известно. Требуется оценить неизвестное математическое ожидание а по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надёжностью . Будем рассматривать выборочную среднюю как случайную величину ( изменяется от выборки к выборке) и выборочные значения признака - как одинаково распределённые независимые случайные величины (эти числа также изменяются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно а и среднее квадратическое отклонение - .

Примем без доказательства, что если случайная величина Х распределена нормально, то выборочная средняя , найденная по независимым наблюдениям, также распределена нормально. Параметры распределения таковы

.

Потребуем, чтобы выполнялось соотношение

,

где - заданная надёжность.

Пользуясь формулой

,

заменив Х на и на , получим

где .

Найдя из последнего равенства , можем написать

приняв во внимание, что вероятность Р задана и равна , окончательно имеем (чтобы получить рабочую формулу, выборочную среднюю вновь обозначим через )

смысл полученного соотношения таков: с надёжностью можно утверждать, что доверительный интервал покрывает неизвестный параметр а; точность оценки .

Итак, поставленная выше задача полностью решена. Укажем ещё, что число t определяется из равенства или ; по таблице функции Лапласа находят аргумент t, которому соответствует значение функции Лапласа, равное .

ЗАМЕЧАНИЕ1. Оценку называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:

  1. при возрастании объёма выборки п число убывает и, следовательно, точность оценки увеличивается;

  2. увеличение надёжности оценки приводит к увеличению t (Ф(t) – возрастающая функция), следовательно и к возрастанию ; другими словами, увеличение надёжности классической оценки влечёт за собой уменьшение её точности.

ЗАМЕЧАНИЕ2. Если требуется оценить математическое ожидание с наперед заданной точностью и надёжностью , то минимальный объём выборки, которую обеспечит эту точность, находят по формуле

(следствие равенства ).

Доверительный интервал для среднего значения нормального распределения при неизвестной дисперсииПусть количественный признак Х генеральной совокупности распределён нормально, причём среднее квадратическое отклонение этого распределения неизвестно. Требуется оценить неизвестное математическое ожидание а с помощью доверительных интервалов. Оказывается, что по данными выборки можно построить случайную величину (её возможные значения будем обозначать через t): ,

которая имеет распределение Стьюдента с k = n – 1 степенями свободы; здесь - выборочная средняя, S – «исправленное» среднее квадратическое отклонение, п – объём выборки.

Плотность распределения Стьюдента

,

где .

Мы видим, что распределение Стьюдента определяется параметром п – объёмом выборки (или, что то же, числом степеней свободы k=n-1) и не зависит от неизвестных параметров а и ; эта особенность является его большим достоинством. Поскольку S(t,n) – чётная функция от t, вероятность осуществления неравенства .

Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим

Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал , покрывающий неизвестный параметр а с надёжностью . Здесь случайные величины и S заменены неслучайными величинами и s, найденными по выборке.

Однако важно подчеркнуть, что для малых выборок (п<30), в особенности для малых значений п, замена распределения нормальным приводит к грубым ошибкам, а именно к неопределённому сужению доверительного интервала, то есть к повышению точности оценки.

То обстоятельство, что распределение Стьюдента при малой выборке даёт не вполне определённые результаты (широкий доверительный интервал), вовсе не свидетельствует о слабости метода Стьюдента, а объясняется тем, что малая выборка, разумеется содержит малую информацию об интересующем нас признаке.

35. Критерии согласия. Проверка гипотез. Простые и сложные гипотезы. Нулевая гипотеза. Альтернативная гипотеза. Ошибки первого и второго рода. Уровень значимости. Критические точки – односторонние и двухсторонние. Связь критических точек и квантилей. Степень свободы.

Простые и сложные гипотезы

Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.

Различают гипотезы, которые содержат одно и более одного предположений.

Простой называют гипотезу, содержащую только одно предположение. Например, если - параметр показательного распределения, то гипотеза - простая.

Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза состоит из бесчисленного множества простых вида , где - любое число, больше 5.

Нулевая гипотеза

Нулевой (основной) называют выдвинутую гипотезу .

Альтернативная гипотеза

Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой.

Ошибки первого и второго рода

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость её проверки. Поскольку проверку производят статистическими методами, её называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, то есть могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.

Замечание1. правильное решение может быть принято также в двух случаях:

  1. гипотеза принимается, причём и в действительности она правильная;

  2. гипотеза отвергается, причём и в действительности она неверна.

Уровень значимости

Вероятность совершить ошибку первого рода принято обозначать через ; её называют уровнем значимости.

Наиболее часто уровень значимости принимают равным 0,05 или 0,01. если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).

Критические точки – односторонние и двухсторонние

Критическими точками (границами) называют точки, отделяющие критическую область от области принятия гипотезы.

Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством К > , где - положительное число.

Левосторонней называют критическую область, определяемую неравенством К < , где - отрицательное число.

Односторонней называют правостороннюю или левостороннюю критическую область.

Двусторонней называют критическую область, определяемую неравенствами , , где