Скачиваний:
58
Добавлен:
01.07.2022
Размер:
72.78 Mб
Скачать
  1. Примеры построения оценок и доверительных интервалов для параметров распределений – биномиального, пуассоновского, нормального, равномерного, экспоненциального.

Построение оценок для пуассоновского, экспоненциального и равномерного распределений мы разобрали в предыдущем вопросе.

  1. Проверка простых и сложных статистических гипотез: критическая область, p-value, односторонние и двухсторонние критерии, ошибки 1-ого и 2-ого рода, мощность критерия, множественные сравнения.

Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины, в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице.

Нулевая гипотеза – гипотеза об отсутствии различий, взаимосвязи. Она обозначается как Н0. Нулевая гипотеза – то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.

Альтернативная гипотеза – гипотеза о значимости различии или наличия взаимосвязи. Обозначается как Н1. Альтернативная гипотеза – то, что мы хотим доказать, поэтому иногда её называют экспериментальной гипотезой.

Статистическим критерием называется СВ, которая используется с целью проверки нулевой гипотезы.

После выбора критерия множество его возможных значений разбивают на две непересекающихся подмножества: критическую область и область принятия гипотезы.

Критическая область – совокупность значений критерия, при которых нулевая гипотеза отвергается.

Область принятия – совокупность значений критерия, при которых нулевую гипотезу принимают.

Критическая область и область принятия нулевой гипотезы являются интервалами, их разделяют критические точки.

Односторонний критерий – проверка нулевой гипотезы, когда альтернативная гипотеза выражена направленно.

Двусторонний критерий – проверка нулевой гипотезы, когда альтернативная выражена ненаправленно.

Ошибка первого рода – отклонили Н0, когда она была верна. Последствия: получили ложно статистически значимый вывод (увидели различия там, где их нет). alfa (уровень значимости) – максимальная вероятность допустить ошибку первого рода. Шанс допустить ошибку 1-го рода никогда не превысит выбранного уровня значимости, скажем α = 0,05. Нулевую гипотезу отвергают только тогда, когда p<0,05. Если обнаружено, что p>0,05, то нулевую гипотезу не отвергнут и, следовательно, не допустят ошибки 1-го рода.

Ошибка второго рода (beta) – не отклонили Н0, хотя она была не верна. Последствия: не получили статистического вывода (не заметили различия там, где они есть).

Р-value – минимальный уровень значимости, при котором нулевая гипотеза отвергается. Чем меньше p-value, тем большее право имеем на отклонение Н0.

Уровень значимости мы задаём сами.

Мощностью критерия называется вероятность отклонения гипотезы Н0, когда она ложна (вероятность не допустить ошибку второго рода; различия были и мы их заметили). Её обозначают 1-beta (beta – вероятность ошибки второго рода). Чем больше мощность критерия, тем меньше вероятность совершить ошибку второго рода.

Для увеличения мощности критерия необходимо увеличивать объём выборки.

  1. Хи-квадрат критерий для проверки простых и сложных гипотез о виде закона распределения.

Критерием согласия называют критерий, который позволяет установить, является ли расхождение эмпирического и теоретического распределений случайным или значимым.

23. Общая схема метода наименьших квадратов (МНК). Перечисление задач, которые решаются методом МНК. Гипотезы о распределении ошибок, позволяющие использовать МНК при решении задач теории вероятностей и статистики.

Задачи, которые решаются методом МНК:

  1. Формальное решение переопределённой системы уравнений

  2. Статистическая интерпретация. Причина несовместности (отсутствия решений) системы – ошибки

а) Распределение ошибок неизвестно

б) Распределение ошибок нормально (линейная модель)

Из этого уравнения получим оценку theta. RSS – значение суммы квадратов (SS) в точке min.

24. Геометрическая интерпретация МНК. Задача определения оценки математического ожидания нормального распределения при неизвестной дисперсии и построения доверительного интервала, как простейший пример МНК.

25. Линейная регрессия как пример использования МНК. Формулы для оценки параметров, доверительные интервалы, проверка гипотез о параметрах.

26. Задача Стьюдента о сравнении средних в двух независимых выборках из нормальных распределений, как пример общей схемы проверки гипотез в рамках МНК.

27. Однофакторный дисперсионный анализ, как обобщение задачи Стьюдента о сравнении двух выборок. F отношение Фишера.

28. Проверка простых гипотез. Ошибки 1-го и 2-го рода. Лемма Неймана Пирсона.

О проверке простых гипотез и ошибках первого и второго рода подробно было написано в вопросе №21.

Лемма Неймана-Пирсона: среди всех критериев заданного уровня значимости alfa, проверяющих простую гипотезу Н0 против альтернативной гипотезы Н1, критерий отношения правдоподобия является наиболее мощным.

Простая гипотеза – такая гипотеза, которая однозначно определяет закон распределения ГС.