- •Элементарные и сложные случайные события и операции над ними. Свойства операций.
- •Классическое определение вероятности события: конечное число равновозможных элементарных исходов.
- •Общее определение вероятности события (понятие о вероятностном пространстве).
- •Условная вероятность. Зависимые и независимые события.
- •Числовые характеристики одномерных случайных величин: начальные и центральные моменты, квантили. Математическое ожидание, дисперсия, медиана, квартили.
- •Биномиальное распределение.
- •Пуассоновское распределение.
- •Локальная и интегральная формула Муавра-Лапласа - аппроксимация биномиального и пуассоновского распределения с помощью нормального.
- •Поэтому вероятность того, что св отклонится от своего математического ожидания больше, чем на 3sigma, ничтожно мала (правило трёх сигм):
- •Оценка вероятности по частоте появления события. Интервал рассеяния и доверительный интервал. Планирование объема выборки для оценки вероятности при заданных значениях точности и надежности.
- •12. Нормальное (гауссовское) распределение. Кривая Гаусса, функция Лапласа.
- •Функция распределения и плотность вероятности для системы двух и более случайных величин. Безусловные и условные функции распределения, вектор математических ожиданий и матрица ковариаций.
- •Примеры построения оценок и доверительных интервалов для параметров распределений – биномиального, пуассоновского, нормального, равномерного, экспоненциального.
- •Проверка простых и сложных статистических гипотез: критическая область, p-value, односторонние и двухсторонние критерии, ошибки 1-ого и 2-ого рода, мощность критерия, множественные сравнения.
- •29. Проверка простой гипотезы для двух нормальных распределений с одинаковыми дисперсиями. Необходимый объем выборки для заданных ошибок 1-го и 2-го рода.
- •30. Линейный дискриминант Фишера – как пример проверки простой гипотезы для двух нормальных распределений с одинаковыми ковариационными матрицами.
- •31. Метод последовательного анализа Вальда, используемый для проверки простых гипотез. Преимущества и недостатки последовательной схемы в сравнении с обычным методом.
Примеры построения оценок и доверительных интервалов для параметров распределений – биномиального, пуассоновского, нормального, равномерного, экспоненциального.
Построение оценок для пуассоновского, экспоненциального и равномерного распределений мы разобрали в предыдущем вопросе.
Проверка простых и сложных статистических гипотез: критическая область, p-value, односторонние и двухсторонние критерии, ошибки 1-ого и 2-ого рода, мощность критерия, множественные сравнения.
Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины, в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице.
Нулевая гипотеза – гипотеза об отсутствии различий, взаимосвязи. Она обозначается как Н0. Нулевая гипотеза – то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.
Альтернативная гипотеза – гипотеза о значимости различии или наличия взаимосвязи. Обозначается как Н1. Альтернативная гипотеза – то, что мы хотим доказать, поэтому иногда её называют экспериментальной гипотезой.
Статистическим критерием называется СВ, которая используется с целью проверки нулевой гипотезы.
После выбора критерия множество его возможных значений разбивают на две непересекающихся подмножества: критическую область и область принятия гипотезы.
Критическая область – совокупность значений критерия, при которых нулевая гипотеза отвергается.
Область принятия – совокупность значений критерия, при которых нулевую гипотезу принимают.
Критическая область и область принятия нулевой гипотезы являются интервалами, их разделяют критические точки.
Односторонний критерий – проверка нулевой гипотезы, когда альтернативная гипотеза выражена направленно.
Двусторонний критерий – проверка нулевой гипотезы, когда альтернативная выражена ненаправленно.
Ошибка первого рода – отклонили Н0, когда она была верна. Последствия: получили ложно статистически значимый вывод (увидели различия там, где их нет). alfa (уровень значимости) – максимальная вероятность допустить ошибку первого рода. Шанс допустить ошибку 1-го рода никогда не превысит выбранного уровня значимости, скажем α = 0,05. Нулевую гипотезу отвергают только тогда, когда p<0,05. Если обнаружено, что p>0,05, то нулевую гипотезу не отвергнут и, следовательно, не допустят ошибки 1-го рода.
Ошибка второго рода (beta) – не отклонили Н0, хотя она была не верна. Последствия: не получили статистического вывода (не заметили различия там, где они есть).
Р-value – минимальный уровень значимости, при котором нулевая гипотеза отвергается. Чем меньше p-value, тем большее право имеем на отклонение Н0.
Уровень значимости мы задаём сами.
Мощностью критерия называется вероятность отклонения гипотезы Н0, когда она ложна (вероятность не допустить ошибку второго рода; различия были и мы их заметили). Её обозначают 1-beta (beta – вероятность ошибки второго рода). Чем больше мощность критерия, тем меньше вероятность совершить ошибку второго рода.
Для увеличения мощности критерия необходимо увеличивать объём выборки.
Хи-квадрат критерий для проверки простых и сложных гипотез о виде закона распределения.
Критерием согласия называют критерий, который позволяет установить, является ли расхождение эмпирического и теоретического распределений случайным или значимым.
23. Общая схема метода наименьших квадратов (МНК). Перечисление задач, которые решаются методом МНК. Гипотезы о распределении ошибок, позволяющие использовать МНК при решении задач теории вероятностей и статистики.
Задачи, которые решаются методом МНК:
Формальное решение переопределённой системы уравнений
Статистическая интерпретация. Причина несовместности (отсутствия решений) системы – ошибки
а) Распределение ошибок неизвестно
б) Распределение ошибок нормально (линейная модель)
Из этого уравнения получим оценку theta. RSS – значение суммы квадратов (SS) в точке min.
24. Геометрическая интерпретация МНК. Задача определения оценки математического ожидания нормального распределения при неизвестной дисперсии и построения доверительного интервала, как простейший пример МНК.
25. Линейная регрессия как пример использования МНК. Формулы для оценки параметров, доверительные интервалы, проверка гипотез о параметрах.
26. Задача Стьюдента о сравнении средних в двух независимых выборках из нормальных распределений, как пример общей схемы проверки гипотез в рамках МНК.
27. Однофакторный дисперсионный анализ, как обобщение задачи Стьюдента о сравнении двух выборок. F отношение Фишера.
28. Проверка простых гипотез. Ошибки 1-го и 2-го рода. Лемма Неймана Пирсона.
О проверке простых гипотез и ошибках первого и второго рода подробно было написано в вопросе №21.
Лемма Неймана-Пирсона: среди всех критериев заданного уровня значимости alfa, проверяющих простую гипотезу Н0 против альтернативной гипотезы Н1, критерий отношения правдоподобия является наиболее мощным.
Простая гипотеза – такая гипотеза, которая однозначно определяет закон распределения ГС.