
- •Доверительный интервал для оценки ско σ нормального распределения. Распределение хи-квадрат.
- •Точечная и интервальная оценка вероятности биномиального распределения с заданной надежностью γ по относительной частоте.
- •Метод моментов для точечной оценки параметров распределения.
- •Метод наибольшего правдоподобия для дискретных и непрерывных случайных величин. Распределение Пуассона. Биномиальное распределение. Показательный закон. Нормальный закон.
- •Числовые характеристики вариационного ряда. Характеристики положения и характеристики рассеивания. Мода, Медиана. Размах варьирования. Коэффициент вариации. Асимметрия. Эксцесс.
- •14. Статистические моменты. Обычные, начальные и центральные эмрирические моменты. Условные эмпирические моменты. Нахождение центральных моментов по условным.
- •15. Метод произведений для вычисления выборочных средней и дисперсии. Сведение первоначальных вариант к равноотстоящим.
- •16. Эмпирические и выравнивающие частоты для дискретных и непрерывных распределений. Примеры.
- •17. Построение нормальной кривой по опытным данным. Оценка отклонения эмпирического распределения от нормального. Асимметрия. Эксцесс.
- •18. Построение статистической функцией распределения. Гистограмма.Назовите числовые характеристики статистического распределения. Дайте определение этих характеристик.
- •Точечная оценка параметра. Свойство точечной оценки. Состоятельная, несмещенная, эффективная оценка. Исправленная дисперсия.
- •Доверительный интервал и доверительная вероятность (надежность). Построение доверительного интервала для математического ожидания случайной величины, распределенной по нормальному закону.
- •§14. Точность оценки, доверительная вероятность (надежность). Доверительный интервал
- •§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
- •Понятие функциональной, статистической и корреляционной зависимости.
- •§ 2. Условные средние
- •§ 3. Выборочные уравнения регрессии
- •Сущность метода наибольшего правдоподобия для нахождения оценок параметров распределений.
- •Сущность метода наименьших квадратов при обработке результатов наблюдений.
- •Формулировка задачи статистической проверки гипотез. Приведите примеры задач на проверку гипотез. Вероятностные данные для применения метода минимума риска к решению задачи проверки гипотез.
- •3.1. Классический метод проверки гипотез
- •Сущность метода минимума риска при решении задачи проверки гипотез. Сформулируйте оптимальное решающее правило. Ошибки первого и второго рода. Сущность метода
- •§ 2. Ошибки первого и второго рода
- •28. Сравнение двух дисперсий нормальных генеральных совокупностей. Распределение Фишера-Снедекора.
- •29. Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсей нормальной совокупности. Критерий Стьюдента.
- •Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны. Выборки независимы. Функция Лапласа.
- •Сравнение двух вероятностей биномиальных распределений.
- •34. Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам одинакового объема. Критерий Кочрена.
- •35. Определение параметров выборочного уравнения прямой линии среднеквадратичной регрессии по несгрупированным и сгруппированным данным.
- •36. Выборочный коэффициент корреляции. Методика вычисления выборочного коэффициента корреляции. Выборочное корреляционное отношение и его свойство. Мера корреляционной связи.
- •42. Корреляционный анализ. Коррелированность и зависимость случайных величин. Численные характеристики системы двух случайных величин: корреляционный момент и коэффициент корреляции.
- •43. Регрессионный анализ. Линейная регрессия. Прямые линии среднеквадратической зависимости. Коэффициенты регрессии y на X и X на y.
- •[Править]Парная и множественная регрессия
- •Случайные числа. Генератор псевдослучайных чисел. Метод Монте-Карло. Применение метода Монте-Карло для вычисления определенного интеграла.
- •Случайные процессы. Процесс Пуассона и его свойства: стационарность, отсутствие последействия и ординарность.
- •48. Цепь Маркова. Переходная вероятность. Однородная цепь Маркова.Матрица перехода. Равенство Маркова.
- •Определение
- •[Править]Переходная матрица и однородные цепи
- •[Править]Конечномерные распределения и матрица перехода за n шагов
Сущность метода минимума риска при решении задачи проверки гипотез. Сформулируйте оптимальное решающее правило. Ошибки первого и второго рода. Сущность метода
Множество всех значений критерия разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается; другое – при которых она принимается.
Критической областью называется совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых значений) называется совокупность значений критерия, при которых нулевую гипотезу принимают.
Обозначим
критическую область
.
Если
вычисленное по выборке значение критерия
попадает в критическую область
,
то гипотеза
отвергается и принимается гипотеза
.
В этом случае можно совершить ошибку
первого рода, вероятность которой равна
.
Иначе, вероятность того, что критерий
примет значение из критической области
,
должна быть равна заданному значению
,
то есть
.
Критическая область определяется неоднозначно. Возможны три случая расположения . Они определяются видом нулевой и альтернативной гипотез и законом распределения критерия .
Правосторонняя
критическая область (рис.4 а) состоит из
интервала
,
где
определяется из условия
и называется правосторонней точкой,
отвечающей уровню значимости
.
Левосторонняя
критическая область (рис.4 б) состоит
из интервала
,
где
определяется из условия
и называется левосторонней точкой,
отвечающей уровню значимости
.
Двусторонняя
критическая область (рис.4 в) состоит из
следующих двух интервалов:
и
,
где точки
и
определяются из условий
и
и называются двусторонними критическими точками.
Рис.4
§ 2. Ошибки первого и второго рода
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Подчеркнем, что последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение, «продолжать строительство жилого дома», то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей. Можно привести примеры, когда ошибка первого рода влечет более тяжелые последствия, чем ошибка второго рода.
Замечание 1. Правильное решение может быть принято также в двух случаях:
1) гипотеза принимается, причем и в действительности она правильная;
2) гипотеза отвергается, причем и в действительности она неверна.
Замечание 2. Вероятность совершить ошибку первого рода принято обозначать через α; ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).
26. Идея применения критериев согласия при решении задачи о согласованности теоретического и статистического распределения. Статистический критерий проверки нулевой гипотезы. Критерий Фишера-Снедекора.
Идея применения критериев согласия заключается в следующем.
На
основании данного статистического
материала нам предстоит проверить
гипотезу
,
состоящую в том, что случайная
величина
подчиняется
некоторому определенному закону
распределения. Этот закон может быть
задан в той или иной форме: например, в
виде функции распределения
или
в виде плотности распределения
или
же в виде совокупности вероятностей
,
где
-
вероятность того, что величина
попадет
в пределы
-го
разряда.
Рис. 7.6.1
Так как из этих форм функция распределения является наиболее общей и определяет собой любую другую, будем формулировать гипотезу , как состоящую в том, что величина имеет функцию распределения .
Для
того чтобы принять или опровергнуть
гипотезу
,
рассмотрим некоторую величину
,
характеризующую степень расхождения
теоретического и статистического
распределений. Величина
может
быть выбрана различными способами;
например, в качестве
можно
взять сумму квадратов отклонений
теоретических вероятностей
от
соответствующих частот
или
же сумму тех же квадратов с некоторыми
коэффициентами («весами»), или же
максимальное отклонение статистической
функции распределения
от
теоретической
и
т. д. Допустим, что величина
выбрана
тем или иным способом. Очевидно, это
есть некоторая случайная величина.
Закон распределений этой случайной
величины зависит от закона распределения
случайной величины
,
над которой производились опыты, и от
числа опытов
.
Если гипотеза
верна,
то закон распределения величины
определяется
законом распределения величины
(функцией
)
и числом
.
Допустим,
что этот закон распределения нам
известен. В результате данной серии
опытов обнаружено, что выбранная нами
мера расхождения
приняла
некоторое значение
.
Спрашивается, можно ли объяснить это
случайными причинами или же это
расхождение слишком велико и указывает
на наличие существенной разницы между
теоретическим и статистическим
распределениями и, следовательно, на
непригодность гипотезы
?
Для ответа на этот вопрос предположим,
что гипотеза
верна,
и вычислим в этом предположении
вероятность того, что гипотеза
верна,
и вычислим в этом предположении
вероятность того, что за счет случайных
причин, связанных с недостаточным
объемом опытного материала, мера
расхождения
окажется
не меньше, чем наблюденное нами в опыте
значение
,
т. е. вычислим вероятность события:
.
Если эта вероятность весьма мала, то гипотезу следует отвергнуть как мало правдоподобную; если же эта вероятность значительна, следует признать, что экспериментальные данные не противоречат гипотезе .
Возникает вопрос о том, каким же способом следует выбирать меру расхождения ? Оказывается, что при некоторых способах ее выбора закон распределения величины обладает весьма простыми свойствами при достаточно большом практически не зависит от функции . Именно такими мерами расхождения и пользуются в математической статистике в качестве критериев согласия.
Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.
Нулевой (основной) называют выдвинутую гипотезу H0.
Конкурирующей (альтернативной) называют гипотезу Н1 которая противоречит нулевой.
Различают гипотезы, которые содержат одно и более одного предположений.
Простой называют гипотезу, содержащую только одно предположение.
Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
Статистическим критерием (или просто критерием) называют случайную величину K, которая служит для проверки гипотезы.
Критерий Фишера-Снедекора
По независимым выборкам, объемы которых n1, n2, извлеченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии s2х и s2у. Требуется сравнить эти дисперсии.
Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу H0: D(X)=D(Y) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе H1:D(X)>D(Y), надо вычислить наблюдаемое значение критерия(отношение большей исправленной дисперсии к меньшей) Fнабл=S2б/S2м и по таблице критических точек распределения Фишера—Снедекора, по заданному уровню значимости α и числам степеней свободы k1=n1—1, k2 = n2—1 найти критическую точку Fкр(α; k1; k2). Если Fнабл <Fкр— нет оснований отвергнуть нулевую гипотезу. Если Fнабл >Fкр—нулевую гипотезу отвергают.
Правило 2. При конкурирующей гипотезе H1:D(X)≠D(Y) критическую точку Fкр (а/2; k1; k2) ищут по уровню значимости а/2(вдвое меньшему заданного) и числам степеней свободы k1 и k2.
27. Понятие критической области, критические точки, область принятия гипотезы. Левосторонняя и двусторонняя критическая область. Методика отыскания правосторонней критической точки. Мощность критерия.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы(областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают.
Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают; если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают.
Критическими точками(границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.
Правосторонней называют критическую область, определяемую неравенством К > kкр, где kкр—положительное число.
Левосторонней называют критическую область, определяемую неравенством К < kкр, где kкр —отрицательное число.
Двусторонней называют критическую область, определяемую неравенством К<k1; К>k2, где k2>k1. В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами (в предположении, что kкр>0) К<—kкр; К > kкр
или равносильным неравенством |K|>kкр.
Для отыскания критической области задаются уровнем значимости α и ищут критические точки, исходя из следующих соотношений:
а) для правосторонней критической области Р{К>kкр)=α (kкр>0);
б) для левосторонней критической области Р{К<kкр)=α (kкр<0);
в) для двусторонней симметричной области Р(К>kкр)=α/2; Р(К<-kкр)=а/2 (kкр>0);
Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность
того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.