- •Лекция 1
- •1.1. Введение в теоретические основы исследования статистических выборок.
- •1.1. Введение в теоретическин основы исследования статистических выборок.
- •1.2. Подходы статистического оценивания
- •1.3. Свойства среднего
- •1.4. Комплекс задач проблемы оценивания параметров закона распределения.
- •Лекция 2
- •2.1. Статистическая устойчивость выборочных характеристик.
- •2.2. Статистические оценки и их свойства.
- •2.1. Статистическая устойчивость выборочных характеристик
- •2.2. Статистические оценки и их свойства
- •Лекция 3
- •3.2. Распределение t-Стьюдента
- •3.4. Пример определения эмпирической дисперсии
- •3.2. Распределение t- стьюдента
- •3.4. Пример определения эмпирической дисперсии
- •Из этих условий следует, что
- •Лекция 4
- •4.1. Метод моментов Пирсона.
- •4 .2. Метод наименьших квадратов.
- •4.3. Метод максимального правдоподобия.
- •4.1. Метод моментов пирсона
- •4.2. Метод наименьших квадратов
- •4.3.Метод максимального правдоподобия
- •Лекция 5
- •5.1. Точность и достоверность оценок параметров распределения.
- •5.2. Доверительные оценки параметров распределения.
- •5.1. Точность и достоверность оценок параметров распределения.
- •5.2. Доверительные оценки параметров распределения
- •Лекция 6
- •6.2. Гипотеза независимости и стационарности обрабатываемого ряда наблюдений.
- •6.3. Анализ резко выделяющихся наблюдений
- •6.4. Гипотеза о типе закона распределения случайной величины.
- •6.5. Гипотезу об однородности двух или нескольких выборок.
- •6.6. Гипотезы о числовых значениях параметров генеральной совокупности.
- •Лекция 7
- •7.1. Сравнение доли признака с нормативом.
- •7.2. Сравнение статистических частот, вычисленных по двум выборкам.
- •7.1. Сравнение доли признака с нормативом
- •7.2. Сравнение статистических частот, вычисленных по двум выборкам.
- •Лекция 8
- •8.1. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (выборки незпвисимы).
- •8.2. Сравнение двух средних, произвольно распределенных генеральных совокупностей (выборки большого объема и независимы).
- •8.3. Сравнение двых средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).
- •8.4. Сравнение выборочной средней с гипотетичесчкой генеральной средней нормальной совокупности.
Лекция 6
Вопросы лекции:
6.1. Основные понятия процесса проверки статистических гипотез.
6.2. Гипотеза независимости и стационарности обрабатываемого ряда наблюдений.
6.3. Анализ резко выделяющихся наблюдений.
6.4. Гипотеза о типе закона распределения случайной величины.
6.5. Гипотезы об однородности двух или нескольких выборок.
6.6. Гипотезы о числовых значениях параметров генеральной совокупности.
По своему прикладному содержанию, высказываемые в ходе статистической обработки данных гипотезы можно подразделить на несколько основных типов.
6.1. ОСНОВНЫЕ ПОНЯТИЯ ПРОЦЕССА ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Подлежащая проверке статистическая гипотеза называется основной, ее также называют нулевой гипотезой и обозначают через Но. Так, например, Но: Р < Ро, для приведенного выше примера (контроль за качеством продукции).
Различают простые и сложные гипотезы. Простая гипотеза относится к параметру и характеризует его однозначно. Например, простая гипотеза утверждает, что справедливо равенство неизвестного параметра заданной величине Но: Х = а. Сложная гипотеза имеет вид Но: X > а или Но: X < а,
т. е. она включает множество простых: H'o: х= а', Н'':х = а",... и т.д.
Каждой нулевой статистической гипотезе противопоставляют альтернативную или конкурирующую гипотезу, которую обозначают символом H1. Нулевая гипотеза может относится не только к одному, но и к нескольким параметрам, а также к закону распределения случайной величины. При проверке нулевой гипотезы выборочные данные могут противоречить Но, тогда она отклоняется. В противном случае нет оснований отвергнуть нулевую гипотезу.
Статистическая проверка гипотез, основанная на результатах выборки, связана с риском принять ложное решение. При этом возможны ошибки двух типов. Ошибка первого рода произойдет, если будет принято решение отклонить нулевую гипотезу, хотя в действительности она оказывается верной. Ошибка второго рода заключается в том, что Но принимается, в то время, когда верна альтернативная гипотеза.
Последствия указанных ошибок неравнозначны. Так, если в рассмотренном примере допущена ошибка первого рода, то бракуется годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, что последствия второй альтернативы более серьезны, чем для ошибки первого рода.
Правильное решение может быть принято в двух случаях: гипотеза принимается, причем и в действительности она правильная; гипотеза отклоняется, причем и в действительности она неверна.
Вероятность совершить ошибку первого рода принято обозначать через ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0.05 или 0.01. Если, например, принят уровень значимости, равный 0.05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвернуть правильную гипотезу).
Исключить ошибки первого и второго рода невозможно. Причем они являются конкурирующими и уменьшение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. Поэтому в каждом конкретном случае необходимо выбирать компромиссное решение. В большинстве случаев единственный путь одновременного уменьшения риска ошибок заключается в увеличении объема выборки.
Одну и ту же статистическую гипотезу можно исследовать с помощью различных случайных величин — критериев значимости. Критерий представляет собой статистику — закон распределения которой можно установить, а ее эмпирическое значение вычислить на основании выборки. Таким образом, статистика это некоторая случайная величина, закон распределения которой известен. Для проверки гипотезы стараются из всех возможных критериев выбрать тот, у которого при заданном уровне значимости меньше вероятность ошибки второго рода.
Выделим в множестве возможных значений критерия подмножество таких его значений 0, при которых гипотеза Но отклоняется. Подмножество 0 получило название критической области. Точки, разделяющие критическую область и область принятия гипотезы, называют критическими.
В основу определения критических точек положен принцип практической невозможности маловероятных событий. Зададим достаточно малую величину , называемую уровнем значимости критерия проверки, и определим критическую область 0 как множество значений , вероятность принадлежности которых к области 0 равнялась бы величине , т.е. Р{ 0 } = а.
Таким образом, событие, состоящее в том, что 0 имеет вероятность, равную , может рассматриваться как маловероятное событие с уровнем значимости . Если на основе выборки установлено, что 0, то это может служить основанием для отклонения гипотезы Но. Если 0, то можно заключить, что Но не противоречит исходным данным и нулевая гипотеза Но не отклоняется.
С уменьшением уровня значимости расширяется область допустимых значений критерия и вместе с тем теряется его чувствительность, так как повышается вероятность принять гипотезу даже в тех случаях, когда эта гипотеза неверна. Но вместе с тем выбор достаточно малого уровня значимости гарантирует от возможности неправильно забраковать верную гипотезу.
На практике приравнивают числам 0.05; 0.01. Как бы ни была мала величина , событие 0 есть только маловероятное, но не абсолютно невозможное событие. Поэтому не исключено, что при верной гипотезе Но может быть а выполнено условие 0. Отклоняя в этом случае Но мы допускаем ошибку первого рода, вероятность которой равна . С уменьшением сужается критическая область. Поэтому уменьшение влечет за собой увеличение вероятности принять неправильную гипотезу (обозначим эту вероятность ), т. е. совершить ошибку второго рода. В этом смысле ошибки первого и второго рода являются конкурирующими.
Допустим проверяется гипотеза о равенстве генеральной средней X некоторому числу а. Выберем для проверки гипотезы статистику 8.
Если
верна гипотеза Но:
x
= а, то Е|0| = а, т. е.
есть несмещенная оценка
параметра .
Допустим Но
проверяется против конкурирующей
гипотезы Н1:x<
a.
В результате случайного разброса
результатов выборки значения
будут
группироваться вокруг центра распределения.
Однако, если они окажутся значительно
меньше, чем ,
то предпочтительнее становится гипотеза
H1.
Поэтому критическая
область задается неравенством
<
кр
, т. е. в виде левосторонней. Зададим
значение параметра
и определим критическую точку
кр,
из уравнения Р{
<
кр}
= .
Аналогично определяется правосторонняя
критическая область,
если
Н1:x
> а, т.е. из уравнения Р{
>
кр}
= .
Следовательно, характер альтернативной
гипотезы определяет тип критической
области. Если гипотеза
Н1:xа,
то необходимо строить двухстороннюю
критическую область на основе решения
уравнения Р{
< 1}
+ Р{
> 2}
=
.
Двустороннюю критическую область
строят как симметричную, распределяя
значение
поровну
между концами
распределений.
Параметры
1,
2
определяются на основе решения уравнений
Р{
<
1,}
=
;
Р{
>
2}
=
Наиболее часто встречаются статистические гипотезы, связанные со сравнением различных выборок. Рассмотрим следующий пример. Изучаются два типа резцов, применяемых при обработке деталей на токарном станке. С помощью этих резцов получают некоторое число деталей. Диаметры этих деталей образуют две выборки, соответствующие каждому типу резца; дисперсии этих выборок несколько различаются. Такое различие может, конечно, оказаться результатом случайных причин, а может быть и следствием разницы качества резцов. Зная, что распределения результатов по каждому резцу являются нормальными, мы должны фактически проверить гипотезу, одинаковы ли генеральные дисперсии этих распределений. Если такая гипотеза будет отвергнута, то одному из резцов нужно будет отдать предпочтение.
Сравнение двух или нескольких выборок приходится проводить, сопоставляя различные методики анализа, различные условия производства и т.д. Весьма важно следить за неизменностью основных параметров системы при исследованиях, требующих достаточно длительного промежутка времени.
Существует общая схема решения данного класса задач. Допустим, установлены два значения 1, 2 некоторого выборочного параметра. Эти значения можно рассматривать как оценки генеральных параметров A1 , А2 . Высказывается нулевая гипотеза, что различие между 1 , 2 чисто случайное и что на самом деле A1 = А2, т.е. между генеральными параметрами нет различий. Для проверки гипотезы нужно выяснить, значимо ли расхождение между 1 и 2. С этой целью обычно исследуют случайную величину =1 - 2 и проверяют, значимо ли ее отличие от нуля. Иногда удобнее рассматривать величину 1 / 2 сравнивая ее с единицей. Отвергая нулевую гипотезу, мы тем самым принимаем альтернативную гипотезу A1 А2 , которая в свою очередь распадается на две: A1 > А2 и А1 < А2. Если одно из этих неравенств заведомо невозможно, то альтернативная гипотеза называется односторонней и для ее проверки применяются односторонние критерии.
Односторонний критерий значимости имеет намного меньшую вероятность ошибки второго рода, чем соответствующий двусторонний. Уже из этого видно, насколько полезно предварительно выяснить, какой из сравниваемых параметров A1 и А2 не может быть меньше другого. Односторонний характер альтернативной гипотезы зачастую вытекает из самой постановки задачи. Например, изучая эффективность некоторого усовершенствования производственного процесса, мы заранее можем считать, что это усовершенствование способно лишь уменьшить дисперсию процесса.
