- •Проверка статистических гипотез
- •Статистические гипотезы
- •1. Простые и сложные гипотезы и их проверка
- •2. Критерий согласия Пирсона
- •Поведение , когда гипотезаверна.
- •Поведение , когда гипотезаневерна.
- •Критерий проверки.
- •Границы применимости критерия на практике.
- •3. Критерий согласия для сложных гипотез
- •4. О критериях согласия Колмогорова и Смирнова
- •5. Проверка нормальности при помощи вероятностной бумаги
- •Статистические критерии.
- •[Править] Уровень значимости и мощность.
- •[Править] Состоятельность и несмещенность критериев.
- •[Править] Некоторые типовые задачи прикладной статистики [править] Статистические данные и прикладная статистика
- •[Править] Статистический анализ точности и стабильности технологических процессов и качества продукции
- •[Править] Задачи одномерной статистики (статистики случайных величин)
- •[Править] Непараметрическое оценивание математического ожидания.
- •[Править] Непараметрическое оценивание функции распределения.
- •[Править] Таблица 1
- •[Править] Проблема исключения промахов.
- •[Править] Многомерный статистический анализ
- •[Править] Корреляция и регрессия.
- •[Править] Дисперсионный анализ.
- •[Править] Методы классификации.
- •[Править] Дискриминантный анализ.
- •[Править] Кластер-анализ.
- •[Править] Задачи группировки.
- •[Править] Снижение размерности.
- •[Править] Статистика случайных процессов и временных рядов
- •[Править] Статистика объектов нечисловой природы
- •Лабораторная работа №14. Изучение критериев Колмогорова и омега-квадрат
- •Лабораторная работа №15. Изучение критерия хи-квадрат Пирсона
5. Проверка нормальности при помощи вероятностной бумаги
Этот простой графический метод часто используют для первоначальной прикидки, правдоподобно ли предположение о том, что независимая выборка взята из нормального распределения. Эта прикидка осуществляется в буквальном смысле ``на глазок'', поэтому здесь не идет речь о количественных показателях, таких как вероятность ошибки и т.п.
Чтобы пояснить идею этого метода, сформулируем вспомогательное утверждение. Пусть -- функция распределения закона,.
Лемма 1. Рассмотрим отображение , действующее по формуле
где обозначает функцию, обратную к функции распределения стандартного нормального закона. При этом отображении графикпереходит в прямую линию, а графикпереходит в прямую линию.
Доказательство. Достаточно заметить, что. См. по этому поводу также Упражнение3.6на стр..
Предположим, что в нашей выборке все числа различны. Переупорядочим выборку в порядке возрастания:
То, что получается после такого переупорядочения, называют вариационным рядом.
Из Определения 6.1легко вытекает, что в этом случае эмпирическая функция распределения может быть выражена формулой
(54) |
В частности, .
С другой стороны, теорема Гливенко утверждает, что при большом объеме выборки эмпирическая функция распределения близка к теоретической функции распределения. Принимая во внимание Лемму 9.1, заключаем, что если выборкадействительно взята из нормального распределения, то точки
(55) |
должны приблизительно оказаться на одной прямой линии (а именно, на прямой ).
Замечание 9.2
Мы намеренно не включаем в перечень (55) точку, соответствующую, так как, а отображениев точках видане определено.
Таким образом, мы пришли к очень простому глазомерному способупроверки нормальности выборки: наносим на плоскость точки
и смотрим, лежат ли они вблизи какой-либо прямой линии. Если такую прямую можно провести, то по ее чертежу можно грубо оценить значения неизвестных параметров и.
Чтобы было удобнее наносить эти точки, прибегают к так называемой вероятностной бумаге. Вероятностная бумага получается выбором неравномерной шкалы координат вдоль оси ординат. А именно, на расстоянииот оси абсцисс мы ставим пометкудля новой неравномерной шкалы. На вероятностную бумагу (в системе новых координат) наносят точки.
Замечание 9.3
В силу того, что данные наблюдений и измерений, как правило, округлены до некоторого знака, предположение о том, что все различны, нередко нарушается. Это приводит к тому, что в вариационном ряду некоторые соседние значения могут совпадать и формула (54) для выражениячерез вариационный ряд несколько видоизменяется. Но, тем не менее, изложенный выше глазомерныйметодопределения нормальностиостается пригодным.
Замечание 9.4
Мы не используем точку , тем самым теряя некоторую информацию, содержащуюся в выборке. Имея в виду приблизительность этого метода, можно надеяться, что в случае больших выборок, эта потеря не слишком существенна. Отметим, однако, что существуют приемы, позволяющие учитывать и значение. Нетрудно модифицировать этот метод для проверки гипотез о выборках из распределений, не являющих нормальными, но зависящих от неизвестных параметров сдвига-растяжения. Детали можно найти, например, в [13, § 5.1] и [6, § 4].
Пример 9.1
Вернемся к нашему числовому Примеру 6.4и зададимся вопросом, насколько в Примере8.2было обоснованным предположение о нормальности выбороки. Для этого проведем их проверку на нормальность при помощи вероятностной бумаги.
Для выборки , соответствующей содержанию углерода в пробах, чертеж представлен на рисунке3.
Рис. Данные о процентном содержании углерода в пробах |
Для выборки , содержащей значения прочности на разрыв, чертеж представлен на рисунке4.
Рис. Данные о значениях прочности на разрыв |
Видно, что и в том, и в другом случае точки располагаются вблизи некоторой прямой линии. Таким образом, имеются основания для гипотез о нормальности выборок и.
Большое число естественно-научных примеров, при анализе которых используется вероятностная бумага, содержится во второй части книги [12].