- •Проверка статистических гипотез
- •Статистические гипотезы
- •1. Простые и сложные гипотезы и их проверка
- •2. Критерий согласия Пирсона
- •Поведение , когда гипотезаверна.
- •Поведение , когда гипотезаневерна.
- •Критерий проверки.
- •Границы применимости критерия на практике.
- •3. Критерий согласия для сложных гипотез
- •4. О критериях согласия Колмогорова и Смирнова
- •5. Проверка нормальности при помощи вероятностной бумаги
- •Статистические критерии.
- •[Править] Уровень значимости и мощность.
- •[Править] Состоятельность и несмещенность критериев.
- •[Править] Некоторые типовые задачи прикладной статистики [править] Статистические данные и прикладная статистика
- •[Править] Статистический анализ точности и стабильности технологических процессов и качества продукции
- •[Править] Задачи одномерной статистики (статистики случайных величин)
- •[Править] Непараметрическое оценивание математического ожидания.
- •[Править] Непараметрическое оценивание функции распределения.
- •[Править] Таблица 1
- •[Править] Проблема исключения промахов.
- •[Править] Многомерный статистический анализ
- •[Править] Корреляция и регрессия.
- •[Править] Дисперсионный анализ.
- •[Править] Методы классификации.
- •[Править] Дискриминантный анализ.
- •[Править] Кластер-анализ.
- •[Править] Задачи группировки.
- •[Править] Снижение размерности.
- •[Править] Статистика случайных процессов и временных рядов
- •[Править] Статистика объектов нечисловой природы
- •Лабораторная работа №14. Изучение критериев Колмогорова и омега-квадрат
- •Лабораторная работа №15. Изучение критерия хи-квадрат Пирсона
5. Проверка нормальности при помощи вероятностной бумаги
Этот простой
графический метод часто используют для
первоначальной прикидки, правдоподобно
ли предположение о том, что независимая
выборка
взята
из нормального распределения. Эта
прикидка осуществляется в буквальном
смысле ``на глазок'', поэтому здесь не
идет речь о количественных показателях,
таких как вероятность ошибки и т.п.
Чтобы пояснить
идею этого метода, сформулируем
вспомогательное утверждение. Пусть
--
функция распределения закона
,
.
Лемма
1. Рассмотрим
отображение
,
действующее по формуле
![]()
где
обозначает
функцию, обратную к функции распределения
стандартного нормального закона
.
При этом отображении график
переходит
в прямую линию
,
а график
переходит
в прямую линию
.
Доказательство.
Достаточно заметить, что
.
См. по этому поводу также Упражнение3.6на стр.
.
![]()

Предположим, что
в нашей выборке
все
числа различны. Переупорядочим выборку
в порядке возрастания:
![]()
То, что получается после такого переупорядочения, называют вариационным рядом.
Из Определения 6.1легко вытекает, что в этом случае эмпирическая функция распределения может быть выражена формулой
|
|
(54) |
В частности,
.
С другой стороны,
теорема Гливенко утверждает, что при
большом объеме выборки эмпирическая
функция распределения близка к
теоретической функции распределения.
Принимая во внимание Лемму 9.1,
заключаем, что если выборка
действительно
взята из нормального распределения
,
то точки
|
|
(55) |
должны приблизительно
оказаться на одной прямой линии (а
именно, на прямой
).
Замечание 9.2
Мы намеренно не
включаем в перечень (55)
точку, соответствующую
,
так как
,
а отображение
в
точках вида
не
определено.
Таким образом, мы пришли к очень простому глазомерному способупроверки нормальности выборки: наносим на плоскость точки

и смотрим, лежат
ли они вблизи какой-либо прямой линии.
Если такую прямую можно провести, то по
ее чертежу можно грубо оценить значения
неизвестных параметров
и
.
Чтобы было удобнее
наносить эти точки, прибегают к так
называемой вероятностной бумаге.
Вероятностная бумага получается выбором
неравномерной шкалы координат вдоль
оси ординат. А именно, на расстоянии
от
оси абсцисс мы ставим пометку
для
новой неравномерной шкалы. На вероятностную
бумагу (в системе новых координат)
наносят точки![]()
.
Замечание 9.3
В силу того, что
данные наблюдений и измерений, как
правило, округлены до некоторого знака,
предположение о том, что все
различны,
нередко нарушается. Это приводит к тому,
что в вариационном ряду некоторые
соседние значения могут совпадать и
формула (54)
для выражения
через
вариационный ряд несколько видоизменяется.
Но, тем не менее, изложенный выше
глазомерныйметодопределения
нормальностиостается пригодным.
Замечание 9.4
Мы не используем
точку
,
тем самым теряя некоторую информацию,
содержащуюся в выборке. Имея в виду
приблизительность этого метода, можно
надеяться, что в случае больших выборок,
эта потеря не слишком существенна.
Отметим, однако, что существуют приемы,
позволяющие учитывать и значение
.
Нетрудно модифицировать этот метод для
проверки гипотез о выборках из
распределений, не являющих нормальными,
но зависящих от неизвестных параметров
сдвига-растяжения. Детали можно найти,
например, в [13,
§ 5.1] и [6,
§ 4].
Пример 9.1
Вернемся к нашему
числовому Примеру 6.4и зададимся вопросом, насколько в
Примере8.2было обоснованным предположение
о нормальности выборок
и
.
Для этого проведем их проверку на
нормальность при помощи вероятностной
бумаги.
Для выборки
,
соответствующей содержанию углерода
в пробах, чертеж представлен на рисунке3.
|
|
|
Рис. Данные о процентном содержании углерода в пробах |
Для выборки
,
содержащей значения прочности на разрыв,
чертеж представлен на рисунке4.
|
|
|
Рис. Данные о значениях прочности на разрыв |
Видно, что и в том,
и в другом случае точки располагаются
вблизи некоторой прямой линии. Таким
образом, имеются основания для гипотез
о нормальности выборок
и
.
Большое число естественно-научных примеров, при анализе которых используется вероятностная бумага, содержится во второй части книги [12].



