- •4.3. Регрессионный анализ
- •1.Статистические методы как элемент системы качества
- •1. 1. Место статистических методов в управлении качеством
- •1.2. Статистические методы в системах качества
- •1.3. Применение компьютерных технологий в статистических методах
- •2. Основы математической статистики
- •2.1. Описательная статистика
- •2.2. Оценивание параметров
- •2.3. Критерии значимости
- •3. Регрессионный анализ
- •3.1. Парная линейная регрессия
- •3.2. Парная нелинейная регрессия
- •4. Статистические методы
- •4.1. Методы описательной статистики
- •4.2. Проверка статистических гипотез
- •4.3. Регрессионный анализ
2.3. Критерии значимости
Проверка статистических гипотез
Критерии значимости предназначены для принятия решения при проверке статистических гипотез. Статистическими называются гипотезы о виде неизвестного распределения или о параметрах распределения, если его вид известен.
Проверяемая гипотеза называется нулевой. Альтернативная гипотеза Нх - это гипотеза, противоречащая нулевой.
При проверке гипотез возможны два типа ошибок. Ошибка, состоящая в том, что будет отвергнута правильная нулевая гипотеза, называется ошибкой первого рода; вероятность такой ошибки обозначается а и называется уровнем значимости: например, а = 0,05 означает, что в пяти случаях из ста мы рискуем отвергнуть правильную нулевую гипотезу. Ошибка второго рода состоит в том, что будет принята неправильная нулевая гипотеза; вероятность такой ошибки обозначается р. Вероятность отклонения неправильной нулевой гипотезы 1 — Р называется мощностью критерия.
Решение — принять или отвергнуть нулевую гипотезу — принимается на основе определенного критерия. При этом выбирается некоторая функция элементов выборки или статистика критерия Z = Z(x,, x2, ..., хп), распределение которой известно. Множество значений статистики Z, при которых принимается решение отклонить гипотезу Я0, называется критической областью. Положение критической области определяется видом альтернативной гипотезы и заданным уровнем значимости. Множество значений статистики Z, при которых нулевая гипотеза ^принимается, называется областью принятия решения.
В общем случае алгоритм проверки гипотезы с помощью критерия значимости таков:
• формулируется нулевая и альтернативная гипотезы,
• задается уровень значимости,
• выбирается статистика критерия для проверки сформулированной нулевой гипотезы,
• определяется выборочное распределение этой статистики,
• определяется положение критической области,
• вычисляется выборочное значение статистики критерия,
• принимается статистическое решение: если выборочное значение статистики критерия оказалось в области принятия решения, нулевая гипотеза принимается; в противном случае нулевая гипотеза отклоняется, как несогласующаяся с результатами наблюдений.
Критерии значимости при нормальном распределении
Рассмотрим некоторые стандартные критерии значимости. Предположим, что проверяется гипотеза о среднем значении нормально распределенной совокупности при известной дисперсии . Статистикой критерия может служить величина
, (2.12)
распределенная по стандартному нормальному закону. (Общее обозначение статистики критерия Z, но для конкретных распределений используются соответствующие обозначения).
Если же дисперсия неизвестна, то для проверки гипотезы используется статистика
(2.13)
имеющая распределение Стьюдента с (n-1) степенью свободы.
Критерии значимости при биномиальном распределении
Наиболее распространенной задачей проверки гипотез при биномиальном распределении, когда проводятся повторные независимые испытания, является сравнение вероятности успеха р с заданным значением р0, т.е. нулевая гипотеза имеет вид HQ:p = pQ.
Предположим, что в серии из п испытаний успех имел место т раз. Тогда при определенных условиях для проверки рассматриваемой нулевой гипотезы можно использовать статистику
(2.14)
имеющую стандартное нормальное распределение.
Критерии согласия
Рассмотренные критерии значимости используются для проверки гипотез о параметрах распределения. Другая группа критериев относится к проверке гипотез о виде распределения.
Проверяется нулевая гипотеза о том, что случайная величина X имеет заданную функцию распределения F{x). Выборка x1 х2, ..., хп разбивается на к интервалов. Пусть ni. — число элементов выборки, попавших в i-й интервал; i = 1, 2, ..., к. Используя предполагаемый закон распределения с учетом оценок параметров этого закона, найденных по выборке, можно найти вероятность р. попадания случайной величины Х в i-й интервал. Для проверки рассматриваемой гипотезы используется статистика
(2.15)
которая распределена по закону хи-квадрат с числом степеней свободы (к — l — 1), где l — число неизвестных параметров распределения, оцениваемых по выборке.