- •Томашевский а.В., Рысиков в.П. Учебное пособие компьютерные технологии статистической обработки данных
- •Введение
- •1.Краткая характеристика основных пакетов статистической обработки
- •1.1. Общие представления
- •1.2. Ввод данных в пакете statistica
- •1.3.Контрольные вопросы и задания
- •1.3.1.Вопросы
- •1.3.2. Задания
- •2. Начальная статистическая обработка данных
- •2.1. Понятие о генеральной совокупности и выборке
- •2.2. Случайные величины и их характеристики
- •2.3. Распределения случайных величин
- •2.4. Компьютерные технологии начальной статистической обработки
- •2.5. Контрольные вопросы и задания
- •2.5.1.Вопросы
- •2.5.2. Задание
- •3. Проверка статистических гипотез
- •3.1. Основные положения
- •3.2. Проверка гипотезы о законе распределения
- •3.3. Проверка гипотез о равенстве дисперсий и математических ожиданий
- •3.4. Компьютерные технологии проверки статистических гипотез
- •3.5. Контрольные вопросы и задания
- •3.5.1.Вопросы
- •3.5.2. Задания
- •4. Корреляционный анализ
- •4.1. Основные положения
- •4.2. Корреляционное поле
- •4.3. Выборочный коэффициент корреляции.
- •4.4. Корреляционное отношение
- •4.5. Частные коэффициенты корреляции.
- •4.6. Ранговая корреляция.
- •4.7. Компьютерные технологии корреляционного анализа
- •4.8. Контрольные вопросы и задания
- •4.8.1.Вопросы
- •4.8.2. Задания
- •5. Регрессионный анализ
- •5.1. Основные положения
- •5.2. Компьютерные технологии регрессионного анализа
- •5.3. Контрольные вопросы и задания
- •5.3.1.Вопросы
- •5.3.2. Задания
- •6. Дисперсионный анализ
- •6.1. Основные положения
- •6.2. Однофакторный дисперсионный анализ
- •6.3 Двухфакторный дисперсионный анализ
- •6.5. Контрольные вопросы и задания
- •6.5.1.Вопросы
- •5.3.2. Задания
- •7. Планирование эксперимента
- •7.1. Основные положения
- •7.2. Полный факторный эксперимент
- •7.3 Центральное композиционное планирование
- •7.5. Контрольные вопросы и задания
- •7.5.1.Вопросы
- •7.5.2. Задания
- •Приложение статистические таблицы Функция стандартного нормального распределения
- •Критические точки распределения Стьюдента
- •Критические точки распределения 2
- •Рекомендована література
3. Проверка статистических гипотез
3.1. Основные положения
При проведении статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых предположительных утверждений (гипотез), например:
можно ли считать, что конструктивная доработка или технологическое усовершенствование действительно улучшило качество изделий;
подчиняется ли полученная выборка нормальному или какому-либо другому закону распределения;
можно ли считать две или более взятых выборок принадлежащих одной генеральной совокупности;
является ли технологический процесс налаженным или разлаженным.
какова величина неизвестных параметров, определяющих состояние стохастической системы и т.д.
Для проверки сделанных предположений выдвигаются статистические гипотезы. Отличие статистической гипотезы от просто гипотезы в том, что статистическая гипотеза выдвигается относительно вида распределения или параметров известного распределения случайной величины.
Процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой х1, х2, ..., xn осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.
Результат такого сопоставления может быть как отрицательным (данные наблюдения противоречат выдвинутой гипотезе, следовательно, от нее надо отказаться), так и положительным (наблюдения не противоречат высказанной гипотезе, и поэтому ее можно принять в качестве одного из решений). Принятая гипотеза будет рассматриваться как достаточно правдоподобное, не противоречащее опыту утверждение.
Статистические критерии проверки гипотез разнообразны, но есть единая последовательность действий построения критерия, которая укладывается в 5 шагов [1].
1-й шаг. Выдвигается основная (или проверяемая) гипотеза Н0. Гипотеза Н1, которая противоречит основной Н0, называется альтернативной, или конкурирующей.
2-й шаг. Задается уровень значимости критерия . Любое статистическое решение, принимаемое на основе ограниченного ряда наблюдений, сопровождается, хоть и малой, вероятностью ошибочного заключения. Именно в доле случаев гипотеза Н0 может быть отвергнута, при условии, что она верна, или, наоборот, в доле случаев мы можем принять гипотезу Н0, в то время как она ошибочна. При фиксированном объеме выборки n величину вероятности или мы можем выбирать самостоятельно. Если есть возможность сколь угодно увеличивать n, то теоретически можно добиться каких угодно малых ошибок и при любой фиксированной конкурирующей гипотезе Н1.
Величину называют уровнем значимости, размером критерия или ошибкой первого рода. Это вероятность отвергнуть основную гипотезу Н0 при условии, что она верна.
Чем весомее для исследователя потери от ошибочного отвержения гипотезы Н0, тем меньшее необходимо выбирать. Обычно пользуются стандартными значениями (0.1; 0.05; 0.025; 0.01; 0.005; 0.001).
3-й шаг. Задается некоторая функция результатов наблюдения – критическая статистика
Yкр.= Y( х1, х2, ..., хn).
Как функция результатов наблюдений эта критическая статистика также является случайной величиной и в предположении справедливости Н0 подчинена некоторому хорошо изученному закону распределения с известной функцией плотности вероятности W(Yкр).
4-й шаг. Из
статистических таблиц распределения
W(Yкр).
находятся квантили уровня
/2 и 1-/2 или процентные
точки
(1-/2)100%
и
(/2)100%,
являющиеся соответственно нижней
кр.н
и верхней
кр.в
критическими точками (границами).
Они делят всю область допустимых значений
кр
на области:
неправдоподобно малых (I);
правдоподобных (II);
неправдоподобно больших (III).
Области
принятия и отвержения гипотезы Н0.
Область принятия гипотезы Н0 определяется как доверительный интервал для кр, который формируется на основе распределения статистики W(Yкр). при уровне доверительной вероятности р = 1 - . Различают односторонние и двухсторонние критерии. Для одностороннего критерия область принятия основной гипотезы может иметь ограничение только с одной стороны (сверху или снизу). При этом область значений статистики кр разбивается на две: область правдоподобных и область неправдоподобно больших или неправдоподобно малых значений. Для двухстороннего критерия область принятия гипотезы Н0 имеет два ограничения – сверху и снизу.
5-й шаг. Определяется наблюденное (расчетное) значение критической статистики Yрасч подстановкой в Yкр конкретных выборочных значений х1, х2, ..., хn или некоторых функций от них. Если окажется, что Yрасч принадлежит области правдоподобных значений, то гипотеза Н0 верна, т.е. не противоречит выборочным данным. В противном случае Н0 отвергается с ошибкой первого рода . Отвержение Н0 означает, что расч не подчиняется закону распределения W(Yкр). Ошибка может возникнуть тогда, когда принимается Н0, в то время когда она неверна. называется ошибкой второго рода, а (1-) – мощностью критерия.
Можно сказать, что статистическим критерием называют случайную величину с определенной функцией плотности вероятности, которая служит для проверки гипотез. Если проверяемая гипотеза Н0 сводится к проверке точного равенства, то гипотеза называется простой, в других случаях мы имеем дело со сложной или вложенной гипотезой
Наиболее часто при статистическом анализе проверяются гипотезы с использованием следующих критериев:
c2-критерий Пирсона, l-критерий Колмогорова и nw2-критерий Мизеса-Смирнова для проверки гипотезы о законе производственного распределения;
t-критерий Стьюдента для проверки гипотез о однородности средних двух выборок;
F-критерий Фишера для проверки гипотез о однородности дисперсий двух выборок;
G-критерий Кохрана и критерий Барлетта для проверки гипотез о однородности нескольких дисперсий;
непараметрический критерий Манна-Уитни для проверки гипотезы о том, что выборки взяты из одной совокупности с определенным произвольным законом распределения.
Рассмотрим перечисленные статистические критерии.
