Белокопытов Стат. методы
.pdf
Взятый с положительным знаком квадратный корень из дисперсии называют средним квадратическим отклонением е:
|
|
|
|
|
|
|
|
|
n |
2 |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
x |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
n |
|
|
i |
|
|
|
k |
|
|
|
||
2 |
|
S/n 1 |
|
x2 |
|
i 1 |
|
|
|
x |
j |
x 2 f |
j . (1.5) |
||||
|
|
|
|
||||||||||||||
е |
е |
|
|
|
|
|
i |
|
n |
|
|
|
n 1 j 1 |
|
|||
|
|
|
|
n 1 i 1 |
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1.3. Нормальное распределение
При большом числе данных сужение интервалов в распределении влечет за собой постепенное приближение гистограммы к гладкой кривой. Если же число данных будет беспредельно большое, то гистограмма превратится в безукоризненную кривую. В этом случае кривая может рассматриваться в качестве распределения генеральной совокупности
(рис. 1.2).
Если кривая распределения имеет тенденцию в центре обнаруживать один пик, причем симметрично справа и слева от среднего арифметического она принимает форму колокола, то такую кривую называют нормаль-
ным распределением, или распределением Гаусса.
Закон, или функцию нормального распределения, выражают следующей формулой:
y |
f (x) |
|
1 |
|
1 |
x 2 |
|
|
|||
|
|
exp |
2 |
|
|
|
, |
(1.6) |
|||
|
2 |
|
|||||||||
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
где – среднее арифметическое генеральной совокупности; – среднее квадратическое отклонение.
Величины и называют параметрами распределения. Для удобства вычисления функции распределения y = f (x) случайные величины нормируют по формуле
x u .
10
Нормальное распределение с параметрами = 0 и =1 называется
нормированным нормальным распределением (рис. 1.3). Функция нормаль-
ного нормированного распределения примет вид
y f (u) |
1 |
|
|
1 |
u |
2 |
|
|
|
exp |
|
2 |
|
. |
(1.7) |
||
2 |
|
|||||||
|
|
|
|
|
|
|
Рис. 1.2. Нормальное распределение |
Рис. 1.3. Нормированное |
|
нормальное распределение |
При анализе качества продукции количество замеров не всегда бывает достаточным для определения законов распределения. Но если заранее известен закон распределения, то для нахождения важнейших числовых характеристик распределения нужно небольшое количество замеров. В том случае, когда закон распределения случайной величины близок к нормальному, для обработки результатов опытов необходимо
определение двух статистических оценок параметров распределения: х и e В связи с этим проверка нормальности распределения составляет
основное содержание предварительной обработки результатов эксперимента.
Некоторое представление о близости эмпирического распределения к нормальному дает анализ показателей асимметрии и эксцесса. Показатель асимметрии определяют по формуле
|
m3 |
, |
(1.8) |
3 |
|||
|
|
|
|
|
e |
|
|
11
где третий центральный момент
m |
1 |
x |
|
|
|
3 f |
|
, |
(1.9) |
|
j |
x |
j |
||||||||
|
||||||||||
3 |
n 1 |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|||
среднее квадратическое отклонение
e |
1 |
|
(x j x)2 f j . |
(1.10) |
|
n 1 |
|||||
|
|
|
|||
Показатель эксцесса вычисляют по формуле
|
Э |
m4 |
3 |
, |
|
|
(1.11) |
|||
|
4 |
|||||||||
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
e |
|
|
|
|
|
где четвертый центральный момент |
|
|
|
|
|
|
|
|
||
m4 |
|
1 |
|
|
x j |
|
|
4 f j . |
(1.12) |
|
|
|
x |
||||||||
|
n 1 |
|||||||||
|
|
|
|
|
|
|
|
|||
Для симметричных распределений m3 = 0, m4/ e4 = 3, следовательно,
А = 0 и Э = 0.
Несмещенные оценки для показателей асимметрии и эксцесса находят по следующим формулам:
* |
n n 1 |
, |
(1.13) |
|||
n 2 |
||||||
|
|
|
|
|||
Э* |
|
n 1 |
|
n 1 Э 6 . |
(1.14) |
|
n 2 n 3 |
||||||
|
|
|
||||
Для проверки гипотезы нормальности распределения следует также вычислить средние квадратические отклонения для показателей асимметрии и эксцесса:
|
6n n 1 |
|
n 2 n 1 n 3 , |
(1.15) |
12
Э |
24n n 1 2 |
|
|
|
|
. |
(1.16) |
||||
n 3 n 2 n 3 n 5 |
|||||||||||
Если выполняются условия |
|
* |
|
3 и |
|
Э* |
|
5 Э , то гипотезу нор- |
|||
|
|
|
|
||||||||
мальности исследуемого распределения принимают.
П р и м е р 1.1. Используя данные табл. 1.2, определите количественные характеристики распределения и проверьте гипотезу нормальности распределения.
Р е ш е н и е. По формулам (1.2), (1.4), (1.8), (1.11), (1.13) – (1.16) на-
ходим следующие значения:
|
|
|
1 |
101,8 1,02; е |
е2 |
|
1 |
14,69 |
0,38 ; |
|
х |
||||||||||
100 |
99 |
|||||||||
|
|
|
|
|
|
|
||||
1 0,134 0,02;
99 0,056
|
|
|
|
|
|
|
|
|
Э |
1 |
|
4,934 |
|
3 0,65 ; |
|
|
||||||||||||
|
|
|
|
|
99 |
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
0,021 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
* |
100 99 |
0,02 0,02 Э* |
|
99 |
|
101 0,65 6 0,62 |
; |
|||||||||||||||||||||
98 |
|
|
98 97 |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
А |
|
|
6 100 99 |
|
0,24; Э |
|
|
|
|
24 100 992 |
|
0,46 ; |
|
||||||||||||||
|
98 101 103 |
97 |
98 103 105 |
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
* |
|
|
|
0,02 |
|
3 0,72 ; |
|
Э* |
|
|
|
0,62 |
|
5 Э 2,3 , |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
следовательно, данное распределение можно отнести к нормальному.
С целью упрощения необходимые для расчета данные оформим в виде табл. 1.3.
13
Таблица 1.3
Расчетные значения для определения количественных характеристик распределения
№ |
Интервалы |
Середина |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
варьирова- |
интервала |
Частота fj |
f j x j |
хj |
x |
(хj |
x |
)2 |
(хj |
x |
)3 |
(хj |
x |
)4 |
f j (хj |
x |
)2 |
f j (хj |
x |
)3 |
f j (хj |
x |
)4 |
|
п/п |
ния |
xj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
0,1–0,3 |
0,2 |
2 |
0,4 |
–0,82 |
0,67 |
–0,55 |
0,45 |
1,34 |
|
|
–1,1 |
0,9 |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
2 |
0,3–0,5 |
0,4 |
8 |
3,2 |
–0,62 |
0,384 |
–0,238 |
0,148 |
3,073 |
|
–1,904 |
1,184 |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
3 |
0,5–0,7 |
0,6 |
13 |
7,8 |
–0,42 |
0,176 |
–0,074 |
0,031 |
2,288 |
|
–0,962 |
0,403 |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
4 |
0,7–0,9 |
0,8 |
15 |
12,0 |
–0,22 |
0,048 |
–0,011 |
0,002 |
0,72 |
|
|
–0,165 |
0,03 |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
5 |
0,9–1,1 |
1,0 |
20 |
20,0 |
–0,02 |
0 |
|
|
0 |
|
|
0 |
|
|
0,008 |
|
0 |
|
|
0 |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
6 |
1,1–1,3 |
1,2 |
17 |
20,4 |
0,18 |
0,032 |
0,006 |
0,001 |
0,544 |
|
0,102 |
|
0,017 |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
7 |
1,3–1,5 |
1,4 |
13 |
18,2 |
0,38 |
0,144 |
0,055 |
0,021 |
1,872 |
|
0,710 |
|
0,273 |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
8 |
1,5–1,7 |
1,6 |
9 |
14,4 |
0,58 |
0,336 |
0,195 |
0,113 |
3,024 |
|
1,755 |
|
1,017 |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
9 |
1,7–1,9 |
1,8 |
3 |
5,4 |
0,78 |
0,608 |
0,475 |
0,370 |
1,824 |
|
1,425 |
|
1,11 |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
100 |
101 |
|
|
|
|
|
|
|
|
|
|
|
14,692 |
–0,134 |
4,934 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
14
Рассмотренный выше способ проверки гипотезы нормальности распределения достаточно прост и удобен. Существуют и другие способы проверки, сведения о которых можно найти в специальной литературе.
Задание
Для определения варианта задания из табл. 1.1 выписывают все столбики и строки, за исключением тех столбиков и строк, порядковые номера которых совпадают, соответственно, с последней и предпоследней цифрами номера зачетной книжки.
Вопросы для самоконтроля
1.Приведите определение гистограммы.
2.В каких пределах обычно находится число измеряемых величин для построения гистограммы?
3.В каких случаях необходимо уточнение количества интервалов?
4.Что наносят по оси абсцисс и оси ординат при построении гистограммы?
5.Какую информацию можно получить в результате сравнения типичных гистограмм с гистограммами, полученными в ходе технологических процессов?
6.Выражением чего может служить выборочное среднее?
7.Что называют отклонением?
8.Что выражает сумма квадратов отклонения?
9.Мерой чего является дисперсия?
10.Что называется степенью свободы?
11.Назовите два основных признака нормального распределения.
12.В чем заключается нормирование нормального распределения?
13.Характеристикой какого свойства распределения служит показатель асимметрии?
14.Характеристикой какого свойства распределения служит показатель эксцесса?
15.В каком случае гипотеза нормальности исследуемого распределения может быть принята?
15
2.СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ
ИПРОВЕРКА КОЛИЧЕСТВЕННЫХ ОЦЕНОК
Выбор правильного решения из двух противоположных предположений о генеральной совокупности называется статистической проверкой.
Предположительная количественная оценка параметра генеральной совокупности называется статистическим оцениванием.
2.1. Проверка средних значений
Ситуация, когда среднее арифметическое совокупности и дисперсия генеральной совокупности 2 известны
В практической деятельности ситуация, когда и 2 генеральной совокупности уже известны, встречается редко. Однако такую ситуацию можно приближенно заменить ситуацией, при которой из многочисленных данных статистически управляемого технологического процесса можно определить среднее арифметическое и дисперсию. Ниже рассмотрим ситуацию, когда проверяют, действительно ли n-е количество данных, которые считаются взятыми из генеральной совокупности, имеющей нормальное распределение, взяты из этой генеральной совокупности.
Порядок проверки гипотез следующий:
1.Строят нулевую гипотезу (ее обозначают H0): H0: 1 = 2 (n-е количество данных взято из идентичной генеральной совокупности, имеющей нормальное распределение).
2.Выдвигают альтернативную гипотезу: Н1: 1 2 (n-е количество данных было взято не из идентичной генеральной совокупности).
3.Выбирают тип распределения, исходя из гипотезы 1, принимают
нормальное распределение N( 2).
4. Вычисляют статистическую оценку: |
|
||||
|
|
|
|
. |
|
U0 |
|
x |
(2.1) |
||
|
|
|
|||
|
/ n |
|
|||
5. Принимают решение о проведении двухсторонней либо односторонней проверки гипотез.
Разграниченные области 5 %, 1 %-го уровня значимости называют областями отклонения гипотезы (на рисунках в табл. 2.1 они заштрихованы).
16
Эти области отклонения иногда берут по обе стороны распределения, а иногда по одну сторону. Например, в отличие от нулевой гипотезы 1 = 2, если предположить, что альтернативная гипотеза будет 1 2, то область отклонения берут с двух сторон, если же предположить, что она 1 2 или1 2, то берут только с одной стороны. Такие проверки гипотез соответ-
ственно называют двухсторонней или односторонней проверкой.
Таблица 2.1
Распределение и уровень значимости
|
Распределение |
|
Уровень значимости α |
|
||
|
|
0,05 |
0,01 |
|||
Тип |
Вид |
Двухсто- |
Односто- |
Двухсто- |
Односто- |
|
ронняя |
ронняя |
ронняя |
ронняя |
|||
|
|
|||||
|
|
проверка |
проверка |
проверка |
проверка |
|
Нормаль- |
|
|
|
|
|
|
ное |
|
|
|
|
|
|
|
|
0,05 |
0,10 |
0,01 |
0,02 |
|
t-рас- |
|
|||||
|
|
|
|
|
||
пределе- |
|
|
|
|
|
|
ние |
|
|
|
|
|
|
|
|
|
|
|
|
|
F-рас- |
|
|
|
|
|
|
пределе- |
|
|
|
|
|
|
ние |
|
|
|
|
|
|
|
|
0,025 |
0,05 |
0,005 |
0,01 |
|
|
|
|
|
|
|
|
17
6. Принимают решение отклонить или принять нулевую гипотезу. После того, как в табл. 1 (см. прил.) будут найдены числовые значе-
ния величин U , соответствующие 5 или 1 %-му уровню значимости, их сравнивают со статистическими оценками, полученными в результате вычислений, и выносится решение:
Значение U0 и U |
Характер расхождений |
Тип принимаемой гипотезы |
|
|
|
U0 < U |
Не являются значимыми |
Нулевая |
U0,05 < U0 < U0,01 |
Являются значимыми |
|
U0,01 < U0 |
Имеют высокую степень |
Альтернативная |
|
значимости |
|
П р и м е р 2.1. Выход годной продукции в технологическом процессе составлял: среднее арифметическое = 85,5 %, среднее квадратическое отклонение = 4,5 %. После внесения в технологический процесс усовершенствований, собранные в течение четырех дней данные позволили получить х = 93,3 %.
Можно ли утверждать, что между первым и вторым случаем имеется существенное расхождение?
Р е ш е н и е
1.Н0: 1 = 2.
2.Н1: 1 2 (двухсторонняя оценка).
3.Среднее х при n = 4 подчиняется нормальному распределению.
4.По формуле (2.1)
U0 93,3 85,5 3,42 . 4,5/
4
5.При сравнении с 1 %-м уровнем значимости получится U0 = 3,42 >
>U0,01 = 2,58. Следовательно, расхождение имеет высокую степень значи-
мости. Значения U берут из табл. 1 (см. прил.).
Ситуация, когда известно только среднее арифметическое генеральной совокупности
Поскольку дисперсия генеральной совокупности 2 неизвестна, необходимо пользоваться ее предположительной оценкой, исходя из выбо-
рочных данных. А именно, осуществляют проверку над , используя |
е2 |
иосновываясь на t-распределении (Стьюдента):
1.Строят нулевую гипотезу:
Н0: 1 = 2.
18
2. Строят альтернативную гипотезу:
Н1: 1 2 (двухсторонняя проверка),
1 2 или 1 2 (односторонняя проверка).
3.Выбирают распределение для проверки статистических оценок.
Поскольку неизвестно, проводят проверку, используя е и основываясь на t-распределении.
4.Вычисляют статистические оценки:
|
|
|
|
. |
|
t0 |
|
x |
(2.2) |
||
|
|
|
|||
|
e / n |
|
|||
5. Сравнивая значение из таблицы t-распределения (для соответствующей степени свободы Ф = n – 1 и уровня значимости ) и значение t0, принимают решение.
Если t0 > tФ; 0,05 , то различие имеет место, поскольку уровень значимости 5 %.
Если t0 tФ; 0,01, то имеет место существенное различие, поскольку уровень значимости 1 %.
П р и м е р 2.2. До настоящего времени выход годной продукции в технологическом процессе в среднем составлял 85,5 %. После того, как технологический процесс был усовершенствован, данные, собранные за 10-дневный срок, позволили получить следующие цифровые значения:
|
Дни |
1 |
|
2 |
|
|
|
3 |
|
4 |
5 |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
хi,,% |
90,0 |
|
93,0 |
|
|
92,5 |
|
94,1 |
89,5 |
||||
|
xi2 |
8100,0 |
|
8649,0 |
|
|
8556,2 |
|
8854,8 |
8010,2 |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Дни |
|
6 |
7 |
|
8 |
|
9 |
|
10 |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
хi,% |
|
90,3 |
91,2 |
|
92,4 |
|
94,0 |
|
92,6 |
|
919,6 |
||
|
xi2 |
|
8154,0 |
8317,4 |
|
8537,7 |
|
8836,0 |
8574,7 |
|
84590,3 |
|||
Можно ли утверждать, что выход годной продукции существенно увеличился?
Ре ш е н и е
1.Н0: 1 = 2.
2.Н1: 1 2 (односторонняя проверка).
3.Определяют среднее арифметическое выборки х.
19
