Раздел 2
Задача 1
Пусть Х – процентное содержание марганца в руде.
Выборка из генеральной совокупности содержит n=100 элементов, представлена в виде интервального вариационного ряда.
wi = ni/n – относительная частота.
wi* - накопленная относительная частота. [3]
h – длина интервала, h = 0,4.
№ |
Интервал |
Частота ni |
wi |
wi* |
1 |
[0,78; 1,18] |
12 |
0,12 |
0,12 |
2 |
(1,18;1,58] |
18 |
0,18 |
0,3 |
3 |
(1,58;1,98] |
26 |
0,26 |
0,56 |
4 |
(1,98;2,38] |
15 |
0,15 |
0,71 |
5 |
(2,38;2,78] |
11 |
0,11 |
0,82 |
6 |
(2,78;3,18] |
8 |
0,08 |
0,9 |
7 |
(3,18;3,58] |
2 |
0,02 |
0,92 |
8 |
(3,58;3,98] |
5 |
0,05 |
0,97 |
9 |
(3,98;4,38] |
3 |
0,03 |
1 |
Построим гистограмму относительных частот.
Исходя из формы гистограммы, можно выдвинуть предположение о нормальном распределении случайной величины.
Н0: случайная величина Х распределена по нормальному закону.
Н1: распределение случайной величины Х не является нормальным.
Значения выборочной функции распределения на концах интервалов:
; ; ; ; ; ; ; ;; .
Значения теоретической функции распределения найдем, воспользовавшись ее выражением через интегральную функцию Лапласа:
, где (значения Ф(x) [4]).
Параметры распределения имеют следующие значения:
; .
xi |
||||
0,78 |
-1,57 |
-0,4418 |
0,0582 |
0 |
1,18 |
-1,08 |
-0,3599 |
0,1401 |
0,12 |
1,58 |
-0,59 |
-0,2224 |
0,276 |
0,3 |
1,98 |
-0,1 |
-0,0098 |
0,402 |
0,56 |
2,38 |
0,39 |
0,1517 |
0,6517 |
0,71 |
2,78 |
0,88 |
0,3106 |
0,8106 |
0,82 |
3,18 |
1,38 |
0,4162 |
0,9162 |
0,90 |
3,58 |
1,87 |
0,4693 |
0,9693 |
0,92 |
3,98 |
2,36 |
0,4909 |
0,9909 |
0,97 |
4,38 |
2,85 |
0,4978 |
0,9978 |
1 |
На одной координатной плоскости построим графики теоретической и выборочной функций распределения.
Из рисунка явственно видно, что наибольшая разница между значениями теоретической и выборочной функций распределения наблюдается в точке с абсциссой х = 1,98:
.
Выбрав уровень значимости , находим критическое значение критерия .
.
Гипотеза Н0 не подтверждается. Распределение случайной величины отличается от нормального
Ошибка 1-ого рода: P (отвергаем H1| H1) = P(ρ ≤ α H1) = 0,05 => 5%
Ошибка 2-ого рода α = 0,05, тогда β ≈ 0,05*4 ≈ 0,2 = 20%
Как было показано выше, расчетное значение величины D обычно определяется путем построения на одном чертеже графиков функций F(x) и F*(x). Для решения технических задач этот метод часто оказывается неудобным. В подобных ситуациях рекомендуется применять некоторые более простые приближенные расчеты. Рассмотрим применение подобного расчета по критерию Колмогорова на следующем примере.
Задача 2
Металлургический завод в течение шести месяцев выплавляет легированную сталь определенной марки. Для исследования содержания никеля в стали произведен анализ 100 наудачу выбранных плавок. Результаты анализов, показывающие процент содержания никеля в каждой плавке, представлены интервальным вариационным рядом.
№ |
Интервал |
Середина интервала xi |
Частота ni |
wi=ni/n |
1 |
[3,93; 4] |
3,965 |
3 |
0,03 |
2 |
(4; 4,07] |
4,035 |
10 |
0,1 |
3 |
(4,07;4,14] |
4,105 |
13 |
0,13 |
4 |
(4,14;4,21] |
4,175 |
29 |
0,29 |
5 |
(4,21;4,28] |
4,245 |
24 |
0,24 |
6 |
(4,28;4,35] |
4,315 |
10 |
0,1 |
7 |
(4,35;4,42] |
4,335 |
5 |
0,05 |
8 |
(4,42;4,49] |
4,455 |
4 |
0,04 |
9 |
(4,49;4,56] |
4,525 |
2 |
0,02 |
Х – процент содержания никеля в стали.
Известны значения точечных оценок математического ожидания и среднего квадратического отклонения случайной величины Х:
; .
Н0: случайная величина Х распределена по нормальному закону.
Н1: распределение случайной величины Х не является нормальным.
Составим выборочную функцию распределения заданной случайной величины. Для этого вычислим накопленные относительные частоты.
№ |
Частота ni |
wi=ni/n |
Накопленные отн. частоты wi* |
1 |
3 |
0,03 |
0,03 |
2 |
10 |
0,1 |
0,13 |
3 |
13 |
0,13 |
0,26 |
4 |
29 |
0,29 |
0,55 |
5 |
24 |
0,24 |
0,79 |
6 |
10 |
0,1 |
0,89 |
7 |
5 |
0,05 |
0,94 |
8 |
4 |
0,04 |
0,98 |
9 |
2 |
0,02 |
1 |
Значения выборочной функции распределения на концах интервалов:
; ; ; ; ; ; ; ; ; .
Определим значения теоретической функции распределения. Для этого вычислим вероятности попадания Х в заданные интервалы.
,
где
, [4] - интегральная функция Муавра-Лапласа.
В нашем случае
; .
№ |
хi |
xi+1 |
zi |
zi+1 |
Ф(zi) |
Ф(zi+1) |
рi |
рi* |
1 |
3,93 |
4 |
-2,331 |
-1,75 |
-0,4904 |
-0,4599 |
0,0305 |
0,0305 |
2 |
4 |
4,07 |
-1,75 |
-1,167 |
-0,4599 |
-0,379 |
0,0809 |
0,1114 |
3 |
4,07 |
4,14 |
-1,167 |
-0,583 |
-0,379 |
-0,219 |
0,16 |
0,2714 |
4 |
4,14 |
4,21 |
-0,583 |
0 |
-0,219 |
0 |
0,219 |
0,4904 |
5 |
4,21 |
4,28 |
0 |
0,583 |
0 |
0,219 |
0,219 |
0,7094 |
6 |
4,28 |
4,35 |
0,583 |
0,219 |
0,379 |
0,3849 |
0,16 |
0,8694 |
7 |
4,35 |
4,42 |
1,167 |
0,379 |
0,4599 |
0,4803 |
0,0809 |
0,9503 |
8 |
4,42 |
4,49 |
1,75 |
0,4599 |
0,4904 |
0,4981 |
0,0305 |
0,9808 |
9 |
4,49 |
4,56 |
2,333 |
2,917 |
0,4904 |
0,4982 |
0,0078 |
0,9886 |
Значение теоретической функции распределения на i-том интервале определяется следующим образом: .
Для проверки истинности выдвинутой гипотезы по критерию согласия А.Н. Колмогорова определим максимальную величину модуля разности значений теоретической и выборочной функций распределения на одном интервале.
№ |
хi |
xi+1 |
F*(x) |
F(x) |
|
1 |
3,93 |
4 |
0,03 |
0,0305 |
0,0005 |
2 |
4 |
4,07 |
0,13 |
0,1114 |
0,0186 |
3 |
4,07 |
4,14 |
0,26 |
0,2714 |
0,0114 |
4 |
4,14 |
4,21 |
0,55 |
0,4904 |
0,0596 |
5 |
4,21 |
4,28 |
0,79 |
0,7094 |
0,0806 |
6 |
4,28 |
4,35 |
0,89 |
0,8694 |
0,0206 |
7 |
4,35 |
4,42 |
0,94 |
0,9503 |
0,0103 |
8 |
4,42 |
4,49 |
0,98 |
0,9808 |
0,0008 |
9 |
4,49 |
4,56 |
1 |
0,9886 |
0,0114 |
Выбрав уровень значимости , находим критическое значение критерия .
ыф
.
Таким образом, приходим к выводу, что гипотеза Н0 о нормальном распределении случайной величины принимается.
Ошибка 1-ого рода: P (отвергаем H0| H0) = P(ρ ≤ α H0) = 0,04 => 4%
Ошибка 2-ого рода α = 0,04, тогда β ≈ 0,04*4 ≈ 0,16 = 16%
Задача 3
Из генеральной совокупности извлечена выборка, в которую включены 10 элементов:
xi |
2 |
4 |
6 |
8 |
10 |
12 |
Частота ni |
1 |
2 |
3 |
1 |
1 |
2 |
Выдвигаем гипотезу о равномерном распределении случайной величины Х на интервале (2;12).
Н0: случайная величина Х распределена равномерно на интервале (2;12).
Н1: распределение случайной величины Х не является равномерным.
Для равномерного распределения функция распределения имеет вид:
Для данных выборки определим значения как экспериментальной, так и гипотетической функции распределения.
№ |
xi |
Частота ni |
wi=ni/n |
Накопленная отн. частота wi* |
1 |
2 |
1 |
0,1 |
0,1 |
2 |
4 |
2 |
0,2 |
0,3 |
3 |
6 |
3 |
0,3 |
0,6 |
4 |
8 |
1 |
0,1 |
0,7 |
5 |
10 |
1 |
0,1 |
0,8 |
6 |
12 |
2 |
0,2 |
1 |
∑ |
42 |
10 |
1 |
3,5 |
Выборочная функция распределения имеет вид:
Определим максимальную величину модуля разности значений теоретической и выборочной функций распределения. результаты вычислений оформим в виде таблицы.
№ |
xi |
F*(xi) |
F(xi) |
|
1 |
2 |
0 |
0 |
0 |
2 |
4 |
0,1 |
0,2 |
0,1 |
3 |
6 |
0,3 |
0,4 |
0,1 |
4 |
8 |
0,6 |
0,6 |
0 |
5 |
10 |
0,7 |
0,8 |
0,1 |
6 |
12 |
0,8 |
1 |
0,2 |
Выбрав уровень значимости , находим критическое значение критерия .
;
.
Таким образом, приходим к выводу, что гипотеза Н0 о равномерном распределении случайной величины принимается.
Ошибка 1-ого рода: P (отвергаем H0| H0) = P(ρ ≤ α H0) = 0,01 => 1%
Ошибка 2-ого рода α = 0,01, тогда β ≈ 0,01*4 ≈ 0,04 = 4%
Задача 4
Выборка из 50 элементов представлена интервальным и дискретным вариационными рядами.
№ |
границы интервала |
середина интервала хi1 |
частота интервала ni |
относительная частота wi |
1 |
0,01 – 0,136 |
0,073 |
21 |
0,42 |
2 |
0,136 – 0,262 |
0,199 |
15 |
0,3 |
3 |
0,262 – 0,388 |
0,325 |
9 |
0,18 |
4 |
0,388 – 0,514 |
0,451 |
2 |
0,04 |
5 |
0,514 – 0,64 |
0,577 |
1 |
0,02 |
6 |
0,64 – 0,766 |
0,703 |
0 |
0 |
7 |
0,766 – 0,892 |
0,829 |
2 |
0,04 |
|
Σ |
|
50 |
1 |
По ряду признаков можно выдвинуть предположение о том, что выборка имеет гамма распределение с параметром γ = 2.
Н0: выборка имеет гамма распределение.
Н1: выборка распределена по иному закону, то есть не имеет гамма распределение.
Для гамма распределения М(х) = γ/λ = 2/λ, D(х) = γ/(λ2) = 2/(λ2). [5]
В нашем случае известны значения:
;
.
,
Исправленная дисперсия:
.
Плотность гамма распределения имеет вид:
.
В нашем случае
Поскольку Г(n) = (n-1)!, Г(2) = (2-1)! =1. Определим λ:
; .
Окончательно получаем:
.
Тогда
хi, хi+1 - границы интервалов.
xi |
xi+1 |
Частота ni |
Вероятность попадания в интервал pi |
Накопленные вероятности |
0,01 |
0,136 |
21 |
0,363 |
0,363 |
0,136 |
0,262 |
15 |
0,341 |
0,704 |
0,262 |
0,388 |
10 |
0,171 |
0,875 |
0,388 |
0,514 |
1 |
0,074 |
0,949 |
0,514 |
0,64 |
1 |
0,033 |
0,982 |
0,64 |
0,766 |
0 |
0,008 |
0,99 |
0,766 |
0,892 |
2 |
0,004 |
0,994 |
Σ |
|
50 |
|
|
;
;
;
;
;
;
.
Накопленные вероятности дадут приближенные значения теоретической функции распределения F(x).
; ; ; ; ; ; ; .
Для определения значений выборочной функции распределения F*(x) суммируем значения относительных частот, то есть вычисляем накопленные относительные частоты wi*.
№ |
границы интервала |
середина интервала хi1 |
относительная частота wi |
wi* |
1 |
0,01 – 0,136 |
0,073 |
0,42 |
0,42 |
2 |
0,136 – 0,262 |
0,199 |
0,3 |
0,72 |
3 |
0,262 – 0,388 |
0,325 |
0,18 |
0,9 |
4 |
0,388 – 0,514 |
0,451 |
0,04 |
0,94 |
5 |
0,514 – 0,64 |
0,577 |
0,02 |
0,96 |
6 |
0,64 – 0,766 |
0,703 |
0 |
0,96 |
7 |
0,766 – 0,892 |
0,829 |
0,04 |
1 |
|
Σ |
|
1 |
|
Таким образом, получаем:
; ; ;; ; ; ; .
№ |
хi |
xi+1 |
F*(x) |
F(x) |
|
1 |
0,01 |
0,136 |
0,42 |
0,363 |
0,057 |
2 |
0,136 |
0,262 |
0,72 |
0,704 |
0,016 |
3 |
0,262 |
0,388 |
0,9 |
0,875 |
0,025 |
4 |
0,388 |
0,514 |
0,94 |
0,949 |
0,009 |
5 |
0,514 |
0,64 |
0,96 |
0,982 |
0,022 |
6 |
0,64 |
0,766 |
0,96 |
0,99 |
0,03 |
7 |
0,766 |
0,892 |
1 |
0,994 |
0,006 |
Как графически, так и аналитически, отчетливо видно, что .
Выбрав уровень значимости , находим критическое значение критерия .
.
Таким образом, приходим к выводу, что гипотеза Н0 о гамма распределении случайной величины принимается.
Заметим, что критерий Колмогорова достаточно часто применяется на практике из-за кажущейся простоты расчетов и наглядности. Наряду с указанными преимуществами данный критерий обладает существенным недостатком. Его применение рекомендуется в случае, если теоретическая функция распределения задана полностью. Если известен только вид теоретической функции распределения, а ее параметры заменяются точечными оценками, полученными в результате обработки эмпирических данных, резко возрастает вероятность допущения ошибки второго рода. При применении не менее распространенного критерия Пирсона, использование выборочных оценок компенсируется путем уменьшения числа степеней свободы. В критерии Колмогорова подобные поправки отсутствуют, из-за чего происходит увеличение значения Р(λ) и увеличение критического значения λ. Применение критерия Пирсона, в ходе решения задачи № 4, приводит к выводу о том, что гипотеза Н0 отвергается:
xi |
xi+1 |
Частота ni |
pi |
ni’ |
ni – ni’ |
|
0,01 |
0,136 |
21 |
0,363 |
18,15 |
2,85 |
0,448 |
0,136 |
0,262 |
15 |
0,341 |
17,05 |
-2,05 |
0.246 |
0,262 |
0,388 |
10 |
0,171 |
8,55 |
1,45 |
0,246 |
0,388 |
0,514 |
1 |
0,074 |
3,7 |
-2,7 |
1,97 |
0,514 |
0,64 |
1 |
0,033 |
1,65 |
-0,65 |
0,256 |
0,64 |
0,766 |
0 |
0,008 |
0,4 |
- 0,4 |
0,4 |
0,766 |
0,892 |
2 |
0,004 |
0,2 |
1,8 |
16,2 |
Σ |
|
50 |
|
|
|
χ2расч.= 19,766 |
Число степеней свободы .
При и k = 5 определяем критическое значение χ2 = 11,1.
Поскольку χ2расч. > χ2 , гипотеза о том, что выборка имеет гамма-распределение, не подтверждается.
Таким образом, при реализации критерия Колмогорова в задании №4 мы сталкиваемся с ошибкой второго рода: гипотеза Н0 принимается, несмотря на то, что не соответствует действительности.
Ошибка 1-ого рода: P (отвергаем H1| H1) = P(ρ ≤ α H1) = 0,05 => 5%
Ошибка 2-ого рода α = 0,05, тогда β ≈ 0,05*4 ≈ 0,2 = 20%