Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Воронежский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

3267

.pdf

Скачиваний:

Добавлен:

15.11.2022

Размер:

3.84 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 1415 / 1915 16 17 18 19 > Следующая >>>

оцениваемый параметр с вероятностью 1-α или в 100(1-α)% случаев.

Часто применяют односторонние доверительные интервалы, границы которых определяются из условия

P(θ<θ2)=1-α или P(θ1<θ)=1-α.

Эти интервалы называются соответственно

левосторонними и правосторонними доверительными интервалами. Выбор доверительной вероятности определяется в каждом случае конкретными условиями. Обычно используемые значения 1-α равны 0,90; 0,95; 0,99. На практике часто рассматривают симметричные доверительные интервалы длиной 2δ. Соотношение (1) в этом случае записывается в виде

или P

1 .

(2)

Длина доверительного интервала играет важную роль: чем меньше длина доверительного интервала, тем точнее оценка. Если же длина доверительного интервала велика, то оценка малопригодна для практики.

Из соотношения (1) или (2) и из того, что θ1 и θ2 являются функциями выборки, следует, что длина доверительного интервала определяется двумя величинами: доверительной вероятностью 1-α и объемом п выборки.

Таким образом, величины δ, (1-α), п взаимосвязаны и, задавая определенные значения двум из них, можно определить значение третьей. Процедура нахождения границ доверительного интервала для параметра θ по заданной доверительной вероятности в простейшем случае состоит в следующем.

1. Из ГС с ФР F(x,θ) извлекается выборка объемом п. По этой выборке методом моментов или методом максимального

правдоподобия находится точечная оценка неизвестного параметра θ.

141

2.Составляется некоторая функция элементов выборки

-статистика Y( , ), связанная с параметром θ, такая, что ее

распределение не зависит от θ и других неизвестных параметров.

3.Задается доверительная вероятность (1-α).

4.Зная распределение статистики Y, определяют два числа у1 и y2, удовлетворяющих условию Р(y1<Y<y2)=1-α.

5.Границы доверительного интервала для параметра θ

определяются из решения относительно θ неравенства

y1<Y( , )<y2.

Используем указанную схему для нахождения доверительных интервалов параметров m и ζ нормального закона распределения.

17.2. Доверительный интервал для математического ожидания СВ X, распределенной по закону N(m, σ) при известном σ

Пусть CB X имеет нормальное распределение N(m,ζ). Требуется найти доверительный интервал для параметра m по результатам выборки x1,x2,...,xn объемом п при условии, что дисперсия ζ2 известна, а доверительная вероятность равна 1-α.

В качестве оценки параметра m возьмем выборочное

среднее x	1 n	xi . Рассмотрим выборку x1,x2,...,xn как

	n i
		1

реализацию случайного вектора (X1,..., Хп) с независимыми компонентами Xi, распределенными по нормальному закону

N(m,ζ). Тогда СВ	X	1 n	Xi , также распределена по

		n i
			1

нормальному закону с тем же МО и дисперсией D(X)=ζ2/n. В качестве статистики Y рассмотрим стандартизованную СВ

U X m , / n

142

имеющую cтандартизованное нормальное распределение
N(0,1), не зависящее от m и ζ. Из определения квантиля
порядка р распределения непрерывной СВ X имеем
			Up
P x	tp	p	или	f x dx		p .
построения доверительного интервала используется статистика
Отсюда
u p				-u p
f x dx	1	, и, так как		f x	dx		/ 2 , то
u p
up
f x dx	/ 2 1		1	/ 2	p 1		/ 2 .
			f (x)
		0.4
		0.3
			1	a
		0.2
		0.1
/ 2							/ 2
-2	-1			1			2
u p						u p
Таким образом, up		u1	/ 2 . Очевидно, что u / 2				u1	/ 2 .
Согласно п.4 схемы, приведенной выше,


P	U	u1 / 2 1	P	X m / n	u1 / 2 1 или

P X

/ n u1

/ 2 m X

/ n u1 / 2

;

/ 2

X m /

/ 2

e t

/ 2dt 2 / 2

e t

/ 2dt ,

/ 2

так что u1-α/2 (квантиль стандартизованного нормального распределения) определяется как решение уравнения

143

				u1	/ 2
u	/ 2	1	/ 2 2 / 2		e t2 / 2dt 1	.
1	/ 2

Зная величину u1-α/2 получаем доверительный интервал для МО

								(3)
X		/ n	u1 / 2 ; X	/	n u1	/ 2		(3)
	Для u1-α/2		имеется таблица
		1-α	0,90	0,95	0,99		0,997	0,999
		u1-α/2	1,64	1,96	2,58		3,00	3,37

Из анализа полученных соотношений можно сделать следующие выводы.

1.Увеличение объема п выборки приводит к уменьшению длины доверителъного интервала.

2.Увеличение доверительной вероятности (1-α) приводит к увеличению длины доверительного интервала, то есть к уменьшению точности δ.

3.Если задать точность δ, то есть предельную погрешность интервальной оценки, по формуле (2) и

доверительную вероятность 1-α, то из соотношения

.n u1 / 2 можно найти минимальный объем выборки, который обеспечивает заданную точность:

n	2 / u2	.
	1 / 2

17.3. Доверительный интервал для МО СВ X, распределенной

по нормальному закону при неизвестном σ

На практике более естественной является ситуация, когда оба параметра т и ζ нормального распределения неизвестны. В этом случае для

T	X	m		,


n 1	s0 /		n

144

			n	2 .
где	X - выборочное среднее, а s	1/ n 1	x x	2 .
	0		i
			i 1

В полных курсах математической статистики доказывается, что распределение СВ Тn-1, не зависит от параметров m и ζ нормального распределения, соответствующего выборке, и является распределением Стьюдента с п-1 степенями свободы.

Плотность вероятности распределения Стьюдента с п-1 степенями свободы имеет вид

n / 2

n 1

1 / 2

М(Х)=0, D X

Определим величину t1

/ 2,n 1

как решение уравнения

Tn 1

t1 / 2,n 1

/ 2,n 1

1 ,

s /

или вытекающего из него уравнения

/ 2,n 1

x dx

n 1

учитывая при этом Г(1/2)=

Г(п+1)=пГ(п)=n!

Для доверительного интервала получаем выражение

x s0 /

n t1

/ 2,n 1;

s0 /

t1 / 2,n 1 .

(4)

Для нахождения квантилей распределения Стьюдента tp имеется таблица. Приведем ее для двух значений доверительной вероятности.

1-α	5	10	20	30	∞
n	5	10	20	30	∞
n
0,95	2,571	2,228	2,086	2,042	1,960
0,99	4,032	3,169	2,845	2,750	2,576

		145

Отметим, что средняя длина доверительного интервала

(4) больше средней длины доверительного интервала (3). В остальном доверительный интервал (4) обладает теми же свойствами, что и интервал (3) для МО при известном ζ.

17.4. Доверительный интервал для σ2 СВ X, распределенной по нормальному закону

Пусть СВ X имеет нормальное распределение N(m,ζ), причем m и ζ неизвестны. Требуется найти доверительный интервал для параметра ζ2 по выборке х1х2,..,xn объемом п с доверительной вероятностью 1-α. В качестве точечных оценок для m и ζ2 возьмем несмещенные оценки

m x		1 n			x		для m и					2		s2		1		n			x		x 2 для ζ2.
m x					x		для m и							s2							x		x 2 для ζ2.
		n i 1			i									0		n	1 i 1				i
		n i 1														n	1 i 1
Для построения доверительного интервала для
используем следующую статистику:
					n 1						1		n						n			xi	x	2
													n	x x 2					n
2								s2																.
n	1					2		s2			2													.
n	1					2		0			2				i
													i 1						i	1
Ранее было показано, что она имеет распределение
квадрат с п-1 степенью свободы.
			f 2		x						1				xn / 2 1e		x / 2 , x 0 .

								2	n / 2			n / 2
				n					n / 2
				n
Тогда
					2					n	1 s2			2
		P			2							0		2							1		,
		P			/ 2,n 1							2		1		/ 2,n		1			1		,
					/ 2,n 1							2		1		/ 2,n		1
или
		P s2					n	1				2			s2	n	1				1		.
												2
							2									2
					0		2							0		2
							1	/ 2,n 1								/ 2,n		1

ζ2

n2 -

Получаем доверительный интервал

146

	n		1 s2			n 1 s2
				0	;	0	.
2					;	2	.
2						2
1			/ 2,n 1			/ 2,n 1
Для квантилей		2		имеются таблицы.
Для квантилей		p,n 1		имеются таблицы.
		p,n 1

Замечание. Так как при п→∞ распределение

2 n

приближается к нормальному, то при достаточно большом объеме выборки (п≥50) доверительный интервал можно найти по формуле

s0		s0	,

1 u1 / 2 / 2n	1 u1 / 2 / 2n

где u1-α/2 квантиль стандартизованного нормального распределения, соответствующая доверительной вероятности

1-α.

17.5. Сглаживание экспериментальных зависимостей.

Метод наименьших квадратов

Пусть величины X и Y связаны функциональной зависимостью вида Y=θ(Х), причем функция θ нам не известна, и ее требуется определить по результатам наблюдений. Предположим, что имеется возможность экспериментально измерить значение величины Y при различных заданных значениях xi величины X. Обозначая результат i-го измерения через у, можно записать:

yi	xi	i ,	(5)
где i - случайная ошибка измерения с М( i )=0, то есть			yi

является значением СВ.

Если нанести на график точки (xi,yi) и соединить их отрезками прямой, то вид ломаной будет отличаться от кривой у=θ(х) из-за наличия случайных погрешностей при определении ее ординат.

Возникает вопрос: как обработать опытные данные , чтобы наилучшим образом определить зависимость Y от Х?

147

		(xn , yn )

(x3 , y3 )

(x2 , y2 )

(x1 , y1 )

Эта задача называется задачей о сглаживании экспериментальных зависимостей. При полном отсутствии информации о характере функции θ(х) невозможно получить достаточно удовлетворительное ее приближение. Рассмотрим случай, когда заранее известно, что функция θ(х) принадлежит к некоторому классу функций, зависящему от одного или нескольких параметров, то есть

θ(х)=θ(х, θ1, θ2,…, θk). (6)

В этом случае отыскание наилучшей функции θ(х) сводится к задаче определения соответствующих параметров θ1, θ2,…, θk по экспериментальным данным. Для определения оценок неизвестных параметров в практике чаще всего применяется метод наименьших квадратов.

Условимся говорить, что неизвестные параметры θ1, θ2,…, θk функции θ(х)=θ(х, θ1, θ2,…, θk), задающей зависимость y=θ(х, θ1, θ2,…, θk) определены наилучшим образом в смысле метода наименьших квадратов, если минимальна величина

	n		2

2	yi	xi , 1, 2 ,... k	.	(7)

i 1

Для нахождения точки минимума величины δ2(θ1, θ2,…, θk) в обычных аналитических условиях нужно приравнять нулю ее частные производные по θ1, θ2,…, θk. При этом получаем

n		xi ,	1, 2 ,... k
yi	xi , 1, 2 ,... k			0 ,	(8)
yi	xi , 1, 2 ,... k			0 ,	(8)
i 1			j

148

где 1≤j≤k, то есть систему k уравнений с k неизвестными, решая которую, определяем искомые оценки параметров θ1,

θ2,…, θk.

Заметим, что система (8) содержит СB yi, поэтому ее решение 1, 2 ,... k также случайно. Величины j являются

оценками неизвестных параметров θj по результатам наблюдений.

В предположении, что величины уi, имеют одинаковые распределения, метод наименьших квадратов может быть применен для оценки неизвестных параметров распределения.

17.6. Линейная регрессия

Для примера рассмотрим оценку по методу наименьших квадратов параметров k и b линейной функции у=kx+b. Пусть из опыта известна совокупность значений (xi,уi,), i=1,2,…,п. Рассмотрим величину

kxi

b .

Дифференцируя δ2 по k и b, получаем следующую

систему:

kxi

b xi

kxi

Из второго уравнения находим

kx .

n i

n i 1

Подставляя найденное значение в первое уравнение, приходим к равенству

n	n
x y k x2		nx y kx 0 ,
i i	i
i 1	i 1
	149

откуда

xi yi

y xi

i 1

Если ввести обозначения

1 n

Kx, y

y xi

x и Sx

xi x

n i

n i 1

то коэффициент k запишется в виде k

Kx, y

S 2

Таким образом, поставленная задача решена и линейная функция


y	Kx, y	x y	Kx, y	x
y	S 2	x y	S 2	x
	S 2		S 2
	x		x

наилучшим образом среди всех линейных функций выражает зависимость у от х. Заметим, что величина

Kx, y n

yi y xi x

i 1

является эмпирическим центральным моментом второго порядка.

Ее применяют в качестве оценки ковариации СВ Х и Y.

18.ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

18.1.Статистическая гипотеза. Общий метод построения критериев. Ошибки первого и второго рода

Во многих случаях ФР ГС бывает заранее неизвестна, и возникает необходимость ее определения по эмпирическим данным. Нередко из некоторых дополнительных соображений могут быть сделаны предположения (гипотезы) о виде ФР.

150

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 1415 / 1915 16 17 18 19 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.11.20223.75 Mб153258.pdf
#
15.11.20223.82 Mб33263.pdf
#
15.11.20223.82 Mб13264.pdf
#
15.11.20223.83 Mб13265.pdf
#
15.11.20223.83 Mб23266.pdf
#
15.11.20223.84 Mб23267.pdf
#
15.11.20223.85 Mб03268.pdf
#
15.11.20223.86 Mб03269.pdf
#
15.11.20223.86 Mб13270.pdf
#
15.11.20223.87 Mб03271.pdf
#
15.11.20223.88 Mб13272.pdf