Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория вероятности.docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
218.49 Кб
Скачать

Лекция 11. Выборка

Пусть треб-ся изучить совок-ть однородных объектов отн-но некоторого качест-го или колич-го признака, харак-щего эти объекты.

Для изучен. некоторого признака совок-ти обьектов примен-т 2 вида обслед-ний:

1. Сплошное- изуч-ся все обьекты совок-ти. и 2. Выборочное (выборный метод)- изуч-ся часть обьекта совок-ти, а выводы распростр-ся на всю совок-ть обьектов.

Опр1. Генеральной совокупностью назыв. совок-ть всех однород-х обьектов, подлежащих изучению.

Замечание!!!Часто под генер-ной совок-тью поним-т иследованую СВ.

Опр2. Выборочной совокупностью или выборкой назыв. совок-ть обьектов, случайно отобраных из генер-ной совок-ти.

Опр3. Обьектом совок-ти(генер-ной или выборочной)назыв. число ее обьектов.

Типы выборок.

1. Повторная - отобраный обьект возвращается.

2. Безповторная - отобрн. обьект не возвращается.

Опр4. Выборка назыв. репрезентативной ( представленной), если она достаточно хорошо воспроизводит генер-ную совок-ть.

Опр5. Различные значения признака (СВ Х) назыв. вариантами и обознач. -х, а последовательтность вариант, записаных в возраст-м порядке назыв. вариантционным рядом.

Пусть выборка объема n содержит k различ. знач. ( вариант): х1, х2,...,хk.

Причем знач. х1 повторяется в выборке n1 раз, х2-n2,....xk-nk раз.

Опр6. Число Ni появлений значения Xi в выборке назыв. частотой значения Хi, а отнош. Wi=Ni/N - относительной частной этого значения.

Опр7. Статистич. распределением (или статис-м рядом) выборки назыв. табл., в верх. строке которой указано значен. выборки, а в нижней соответствующие им частоты или относит-ые частоты.

Аналог в теории вер-ти - ряд распределения.

Опр8. Полигоном относительных частот выборки назыв. ломанная в верш. в точках(Xi;Wi). Аналог в теории – многоуг. распределения.

Опр9. Групированым статис-м рядом выборки назыв. табл., в верх строке которой указаны интер-лы(либо их границы), а в нижней - соответ-щие им относительн. частоты.

Замечание! В качестве относит-ной частоты, соответ-щей итервалу, принимаюит сумму относит-х частот тех значений выборки, которые попали в этот интервал. Обычно интервалы берут одинаковой длины.

Замечание! Группир. ряд используется в тех случаях, когда число различных элементов выборки, т.е. число вариантов достаточно велико.

Опр10. Гистограммой назыв. графическое изображ. группир-го статистического ряда выборки.

Замечание!Для построения гистограммы по оси Ох откладыв. интервалы группир-го ряда и строят на каждом интервале как на основании прямоугольник, высотой Wi

Опр11. Эмпирическая функция распределения назыв. функцию F*(x), определенную формулой F*(x)=Exi<x Wi, где суммируются относительные частоты Wi тех значений Xi из выборки, которые меньше х.

Замечание. При большем обьеме выборки эмпирич-кая функция распредел. F*(x) будет близкой к неизвестной теоретической функции распределения F(x) наблюдаемой СВ Х.

Опр12. Выборочной средней –х назыв. среднее арифметическое значение выборки. -х=1/n ( явл-ся оценкой для матем-го ожидания СВ Х)

Замечание! Если выборка представ-на статистич рядом то: -x=1/n*

Опр13. Выборочной дисперсией D* (или S2) назыв среднее арифмит-кое квадратов отклонения значений выборки от выборочной средней

D*=1/n (явл-ся оценкой для дисперсии СВ Х)

Замечание. Если выборка представлена статистич-м рядом, то:

D*=1/n* -(-x)2

Опр14. Выборочным СКО назыв. квадр. Корень из выбор-ной дисперсии:

.

Лекция 13. Статистические гипотезы.

Опр.1. Статистич гипотезой наз-ся любое предположение о виде или параметрах неизв закона распред-я Н,Н01

Различают простую и сложную гипотезу. Простая гипотеза в отличие от сложной полностью опред теоретич ф-ю распред-я СВ.

Опр.2 Проверяемую гипотезу наз нулевой и обозн Н0. Конкурирующей(альтерн) наз гипотезу Н1,которая противоречит нулевой.

Проверка гипотезы. Гипотезу проверяют на основании выборки, сделанной из генер сов-ти. Из-за случайности выборки в рез-те проверки могут возникать ошибки и приниматься неправильные решения. Возможны ошибки 2х видов: 1)ошибка I рода (отвергнута гипотеза Н0,в то время, когда она верна 2)II рода (принята гипотеза Н0,в то время, когда она неверна.

(ТАБЛ)

Опр.3. Правило,по *ому гипотеза Но отвергается или приним наз-ся статическим критерием или критерием.

Обозн. α-вер-ть ошибки Iрода,β-вер-ть ошибки IIрода.

Опр.4.Вер-ть α наз-ся уровнем значимости критерия.Вер-ть 1-β наз-ся мощностью критерия.

В основе любого стат критерия лежит использ-е спец подобранные ф-и выборки,наз статистикой. Õn= Õn(Х1,Х2…Xn)

Когда статистика выбрана,мн-во ее возможных зн-й разбивают на 2 непересек подмн-ва:

1)Обл-ть принятия гипотезы (допустимая обл-ть)-подмн-во знач-й статистики,при *ых гипотеза Но приним-ся.

2)Критическая обл-ть (W)-подмн-во знач-й статистики,при *ых гипотеза Но отвергается.

Осн. принцип проверки стат гипотез. Если наблюдаемое зн-е статистики Õn принадл критич обл-ти,то гипотезу отвергают. Если оно принадл обл-ти принятия гипотезы,то гип приним.

Виды критич обл-тей. В зав-ти от вида альтерн гипотезы выбирают правостор,левостор,двустор. критич обл-ть. При этом границы критическаих областей Qкр, при заданном уровне значимости α, опред из соотношения.

1)Для правостор критич обл-ти P{Õnкр}=α 2)Для левостор критич обл-ти P{Õnкр}=α 3)Для двустор критич обл-ти P{Õnкр1}=P{Õnкр2}= α/2

Проверка гипотезы по зн-ю неизв параметра норм распред-я

Гипотеза о среднем. Пусть СВ Х распред по норм закону с пар-рами μ,σ.

Х Е N(μ,σ),где μ неизв. Требуется при уровне значимости α проверить гипотезу Но={μ=μ0(число)}. Предполож,что σ известно, тогда в кач-ве статистики критерия использ СВ. Z=(0)*√n/σ Е N(0,1). При этом

1)если Н1={ μ< μ0}то использ левостор W,*ая удовл условию P{Z<-zα}=α, (гр)

где zα нах-ся из ур-я Ф(zα)=1-α,где Ф(x)-ФР нормир норм распред-я

2) если Н1={ μ>μ0},то использ правостор W,*ая удовл условию P{Z>zα}=α, (гр)

где zα нах-ся из ур-я Ф(zα)=1-α

3)если Н1={ μ≠μ0},то использ двустор W,*ая удовл условию P{!Z!>zα}=α, где zα нах-ся из ур-я Ф(zα)=1-α/2 Зам.Если σ неизв,то в кач-ве статистики использ СВ t=( - μ0)√n /S,*ая имеет распред-е Стьюдента с числом степеней свободы n-1,где n-объем выборки. При этом критич обл-ти опред так же,как и при известном σ,но вместо табл норм распред-я исп-ся табл распред Стьюдента.

Гипотеза о дисперсии. Пусть СВ Х распред по норм закону с парам μ и σ., т.е. Х Е N(μ,σ),где σ неизв. Нужно при уровне значимости α проверить гипотезу Но={σ220(число)}. Тогда в кач-ве статистики критерия использ СВ

χ2=(n-1)S2/σ20. Для опред W использ таблицы χ2-распред-я (р. Пирсона), при это

1.если H1={δ 2 2 0} , то исп левостор критическая область, а критич значение X£ определяется по табл из условия P{ χ2 >X£}= 1 -£

2если H1={ δ 2 2 0} то исп правостор критическая область, а критич значение X£ определяется по табл из условия P{ χ2 >X£}= £

3если H1={ δ 2 δ2 0} то исп духсторонняя критическая область, а критич значение X£ ‘ и X£ “ определяется по табл из условия P{ χ2 >X£ }= £/2

P{ χ2 >X£ ‘}= 1 - £/2

Лекция 12. Оценка паарметров распределения.

Пусть требуется изучит колич-ный признак Х генеральной совок-ти ( СВ Х) допустим, что из теорит-х соображений нам удалось установить сам вид з-на распред-ния ( нормальный , показательный и т.д.), но остается неизвестным один или несколько параметров распр-ния, например это параметр Y в распределении Пуассона. Таким образом для окончательного установления з-на распределения нам необходимо "Оценить", т.е. " Приближенно определить значение параметра распр-ния по некоторой выборке х1,х2,...,хn/

Замечание! Элементы выборки х1,х2,,..,,хn можно рассматривать как частные значения n независимых СВ Х 1,Х2,..,Хn каждое из которых имеет точно такой же з-н распределения, как и сам признак Х. Это объясняется тем, что различные серии опытов выборки будут различными.

Обознач. неизвестные параметры ч\з Q.

Опр1. Оценкой Qn или Tn параметра Q назыв. любая функция от рез-тов наблюдения над СВ Х, т.е. (X1,X2,…,Xn).

Замечание. Поскольку X1,X2,…,Xn СВ, то и оценка -Qn в отличие от оцениваемого параметра Q является СВ.

Опр2. Оценка -Qn параметра Q назыв. несмещенной, если ее МО равно оцениваему параметру, т.е. M(Qn)=Q. В противном случае оценка назыв. смещенной.

Замечание. Требование несмещенности гарантирует отсутствие систематич. ошибок при оценивании.

явл-ся несмещ. оценкой для

Примеры несмещенных оценок:

Опр3. Оценкой Qn параметра Q наз. состоятельной, если она удовлетворяет закону больших чисел, т.е.

для люб. >0

Опр4. оценка -Qn параметра Q назыв. эффективной, если при заданном объеме выборки она имеет наименьшую дисперсию,т.е. D(Qn)=Dmin

Опр5! Доверительной вероятностью или надежностью оценки Qn параметра Q назыв. вероятность , с которой осуществляется неравенство,

Заменив нер-во равносильным ему двойным неравенством Qn- получим . Это соотношение следует понимать так: вероятность того, что интервал заключает в себе (покрывает) неизвестный параметр Q=

Опр6. Интервал ,который покрывает неизвестный параметр Q с заданной надежностью назыв. доверительным интервалом.

Замечание! Обычно надежность задается заранее, значением близким 1.( 0,95;0,98..)

Доверительный интервал для параметров нормального распределения.

Пусть колич-ный признак Х генеральной совок-ти СВ Х имеет нормальное распределение с параметрами т.е X

Предположим, что в рез-те наблюдения рад признаком Х, получена некоторая выборка х1,х2...хn, тогда:

1. доверительный интервал для Мо, ( ), при известном ( ) имеет вид

Здесь: -х – выбороч средняя, n – объем выборки,пар-р U –определ из уравн.

Ф где Ф(U )- ф-ция распределения нормиров. распред. (табулированного)

- надежность

2) ! Доверит. интервал для Мо, при неизменном имеет вид

( x-t *S/ ;x+t *S/ ); х – выбороч средняя, n – объем выборки, S2-исправленная дисперсия, t –определяя по табл распрделен стьюдента

3) Доверит интервал для дисперсии S2 имеет вид (((n-1)S2)/U2 ; ((n-1)S2)/U1)

n- обьем

S2- исправ дисперсия

U1 и U2(U2>U1) находятся из табл (хи квадрат распределения Пирсона) для заданной надежности

Лекция 16. Закон больших чисел

Предварительные замечания

Как известно, нельзя точно предсказать какое возможное значение примет СВ в результате испытания, между тем оказывается, что при некоторых весьма общих условиях суммарное поведение достаточно больш. числа СВ почти утрачивает случайный характер и может быть предсказанным с большой степенью определенности. Эти условия и указываются в теоремах, которые носят общее название закона больших чисел.

Закон больших чисел.

Лемма Чебышева: если СВ Х принимают только неотрицательные значения и имеют МО, то для любого числа справедливо неравенство:

Доказательство: Введем в рассмотрение новую СВ:

Y= {0, <=x<E

{E, x>=E

При этом будет верно неравенство: . Следовательно ). Найдем теперь МО СВ У, её ряд распределения имеет вид.

Yi 0 E

Pi P{0<=x<E} P{x>=E}

Поэтому, M(Y)=0* P{0<=x<E}+E*P{x>=E}=E*P{x>=E}

Отсюда и нер-ва (*) получаем: E*P{x>=E}<=M(x) следов P{X>=E}<=M(x)/E

Теорема 1: (неравенство Чебышева)

Для любой СВ Х, имеющей МО и дисперсию, справедливо неравенство

Доказательство: Введем в рассмотрение новую СВ: Y=[X-M(X)] так как СВ Y>=0, то по Лемме Чебышева получаем: или, что тоже самое: с другой стороны

тогда неравенство (*) примет вид:

Следствие: Поскольку события противоположны, то неравенства Чебышева можно записать в виде:

Теорема 2: (теорема Чебышева) Если СВ попарно независимы и где С – некоторая постоянная, то при любом справедливо равенство:

Доказательство: Введем в рассмотрение новую СВ найдем МО и оценку дисперсии СВ Х:

Запишем неравенство Чебышева в формуле (1) для СВ Х:

Зам: (смысл теоремы Чебышева): При большом числе n СВ практически достоверно, что их средняя хотя есть величина случайная, но она сколь угодно мало отличается от неслучайной величины , то есть практически перестает быть случайной.

Зам!: т. Ч-ва является наиболее общим законом больших чисел, а теорема Бернулли, рассматр-ая ниже, простейшим.

Т3: (теорема Бернулли): Пусть число успехов в n испытаниях Бернулли и р - вероятность появления успеха в каждом испытании, тогда при любом числе справедливо равенство:

Доказательство: Воспользуемся след. представлением для СВ : , где - это ДСВ, означающая число появления успеха в i-ом испытании (i=1,2,3,….,n). Т. к. испытания Бернулли повторны и независимы, то СВ (i=1,2,,….,n) будут попарно независимы и одинаково распределены, то есть будут иметь одинаковый ряд распределения.

Т.о. дисперсии СВ (i=1,2,…,n) ограничены одной величиной, а значит к этим CD можно применить т. Ч-ва.

Центральная, предельная теорема.

Теорема 4: (центральная, предельная теорема).

Если независимые СВ, имеющие одно и тоже распределение с МО и дисперсией , то при неограниченном возрастании n, закон распределения суммы Х= , неограниченно приближается к нормальному.