Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2003_-_Gmurman__TV_i_MS

.pdf
Скачиваний:
19
Добавлен:
27.03.2015
Размер:
16.8 Mб
Скачать

Заметим, однако, что из некоррелированности нор­

мально распределенных величин вытекает их независи­

мость. Это утверждение будет доказано в следующем

параграфе.

§ 19. Нормальный закон распределения

на плоскости

На практике часто встречаются двумерные слу­

чайные величины, распределение которых нормально.

Нормальным законом расnределенuя на nлоскостu на­

зывают распределение вероятностей двумерной случайной

величины (Х, У), если

 

 

 

 

 

I

 

 

 

 

 

 

 

f (х, у) = 2пахауV I Х2IJ

Х

 

 

-

1

[(x-а,,1

+

(у-а,)'

-2Г

 

х-а, и-а,]

 

 

2)

2

2

ху

----

 

 

 

 

 

О

О

(*)

хе

 

2 ( l - r xy

ох

 

Оу

 

 

 

Х!,

Мы видим, что нормальный закон на плоскости опре­

деляется пятью параметрами: а., а2, Ох, Оу И rХу' Можно

доказать, что 9ТИ параметры имеют следующий вероят­ ностный смысл: u., аg-математические ожидания, ох, ау-средние квадратические отклонения, r xy-КО9ФФJ.fЦИ­

ент корреляции величин Х и У.

Убедимся в том, что если составляющие двумерной

нормально распределенной случайной величины некорре­ лированны, то они и независимы. Действительно, пусть Х

и У некоррелированны. Тогда, полагая в формуле (*) r ху=О,

получим

 

f (х, у)=

I

.e- o. 1i [(Х- a"'/o;+(y-a,),/o~] =

 

 

 

2пахау

 

 

e-(y-a')'/(20~) = f (х)!

 

I

. е-(Х- a,)I/(20;) .

I

(у).

- (} Х y2n

 

 

Оу у 2п

1

S

Таким образом, если составляющие нормально рас­ пределенной случайной величины некоррелированны, то

плотность совместного р.аспределения системы равна

произведению плотностей распределения составляющих,

а отсюда и следует независимость составляющих (см. § 16). Справедливо и обратное утверждение (см. § 18).

Итак, для нормально распределенных составляющих двумерной случайной величины понятия независимости

и некоррелированности равносильны.

181

3 а м е ч а н н е, Используя формулы (.) н (••) § 12, можно да.

казать. что если двумерная случайная велнчина распределена нор­

мально с параметрамн а!, al' О"" Оу, r "'1/' то ее составляющие также

распределены нормально с параметрамн. соответственно равными а].

О", н al , О"'

§ 20. Линейная регрессия. Прямые ЛJlНJlИ среднеквадратической регрессии

Рассмотрим двумерную случайную величину (Х, У), где Х и У-зависимые случайные величины. Пред­

ставим одну из величин как функцию другой. Ограни­ чимся прИближенным представлением (точное приближе­ ние, вообще говоря, невозможно) величины У в виде

л и н е й н о й Ф у н к ц и и величины Х:

У ~ g(x)=aX +Р,

где а и Р-параметры, подлежащие опреДNlению. Эrо

можно сделать различными способами: наиболее употре­ бительный из них-метод наименьших квадратов.

Функцию g (Х) = аХ + Р называют «наилучшим при­

ближением» У в смысле метода наименьших квадратов,

если математическое ожидание М [Y-g(Х)]1 принимает

наименьшее возможное значение; функцию g (х) называют

среднеквадратической регрессией У на Х.

Теорема. Линейная средняя квадратическая регрессия У на Х имеет вид

g(X) =

mJl +r

01/

о- (Х -т",),

 

 

х

где т",= М (Х), ту =

М (У),

а",= VD (Х), ау = V D (У),

r = ~хul(охоу)-коэффициент корреляции величин Х и У,

Д о к а з а т е л ь с т в о. Введем в рассмотрение функцию

двух независимых аргументов а и р:

F (а, Р) = м [У-а-(}Х]=. (*)

Учитывая, что М (X-т",)=М (Y-mJl)=О, м [(Х-тх)х

х (У -тJl)] = ~xy = raxO JI ,

и выполнив выкладки, получим

F (а, Р) =

(J~+(}lа~-2га",аJlР + (тJl-а-ртх)з.

Исследуем

функцию

F (а, Р) на экстремум, для чего

прнравняем нулю частные производные:

дР

-=-2(т -a -Rm) =0

да " t'x ,

:, = 2ра~-2Г(J",аJl= О.

182

Отсюда

O~

R=,_

t" оХ'

O~

а=т -,-т.

и О %

Х

Легко убедиться, что при этих значениях а и р рассмат­

риваемая функция принимает наименьшее значение.

Итак, линейная средняя квадратическая регрессия У

и Х имеет вид

O~ O/J g(X)=a+pX = m/J-,-mx+'-X,

ох ох

или

 

О

называют коэффициентом

 

Коэффициент

Р = , -1!...

ре-

 

ОХ

 

 

грессии У на Х,

а прямую

 

( '" '")

называют прямой среднеквадраmической регрессии У на х.

Подставив найденные значения а и р в соотношение (*),

получим минимальное значение функции F (а, р), равное o~ (1-,2). Величину a~ (1-,2) называют остаточной дис­ персией случайной величины У относительно случайной

величины Х; она характеризует величину ошибки, кото­

рую допускают при замене У линейной функцией g (Х)=

= а +рх. При , = ± 1 остаточная дисперсия равна нулю;

другими словами, при этих крайних значениях коэффи­ циента корреляции не возникает ошибки при представ­

лении У в внде линейной функции от Х.

Итак, если коэффициент корреляции' = ± 1, то У и Х

связаны л и н е й н о й функциональной зависимостью. Аналогично можно получить прямую среднеквадрати­

ческой регрессии Х на У:

х-т

х

=, оХ (У-т )

(**"')

 

O/J

v:

 

(, :: -коэффициент регрессии Х

на У)

и остаточную

дисперсию o~ (1-,2) величины Х относительно У.

Если ,=±l, то обе прямые регрессии, как видно

из (**) и (***), совпадают.

Из уравнений (**) и (***) следует, что обе прямые

регрессии проходят через точку (тх; ffl/J)' которую назы­

вают центром совМестного распределения величин Х и У.

183

§ 21. Jlинейная КОРpe.llяция. Нормальная

корреляция

 

Рассмотрим

двумерную

случайную

величину

(Х, У).

Если обе функции регрессии

У

на

Х и

Х на У

линейны

(см. § 15),

то говорят,

что

Х

и У

связаны ли­

нейной корреляционной зависимостью. Очевидно, что гра­ фики линейных функций регрессии - прямые линии, причем

можно доказать, что они совпадают с ПРЯМЫМИ средне·

квадратической регрессии (см. § 20). Имеет место следу­

ющая важная теорема.

Теорема. Если двумерная случайная величина (Х, У)

распределена нормально, то Х и У связаны линейной

корреляционной

зависимостью.

 

 

Д о к а з а т е л ь с Т В о.

Двумерная плотность

вероят-

ности (см. § 19)

 

 

 

 

f (х)

I

e-(IlI+VI-IГIlrl)!(1 (1-гl»

(*)

у =

2nOжОу '"Гl

I

'

 

ГАе

 

 

 

 

 

 

 

 

(**)

ПЛотность вероя~ности составляющей

Х (см. § 19,

замечание)

 

 

 

 

 

f1 (х) =

I

 

(***)

 

.г­ e -ul!I.

 

 

 

аж" 2n

 

 

Найдем функцию регрессии М (У Iх). для чего сначала

найдем условный закон

распределения величины

У при

Х =х LCM. § 14,

формула (**)]:

 

 

Ф (у Iх) = I'1(х,у))

Подставив (*) и (**) в правую часть этой формулы и

выполнив выкладки. имеем

ф(уIх) =

I

e-(rI-ги)"!(1 (1-гl),.

 

У2"°"

 

Заменив и и v по формулам (**), окончательно получим

(g Iх)=

(0&/ Yl-Irl ) У2К е

 

184

Полученное условное рас.пределение нормально с ма­

тематическим ожиданием (функцией регрессии У на Х)

м (У IК)

 

 

О

1

)

 

 

ох

= а. + ,2 . (к-а

и дисперсией O'~ (1- ,2).

 

 

 

 

 

Аналогично можно

получить функцию регрессии Х

на У:

 

 

 

 

 

м (Х Iу) = а

1

+, ОХ (у- a l ).

 

 

Оу

 

 

Так как обе функции регрессии линейны, то корре­

.nяция между величинами Х и У линейная, что и требо­

валось доказать.

Принимая во внимание вероятностный смысл пара­

метров двумерного нормального распределения (см. § 19),

заключаем. что уравнения прямых регрессии

Оу

О

(у-а.)

у-а. ::::0:'- (к-а.). к-а. = r...1i.

ох

Оу

 

совпадают с уравнениями прямых среднеквадратической

регрессии (см. § 20).

3аАач.

1. Найти законы распределения составл_ющих АискретноА

АвумерноА случайной величииы, заданной закоиом распреАеления

 

 

I

 

I

 

х

 

 

 

 

 

 

у

 

I

 

 

 

 

Х,

 

Ха

 

Уl

 

0,12

 

0.18

 

У.

 

0,10

 

0,11

Оmв. Х

хl

х.

х,

У

Уl

У.

Р

0.22

0,29

0,49

Р

0,40

0,60

I

I

Ха

0,10

0.39

2. Найти вероятность того, что составляющая Х АвумерноА елу­ чаЙllОЙ величииы примет значение Х < 1/2 и при 9ТОм составляю­

щая У примет значение У < 1/3, если известна функция распреяе­

леиин системы

Р(х, у)=(~ arctg 2х+ ~) (-/; arctg3y+ ~)

OIМ. Р (Х < 1/2, У < 1/3) =9/16.

3. Найти вероятность попадания CJlучаiiной то'lки (Х; У) в JJРЯ­ моуroJ.ьник., ограниченный пряыыми х .::-п,/4, ,,= п/2, fI = п,/6, g = "'/3.

185

если известна функции распределения

F (х, у):::::. sin х sin g < х < n/2, О < у <;; n/2).

Отв. Р (n/4 < х < n/2, ,,/6 < У < n/3) = О, 11.

4. Найти плотность распределения системы двух случайных ве­

личии по известной функции распределения

F (х, y)=(1-e-2~) (1-е-ЗУ) (х ~O, y~ О).

дlF

Ото. '(х, У)=дхду бе-11X+,у>.

5.

Внутри

прямоугольника,

ограниченного прямыми

х = О,

х = n/2,

g = О,

у:::::. n/2, плотность

распределеиия системы двух

слу­

чайных велнчин 1(х, (1) sin (х+ у); вне прямоугольника 1(х, у) =0.

Найти: а) величииу С; б) функцию распределении системы.

Omв. а)

С=О,5; б) Р(х,

y)=0.5[sinx+siny-sin(x+y))

< х < n/2. О <;; у <;; n/2).

 

6. Система

двух случайиых

величнн рас.преАелена равномерно:

в прямоуroльиике, ограничениом прямымн х=4. х=6. у= 10. у= 15,

функция 1(х. у) сохраниет постоянное значение. а вне этого прямо­

угольника она равна нулю. Найти: а) плотноеть 1(х, у) совместного

распределения; б) функцию распределеиии системы.

Omв

а) f

11) = {0.1

внутри прямоуroльника,

 

.

,

О

вие прямоугольника;

 

 

_ (х-4) (у-lО)

 

б) F (х, g) -

10

 

7. Плотность совместиого распределения I:Истемы двух случаАных

 

1(х, у)

С

 

величин

(4+х2)

(9+112) Наiiти: а) величину С; 6)

функ-

цию распределения системы.

Ото. а)С_б/пl;б)Р(х, у)=( ~ arctg ; + ~ ) ( ~ arctg ; + ~.) .

8. Двумерная с.'lучаЙнаи величнна задана плотностью совмест­

ного распреАеления

'(х, у)= зуз e-иJ-8ху-tgJ.

n

Найти условные законы распределения составляющих.

2 - (1%+ : 11)1

3

Omв. ер (х I у)= yn е

; ч' (х I У)- yit е- (X+311>1.

ЧАСТЬ ТРЕТЬЯ

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ

СТАТИСТИКИ

Глава пятнадцатая

ВЫБорочиыR МЕТОД

§ 1. Задачи ма?емвтическоl статистики

Установление закономерностей, которым подчи­

нены массовые случайные явления, основано на изучении

методами теории вероятностей статистических данных­

результатов наблюдений.

Первая задача математической статистики-указать

способы сбора и группировки С-1'лтистических сведений,

полученных в результате наблюдений или в результате

специально поставленных экспериментов.

Вторая задача математической статистики - разрабо­

тать методы анализа статистических данных в зависи­

мости от целей исследования. (}ода относятся:

а) оценка неизвестной вероятности события; оценка

неизвестной функции распределения; оценка параметров

распределения, вид которого известен; оценка зависи­

мости случайной величины от одной или нескольких

случайных величин и др.;

б) проверка статистических гипотез о виде неизвест­

ного распределения или о величине параметров распре­

деления, вид которого известен.

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до

начала исследования (планирование эксперимента), в ходе

исследования (последовательный анализ) и решает многие другие задачи. Современную математическую статистику

u

определяют как науку о принятии решении в условиях

неопределенности.

Итак, задача математической статистики состоит в со­

здании методов сбора и обработки статистических данных

для получения научиых и практических выводов.

187

§ 2. Краткая историческая справка

Математическая статистика возникла (XVII в.)

и развивалась параллельно с теорией вероятностей. Даль­ нейшее развитие математической статистики (вторая по­

ловина Х IX -начало ХХ в.) обязано, в первую очередь,

П. Л. Чебышеву, А. А. Маркову, А. М. Ляпунову, а также К. Гауссу, А. Кетле, Ф. Гальтону, К. Пирсону

идр.

В ХХ в. наиболее существенный вклад в математи­

ческую статистику был сделан советскими матеМаТИI<ами

(В. И. Романовский, Е. Е. Слуцкий, А. Н. Колмогоров,

Н. В. Смирнов), а также английскими (Стьюдент, Р. Фи­

шер, Э. Пирсон) и американскими (Ю. Нейман, А. Вальд)

учеными.

§ З. Геиеральная и выборочна. совокупиости

Пусть требуется изучить совокупность однород­

ных объектов относительно некоторого к а ч е с т в е н­

н о Г о или к о л и ч е с т в е н н о г о при з н а к а, характе­

ризующего эти объекты. Например, если имеется партия

деталей, то качественным признаком может служить

станда ртность детали, а количественным - контроли руе­

мый размер детали.

Иногда проводят сплошное обследование, т. е. обсле­ дуют к а ж Д ы й из объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяют сравнительно редко.

Например, если совокупность содержит очень большое

число объектов, то провести сплошное обследование фи­

зически невозможно. Если обследование объекта связано

с его уничтожением или требует больших материальных

затрат. то проводить сплошное обследование практически не имеет смысла. В таких случаях случайно отбирают

И3 всей совокупности ограниченное число объектов и

подвергают их изучению.

Вы.борочноЙ совокупностью или просто вы.боркоЙ назы­

вают совокупность случайно отобранных объектов.

Генеральной совокуnн,ОСrrlbЮ называют совокупность

объектов, из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 де-

188

талей, то объем генеральной совокупности

N = 1000,

а

объем выборки

n = 100.

 

 

3 а м е ч а и и е.

Часто генеральная совокупность

содержят

ко­

нечное число объектов. Одиако если это число достаточно велико, то иногда в целях упрощения вычислений, или для облегчения теоре­

тических выводо., ,l.опускают, что генеральная совокупность состоит

из бесчисленного множества объектов. Такое допущение оправ,l.Ы­

вается тем, что увеличение объема генеральной совокупности (доста­

точно большого объема) практически не сказывается lIа результатах

обработки даниых Вlllборки.

§ 4. Повторная н бесповторная выборки.

Репрезентативная выборка

При {ЮСтаВJIении выборки можно поступать двумя

способами: после того как объект отобран и над ним

произведено наблюдение, он может быть возвращен либо

не возвращен в генеральную совокупность. В соответствии

со сказанным 8ыборки подразделяют на повторные и бес­

повторные.

Повторной называют выборку, при которой отобран­

ный объект (перед отбором следующего) возвращается

вгенеральную совокупность.

Бесnовmорной называют выборку, при которой отобран­ ный объект в генеральную совокупность не возвращается.

На l1рактике обычно пользуются бесповторным слу­

чайным отбором.

Для того чтобы по данным выборки можно было до­

статочно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты

выборки правильно его представляли. Другими словами, выборка должна правильно представлять пропорции гене­ ральиой совокупности. Эго требование коротко формули­

руют так: выборка должна быть репрезентативной (пред­

ставительной).

в силу закона больших чисел можно утверждать, что

выборка будет репрезентативной, если ее осуществить

случайно: каждый объект выборки отобран случайно из

генеральной совокупности, если все объекты имеют оди­ наковую вероятность попасть в выборку.

Если объем генеральной совокупности достаточно ве­

лик, а выборка составляет лишь незначнтельнvю часть

:,той совокупности, то различие между повторной и бес­

повторной выборками стирается; в предельном случае,

189

когда рассматривается бесконечная генеральная совокуп­

ность, а выборка имеет конечный объем, это различие

исчезает.

§ 5. Способы отбора

На практике применяются различиые способы отбора. Принципиально эти способы можно подразделить

на два вида:

1. Отбор, не требующий расчленения генеральной со­ вокупности на части. Сюда относятся: а) простой слу­ чайный бесповторный отбор; б) простой случайный по­

вторный отбор.

2. Отбор, при котором генеральная совокупность раз­

бивается на части. Qoда относятся: а) типический отбор; б) механический отбор; в) серийный отбор.

Простым случайным называют такой отбор, при ко­ тором объекты извлекают по одному из всей генераль­ ной совокупности. Осуществить простой отбор можно

различными способами. Например, для извлечения n объ­

ектов из генеральной совокупности объема N поступают

так: выписывают номера от 1 до N на карточках, которые

тщательно перемешивают, и наугад вынимают одну кар­

точку; объект, имеющий одинаковый номер с извлеченной

карточкой, подвергают обследованию; затем карточку

возвращают в пачку и процесс повторяют, т. е. карточки

перемешивают, наугад вынимают одну из них и т. д. Так

поступают n раз; в итоге получают простую случайную

повторную

выборку объема n.

 

Если извлеченные

карточки

не возвращать в пачку,

то выборка

является

простой

случайной бесповторной.

При большом объеме генеральной совокупности опи­ санный процесс оказывается очень трудоемким. В этом

случае пользуются готовыми таблицами «случайных чисел»,

в которых числа расположены в случайном порядке. Для того чтобы отобрать, например, 50 объектов из пронуме­

рованной генеральной совокупности, открывают любую страницу таблицы случайных чисел и выписывают под­ ряд 50 чисел; в выборку попадают те объекты, номера

u

которых совпадают с выписанными случаиными числами.

Если бы оказалось, что случайное число таблиЦhI пре­

вышает число N, ТО такое случайное число пропускают.

При осуществлении бесповторной выборки случайные числа таблицы, уже встречавшиеся ранее, следует также

пропустить.

190