Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 2003

.pdf
Скачиваний:
3
Добавлен:
30.04.2022
Размер:
3.84 Mб
Скачать

Пусть

(X1,X2) двумерный случайный вектор, и с этим

вектором связаны две случайные величины Y1

g1 ( X1 , X 2 )

и Y2 g2 ( X1

, X 2 ) . Предположим, что g1 (x1, x2 )

и g2 (x1 , x2 )

задают взаимно однозначное преобразование плоскости саму в себя (или в некоторую область G), причем обратные преобразования h1 ( y1 , y2 ) и h2 ( y1 , y2 ) имеют непрерывные

частные производные по y1

 

и y2. Тогда плотности

распределения случайных векторов (X1,X2) и (Y1, Y2) связаны

между собой соотношениями

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f(Y ,Y ) ( y2 , y2 )

 

 

f( X

, X

) h1 ( y1, y2 ), h2 ( y1, y2 )

I

,

 

 

1

2

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h1 ( y1, y2 )

 

 

 

 

h1 ( y1, y2 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

I

 

 

y1

 

 

y2

-

 

 

 

 

 

якобиан

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h2 ( y1, y2 )

 

 

 

 

h2 ( y1, y2 )

 

 

 

 

 

 

 

 

 

 

 

y1

 

 

y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

преобразования h1 ( y1, y2 ), h2 ( y1, y2 ) .

 

 

 

 

 

 

 

 

В

 

частности,

 

 

пусть

 

 

 

g1 (x1 , x2 )

b11x1 b12 x2 c1

и g2 (x1, x2 )

 

b21x1

 

 

b22 x2

c2 , то есть преобразование линейное,

причем матрица В невырожденная. Тогда

 

 

 

 

 

 

 

 

 

 

 

f

 

 

( y , y

 

)

 

f

 

 

 

 

 

B 1 ( y c )

 

1

 

,

 

 

 

 

 

 

 

(Y ,Y )

2

 

( X , X )

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

B

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где В-1 – обратная к В матрица, а ||B|| - модуль определителя матрицы В.

Содержание задания.

1.Усвоить и обосновать методику нахождения плотности распределения случайного вектора, являющегося «функцией» другого случайного вектора – «аргумента», по заданной плотности распределения «аргумента».

2.Получить формулу плотности совместного

161

распределения вероятностей суммы двух независимых случайных величин Z=X+Y:

fZ (z) fX (x) fY (z x)dx

Замечание. Если число слагаемых больше двух, то вместо многократного вычисления свертки лучше воспользоваться аппаратом так называемых характеристических функций, [1], стр. 168-170.

3.На основе полученной формулы, доказать устойчивость нормального распределения.

4.Разобрать примеры [1], стр. 100-104.

5.Выполнить упражнение.

 

Пусть вектор (X1,X2) имеет двумерное нормальное

распределение

(см. стр.91)

с

параметрами

aX

 

aX

0 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

X1

,

X1 , X2

 

0 . Найти

 

плотность

 

распределения

X2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

полярных координат – R и Ф, то есть случайного вектора

(R, Ф) и определить, зависимы ли случайные величины R и Ф.

 

6. Выполнить упражнение.

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть двумерный случайный вектор (X1,X2) имеет

плотность

распределения

 

f

( X1

, X 2 )

(x , x )

e x1

x2

при

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

x1

0, x2 0 и

f( X , X

) (x1, x2 )

0 в остальных случаях.

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найти плотность вероятности

f(Y ,Y ) ( y1, y2 ) двумерного

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

случайного вектора (Y1, Y2), если Y

 

X

 

X

 

и Y

 

X 2

.

 

 

1

2

 

 

 

 

 

 

 

 

 

1

 

 

 

2

 

X1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7. Решить задачи: [5] № 403, 406.

Ответы. Первое упражнение: R и Ф независимы, R распределена по закону Релея, а Ф – по равномерному закону.

Второе упражнение:

 

 

 

y1

 

 

 

 

 

f(Y ,Y ) ( y1 , y2 )

y1e

(1 y2 )2

при

y1

0,

y2 0 и

 

 

1

2

 

 

 

 

 

 

 

f(Y ,Y ) ( y1 , y2 )

0 при

других

y1

и

y2

1

2

 

 

 

 

 

 

 

 

 

 

162

 

 

 

 

 

Тема 3.

Методы расчета сводных характеристик выборки.

Литература [2], стр. 237-245 Упрощенные методы расчета сводных характеристик

выборки (выборочной средней, дисперсии и среднего квадратического отклонения) основаны на замене первоначальных вариант условными, если первоначальные варианты являются равноотстоящими.

Равноотстоящими называются варианты, образующие арифметическую прогрессию с разностью h.

Условными называются варианты, определяемые равенством ui xi c h , где с – новое начало отрезка

(ложный нуль). За с обычно выбирается варианта, расположенная в середине вариационного ряда.

Одним из упрощенных методов является метод произведений, дающий удобный способ вычисления условных выборочных характеристик. Связь же между выборочными характеристиками и условными выборочными дается формулами:

x

 

h c ;

D

u2

 

 

2 h2 .

u

u

в

в

 

 

 

 

Расчетную схему метода произведений лучше всего рассмотреть на конкретном примере.

Пример 1. Выборка задана статистическим распределением

xi

10

15

20

25

30

35

40

 

 

 

 

 

 

 

 

ni

5

8

10

40

20

10

7

 

 

 

 

 

 

 

 

Найти методом произведений выборочную среднюю, дисперсию и среднее квадратическое отклонение.

Решение. Составим расчетную таблицу. Для этого:

1.Запишем варианты xi в первый столбец;

2.Запишем частоты во второй столбец; сумму частот

163

поместим в нижнюю клетку столбца; 3. В качестве ложного нуля выберем варианту 25, так

как она расположена в середине вариационного ряда. В клетке третьего столбца напротив варианты х = 25 пишем 0; над нулем последовательно записываем условные варианты -1, -2 и т.д., а под нулем 1, 2, и т.д.

4. Произведения частот на условные варианты ui записываем в четвертый столбец; отдельно находим сумму отрицательных (-41) и отдельно сумму положительных (61) чисел; сложив эти числа, их сумму (20) помещаем в нижнюю

клетку четвертого столбца; 5. Произведение частот на квадраты условных вариант

запишем в пятый столбец; сумму чисел столбца (210) помещаем в нижнюю клетку столбца;

6. Произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой (контрольный)

столбец; сумму чисел столбца (350) помещаем в нижнюю клетку столбца.

В итоге получается следующая расчетная таблица

1

2

3

4

 

 

5

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

ni

ui

niui

 

 

niui2

 

 

 

ni(ui+1)2

10

5

-3

-15

 

 

45

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

15

8

-2

-16

 

 

32

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

20

10

-1

-10

 

 

10

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

25

40

0

-41

 

 

0

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

30

20

1

20

 

 

20

 

 

80

 

 

 

 

 

 

 

 

 

 

 

 

 

35

10

2

20

 

 

40

 

 

90

 

 

 

 

 

 

 

 

 

 

 

 

 

40

7

3

21

 

 

63

 

 

112

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

61

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n u 20

 

 

n u2

210

 

 

n (u 1)2

 

 

n=100

 

i i

 

 

i i

 

 

 

i i

 

 

 

 

 

 

 

 

 

 

350

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

164

 

 

 

 

 

 

h = 15-10 = 5; c = 25.

Контроль:

n (u 1)2

350 ;

n u2

2

n u n 210 2 20 100 350 .

i i

 

i i

 

i i

Совпадение найденных сумм свидетельствует о правильности проведенных вычислений.

Вычислим условные моменты первого и второго порядков

 

 

 

n u

20

 

 

 

 

 

 

 

 

n u2

210

 

 

 

 

 

 

 

 

 

 

 

 

u

 

i

i

 

 

 

 

 

 

0, 2

; u2

 

 

 

i

i

 

 

 

2,1.

 

 

n

 

 

100

 

 

 

n

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь

 

 

вычисляем

 

 

искомые

выборочные

характеристики

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xb

uh

 

 

c

0, 2 5

25

26

 

 

 

 

 

 

 

2

 

 

 

 

0, 2 2

 

 

 

 

 

D

u2

 

 

 

h2

2,1

 

52

2,96 25 74

 

 

 

u

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8, 602 .

 

 

 

 

 

 

 

 

 

 

 

 

b

 

Db

74

 

 

На этом примере видно, что все вычисления проводятся с гораздо меньшими числами, чем в примерах 1, 2 раздела 2.

Так как на практике, как правило, данные наблюдения не являются равноотстоящими числами, то нужно уметь свести вычисления к случаю равноотстоящих вариант. С этой целью интервал, в котором заключены все наблюдаемые значения признака (первоканальные варианты), делят на несколько равных частичных интервалов. Затем находят середины частичных интервалов, которые и образуют последовательность равноотстоящих вариант.

В качестве частоты каждой "новой" варианты принимают общее число первоначальных вариант, попавших в соответствующий частичный интервал.

Пример 2. Выборочная совокупность объема n = 100 задана таблицей

165

xi

ni

xi

ni

xi

ni

1,00

1

1,19

2

1,37

6

1,03

3

1,20

4

1,38

2

1,05

6

1,23

4

1,39

1

1,06

4

1,25

8

1,40

2

1,08

2

1,26

4

1,44

3

1,10

4

1,29

4

1,45

3

1,12

3

1,30

6

1,46

2

1,15

6

1,32

4

1,49

4

1,16

5

1,33

5

1,50

2

Составить распределение равноотстоящих вариант.

Решение. Разобьем интервал 1,00 – 1,50, например, на следующие 5 частичных интервалов:

1,00-1,10; 1,10-1,20; 1,20-1,30; 1,30-1,40; 1,40-1,50.

Приняв середины частичных интервалов в качестве новых вариант yi, получим равноотстоящие варианты:

y1 = 1,05; y2 = 1,15; y3 = 1,25; y4 = 1,35; y5 = 1,45.

Найдем частоту варианты y1:

n1 = 1 + 3 + 6 + 4 + 2 + 4/2 = 18.

Найдем частоту варианты y2:

n2 = 4/2 + 3 + 6 + 5 + 2 + 4/2 = 20.

Аналогично вычислим n3 = 25; n4 = 22; n5 = 15.

Получим следующее распределение равноотстоящих вариант:

yi

 

1,05

1,15

 

1,25

 

 

1,35

 

1,45

 

 

ni

 

18

20

 

25

 

 

22

 

15

 

 

 

 

 

 

 

 

 

Убедиться самим, что выборочные средние и

дисперсии,

вычисленные

по

первоначальным

и

равноотстоящим

вариантам,

окажутся

соответственно

равными:

 

 

 

 

 

 

 

 

 

 

 

 

 

xв 1, 250 ; yв 1, 246 ; Dx

0, 018 ; Dy

0,017 .

 

 

 

 

 

166

 

 

 

 

 

 

 

 

Как видим, замена первоначальных вариант равноотстоящими не привела к существенным ошибкам; при этом объем вычислительной работы уменьшился.

Вопросы для самопроверки.

1.Что такое условные варианты, для чего они вводятся?

2.Как связаны условные выборочные характеристики с выборочными характеристиками?

3.В чем сущность метода произведений? Какова расчетная схема этого метода?

4.Как свести вычисления к случаю равноотстоящих вариант, если данные наблюдения не являются

равноотстоящими числами?

Содержание задания.

1.Усвоить понятие «условные варианты» и цель их использования.

2.Установить связь условных выборочных характеристик

свыборочными характеристиками.

3.Изложить сущность метода произведений и расчетную схему этого метода.

4.Усвоить методику сведения вычисления к случаю равноотстоящих вариант, если данные наблюдения не являются равноотстоящими числами.

5.Дано распределение количества рабочих в зависимости от количества деталей, изготовляемых каждым рабочим за 1 час.

Количество

120-

130-

140-

150-

160-

170-

180-

190-

деталей за

130

140

150

 

160

170

180

190

200

1 час

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

167

 

 

 

 

 

Количество

 

4

 

16

15

 

31

51

58

 

65

 

69

рабочих

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

200-

 

 

210-

 

220-

 

 

230-

 

240-

 

 

 

 

210

 

 

220

 

230

 

 

240

 

250

 

 

 

 

50

 

 

 

57

 

33

 

 

21

 

16

 

 

 

Найти выборочную среднюю, выборочную дисперсию, исправленную дисперсию.

6. Решить задачи [5], № 467, 471, 472, 480-484, 486, 487.

Тема 4.

Элементы теории корреляции.

Литература: [2], стр. 253-268

Рассмотрим две случайные величины X и Y.

Условным средним yx называют среднее арифметическое

наблюдавшихся значений Y, соответствующих Х = х. Например, если при х1 = 2 величина Y приняла значения y1 = 5, y2 = 6, y3 = 10, то условное среднее

5

6

10

 

yx

 

 

 

7.

 

3

 

1

 

 

 

 

 

 

 

Аналогично определяется условное среднее xy .

Зависимость случайной величины Y от другой величины называется статистической, если изменение одной из величин влечет изменение распределения другой. В частности, если при изменении одной величины изменяется среднее значение другой, то статистическая зависимость называется корреляционной.

Пример 1. Пусть Х – количество внесенного на поле удобрения, Y – урожай, собранный с этого поля. Известно, что внесенные удобрения не определяют однозначно урожайность,

168

на нее влияет еще много случайных факторов: влажность, качество обработки почвы, качество задела семян, температура и т.д. Это приводит к тому, что функциональной зависимости между Х и Y нет, но какая-то зависимость существует. Как показывает опыт, средний урожай является функцией от количества удобрений, то есть Y связан с Х корреляционной зависимостью.

Так как условное математическое ожидание M(Y/X) является функцией от х, то условное среднее yx также

функция от х. Обозначив эту функцию через f * x , получим уравнение yx f * x . Это уравнение называют выборочным

уравнением регрессии Y на Х, а ее график – выборочной линией регрессии Y на Х.

Это уравнение имеет вид:

 

 

y

 

y r

y

(x

x ) ,

 

 

 

 

 

 

 

 

 

 

 

 

 

x

b

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nxy

xy nx y

где x, y – варианты признаков Х и Y;

rв

 

 

-

 

 

 

 

 

 

 

 

 

 

 

n x y

выборочный

коэффициент

корреляции; x , y -

выборочные

средние; x ,

y -

выборочные

среднеквадратические

отклонения; nxy - частота пары вариант; n – объем выборки.

Следует обратить особое внимание на смысл выборочного коэффициента корреляции: выборочный коэффициент корреляции rв является оценкой коэффициента корреляции r

генеральной совокупности и поэтому также служит для измерения линейной связи между величинами – количественными признаками Y и X. Он показывает, насколько хорошо в среднем может быть представлена каждая из величин в виде линейной функции от другой.

Далее необходимо выяснить все свойства выборочного коэффициента корреляции, а затем переходить к изучению

169

методики его вычисления. Предварительно надо усвоить устройство корреляционной таблицы.

Пример 2. Вычислить выборочный коэффициент по данным корреляционной таблицы

 

 

 

 

X

 

 

Y

20

25

30

 

35

40

ny

 

 

16

4

6

-

 

-

-

10

26

-

8

10

 

-

-

18

36

-

-

32

 

3

9

44

46

-

-

4

 

12

6

22

56

-

-

-

 

1

5

6

 

 

 

 

 

 

 

 

nx

4

14

46

 

16

20

n = 100

1. Составим корреляционную таблицу в условных вариантах. В качестве ложных нулей выбираем с1 = 30 и с2 = 36, так как каждая из этих вариант расположена в середине соответствующего вариационного ряда. Шаги h1 и h2 равны разности между двумя соседними вариантами соответственно

h1 = 25 – 20 = 5, h2 = 26 – 16 = 10. Тогда

 

x c

 

x 30

 

y j c2

 

y j 36

 

Ui

i 1

 

i

;Vj

 

 

 

.

h1

5

h2

10

 

 

 

Практически корреляционную таблицу в условных вариантах составляют следующим образом: в первом столбце вместо ложного нуля с2 (варианты 36) пишут 0; над нулем последовательно записывают –1, -2, под нулем пишут 1, 2. В первой строке вместо ложного нуля с1 (варианты 30) пишут 0; слева от нуля последовательно записывают –1, -2; справа от нуля пишут 1, 2. Все остальные данные переписывают из первоначальной корреляционной таблицы. В итоге получим корреляционную таблицу в условных вариантах

170