Учебное пособие 2003
.pdfПусть |
(X1,X2) двумерный случайный вектор, и с этим |
|
вектором связаны две случайные величины Y1 |
g1 ( X1 , X 2 ) |
|
и Y2 g2 ( X1 |
, X 2 ) . Предположим, что g1 (x1, x2 ) |
и g2 (x1 , x2 ) |
задают взаимно однозначное преобразование плоскости саму в себя (или в некоторую область G), причем обратные преобразования h1 ( y1 , y2 ) и h2 ( y1 , y2 ) имеют непрерывные
частные производные по y1 |
|
и y2. Тогда плотности |
|||||||||||||||||||||||||
распределения случайных векторов (X1,X2) и (Y1, Y2) связаны |
|||||||||||||||||||||||||||
между собой соотношениями |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
f(Y ,Y ) ( y2 , y2 ) |
|
|
f( X |
, X |
) h1 ( y1, y2 ), h2 ( y1, y2 ) |
I |
, |
||||||||||||||||||
|
|
1 |
2 |
|
|
|
|
|
|
1 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
h1 ( y1, y2 ) |
|
|
|
|
h1 ( y1, y2 ) |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
где |
I |
|
|
y1 |
|
|
y2 |
- |
|
|
|
|
|
якобиан |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
h2 ( y1, y2 ) |
|
|
|
|
h2 ( y1, y2 ) |
|
|
|
|
|
|
|
||||||||
|
|
|
|
y1 |
|
|
y2 |
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
преобразования h1 ( y1, y2 ), h2 ( y1, y2 ) . |
|
|
|
|
|
|
|
|
|||||||||||||||||||
В |
|
частности, |
|
|
пусть |
|
|
|
g1 (x1 , x2 ) |
b11x1 b12 x2 c1 |
|||||||||||||||||
и g2 (x1, x2 ) |
|
b21x1 |
|
|
b22 x2 |
c2 , то есть преобразование линейное, |
|||||||||||||||||||||
причем матрица В невырожденная. Тогда |
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
f |
|
|
( y , y |
|
) |
|
f |
|
|
|
|
|
B 1 ( y c ) |
|
1 |
|
, |
|
|
|||
|
|
|
|
|
(Y ,Y ) |
2 |
|
( X , X ) |
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
B |
|
|
|
|
||||||||
|
|
|
|
|
|
|
1 |
2 |
|
|
|
|
|
|
|
|
1 |
2 |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где В-1 – обратная к В матрица, а ||B|| - модуль определителя матрицы В.
Содержание задания.
1.Усвоить и обосновать методику нахождения плотности распределения случайного вектора, являющегося «функцией» другого случайного вектора – «аргумента», по заданной плотности распределения «аргумента».
2.Получить формулу плотности совместного
161
распределения вероятностей суммы двух независимых случайных величин Z=X+Y:
fZ (z) fX (x) fY (z x)dx
Замечание. Если число слагаемых больше двух, то вместо многократного вычисления свертки лучше воспользоваться аппаратом так называемых характеристических функций, [1], стр. 168-170.
3.На основе полученной формулы, доказать устойчивость нормального распределения.
4.Разобрать примеры [1], стр. 100-104.
5.Выполнить упражнение.
|
Пусть вектор (X1,X2) имеет двумерное нормальное |
||||||||||||||||
распределение |
(см. стр.91) |
с |
параметрами |
aX |
|
aX |
0 ; |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
X1 |
, |
X1 , X2 |
|
0 . Найти |
|
плотность |
|
распределения |
|||||||||
X2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
полярных координат – R и Ф, то есть случайного вектора |
|||||||||||||||||
(R, Ф) и определить, зависимы ли случайные величины R и Ф. |
|||||||||||||||||
|
6. Выполнить упражнение. |
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
Пусть двумерный случайный вектор (X1,X2) имеет |
||||||||||||||||
плотность |
распределения |
|
f |
( X1 |
, X 2 ) |
(x , x ) |
e x1 |
x2 |
при |
||||||||
|
|
|
|
|
|
|
1 |
2 |
|
|
|
|
|
|
|||
x1 |
0, x2 0 и |
f( X , X |
) (x1, x2 ) |
0 в остальных случаях. |
|
||||||||||||
|
|
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Найти плотность вероятности |
f(Y ,Y ) ( y1, y2 ) двумерного |
|||||||||||||||
|
|
|
|
|
|
|
|
|
1 |
2 |
|
|
|
|
|
|
|
случайного вектора (Y1, Y2), если Y |
|
X |
|
X |
|
и Y |
|
X 2 |
. |
|
|||||||
|
1 |
2 |
|
|
|
||||||||||||
|
|
|
|
|
|
1 |
|
|
|
2 |
|
X1 |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7. Решить задачи: [5] № 403, 406.
Ответы. Первое упражнение: R и Ф независимы, R распределена по закону Релея, а Ф – по равномерному закону.
Второе упражнение:
|
|
|
y1 |
|
|
|
|
|
f(Y ,Y ) ( y1 , y2 ) |
y1e |
(1 y2 )2 |
при |
y1 |
0, |
y2 0 и |
||
|
|
|||||||
1 |
2 |
|
|
|
|
|
|
|
f(Y ,Y ) ( y1 , y2 ) |
0 при |
других |
y1 |
и |
y2 |
|||
1 |
2 |
|
|
|
|
|
|
|
|
|
|
162 |
|
|
|
|
|
Тема 3.
Методы расчета сводных характеристик выборки.
Литература [2], стр. 237-245 Упрощенные методы расчета сводных характеристик
выборки (выборочной средней, дисперсии и среднего квадратического отклонения) основаны на замене первоначальных вариант условными, если первоначальные варианты являются равноотстоящими.
Равноотстоящими называются варианты, образующие арифметическую прогрессию с разностью h.
Условными называются варианты, определяемые равенством ui xi c h , где с – новое начало отрезка
(ложный нуль). За с обычно выбирается варианта, расположенная в середине вариационного ряда.
Одним из упрощенных методов является метод произведений, дающий удобный способ вычисления условных выборочных характеристик. Связь же между выборочными характеристиками и условными выборочными дается формулами:
x |
|
h c ; |
D |
u2 |
|
|
2 h2 . |
u |
u |
||||||
в |
в |
|
|
|
|
Расчетную схему метода произведений лучше всего рассмотреть на конкретном примере.
Пример 1. Выборка задана статистическим распределением
xi |
10 |
15 |
20 |
25 |
30 |
35 |
40 |
|
|
|
|
|
|
|
|
ni |
5 |
8 |
10 |
40 |
20 |
10 |
7 |
|
|
|
|
|
|
|
|
Найти методом произведений выборочную среднюю, дисперсию и среднее квадратическое отклонение.
Решение. Составим расчетную таблицу. Для этого:
1.Запишем варианты xi в первый столбец;
2.Запишем частоты во второй столбец; сумму частот
163
поместим в нижнюю клетку столбца; 3. В качестве ложного нуля выберем варианту 25, так
как она расположена в середине вариационного ряда. В клетке третьего столбца напротив варианты х = 25 пишем 0; над нулем последовательно записываем условные варианты -1, -2 и т.д., а под нулем 1, 2, и т.д.
4. Произведения частот на условные варианты ui записываем в четвертый столбец; отдельно находим сумму отрицательных (-41) и отдельно сумму положительных (61) чисел; сложив эти числа, их сумму (20) помещаем в нижнюю
клетку четвертого столбца; 5. Произведение частот на квадраты условных вариант
запишем в пятый столбец; сумму чисел столбца (210) помещаем в нижнюю клетку столбца;
6. Произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой (контрольный)
столбец; сумму чисел столбца (350) помещаем в нижнюю клетку столбца.
В итоге получается следующая расчетная таблица
1 |
2 |
3 |
4 |
|
|
5 |
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi |
ni |
ui |
niui |
|
|
niui2 |
|
|
|
ni(ui+1)2 |
|
10 |
5 |
-3 |
-15 |
|
|
45 |
|
|
20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
8 |
-2 |
-16 |
|
|
32 |
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
10 |
-1 |
-10 |
|
|
10 |
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
25 |
40 |
0 |
-41 |
|
|
0 |
|
|
40 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
30 |
20 |
1 |
20 |
|
|
20 |
|
|
80 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
35 |
10 |
2 |
20 |
|
|
40 |
|
|
90 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
40 |
7 |
3 |
21 |
|
|
63 |
|
|
112 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
61 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n u 20 |
|
|
n u2 |
210 |
|
|
n (u 1)2 |
|
|
n=100 |
|
i i |
|
|
i i |
|
|
|
i i |
|
|
|
|
|
|
|
|
|
|
350 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
164 |
|
|
|
|
|
|
h = 15-10 = 5; c = 25.
Контроль:
n (u 1)2 |
350 ; |
n u2 |
2 |
n u n 210 2 20 100 350 . |
i i |
|
i i |
|
i i |
Совпадение найденных сумм свидетельствует о правильности проведенных вычислений.
Вычислим условные моменты первого и второго порядков
|
|
|
n u |
20 |
|
|
|
|
|
|
|
|
n u2 |
210 |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
u |
|
i |
i |
|
|
|
|
|
|
0, 2 |
; u2 |
|
|
|
i |
i |
|
|
|
2,1. |
|||
|
|
n |
|
|
100 |
|
|
|
n |
|
|
100 |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
Теперь |
|
|
вычисляем |
|
|
искомые |
выборочные |
|||||||||||||||||
характеристики |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
xb |
uh |
|
|
c |
0, 2 5 |
25 |
26 |
|||||||||
|
|
|
|
|
|
|
2 |
|
|
|
|
0, 2 2 |
|
|
|
|||||||||
|
|
D |
u2 |
|
|
|
h2 |
2,1 |
|
52 |
2,96 25 74 |
|||||||||||||
|
|
|
u |
|
||||||||||||||||||||
|
|
|
b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8, 602 . |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
b |
|
Db |
74 |
|
|
На этом примере видно, что все вычисления проводятся с гораздо меньшими числами, чем в примерах 1, 2 раздела 2.
Так как на практике, как правило, данные наблюдения не являются равноотстоящими числами, то нужно уметь свести вычисления к случаю равноотстоящих вариант. С этой целью интервал, в котором заключены все наблюдаемые значения признака (первоканальные варианты), делят на несколько равных частичных интервалов. Затем находят середины частичных интервалов, которые и образуют последовательность равноотстоящих вариант.
В качестве частоты каждой "новой" варианты принимают общее число первоначальных вариант, попавших в соответствующий частичный интервал.
Пример 2. Выборочная совокупность объема n = 100 задана таблицей
165
xi |
ni |
xi |
ni |
xi |
ni |
1,00 |
1 |
1,19 |
2 |
1,37 |
6 |
1,03 |
3 |
1,20 |
4 |
1,38 |
2 |
1,05 |
6 |
1,23 |
4 |
1,39 |
1 |
1,06 |
4 |
1,25 |
8 |
1,40 |
2 |
1,08 |
2 |
1,26 |
4 |
1,44 |
3 |
1,10 |
4 |
1,29 |
4 |
1,45 |
3 |
1,12 |
3 |
1,30 |
6 |
1,46 |
2 |
1,15 |
6 |
1,32 |
4 |
1,49 |
4 |
1,16 |
5 |
1,33 |
5 |
1,50 |
2 |
Составить распределение равноотстоящих вариант.
Решение. Разобьем интервал 1,00 – 1,50, например, на следующие 5 частичных интервалов:
1,00-1,10; 1,10-1,20; 1,20-1,30; 1,30-1,40; 1,40-1,50.
Приняв середины частичных интервалов в качестве новых вариант yi, получим равноотстоящие варианты:
y1 = 1,05; y2 = 1,15; y3 = 1,25; y4 = 1,35; y5 = 1,45.
Найдем частоту варианты y1:
n1 = 1 + 3 + 6 + 4 + 2 + 4/2 = 18.
Найдем частоту варианты y2:
n2 = 4/2 + 3 + 6 + 5 + 2 + 4/2 = 20.
Аналогично вычислим n3 = 25; n4 = 22; n5 = 15.
Получим следующее распределение равноотстоящих вариант:
yi |
|
1,05 |
1,15 |
|
1,25 |
|
|
1,35 |
|
1,45 |
|
|
ni |
|
18 |
20 |
|
25 |
|
|
22 |
|
15 |
|
|
|
|
|
|
|
|
|
||||||
Убедиться самим, что выборочные средние и |
||||||||||||
дисперсии, |
вычисленные |
по |
первоначальным |
и |
||||||||
равноотстоящим |
вариантам, |
окажутся |
соответственно |
|||||||||
равными: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xв 1, 250 ; yв 1, 246 ; Dx |
0, 018 ; Dy |
0,017 . |
|
|
||||||
|
|
|
166 |
|
|
|
|
|
|
|
|
Как видим, замена первоначальных вариант равноотстоящими не привела к существенным ошибкам; при этом объем вычислительной работы уменьшился.
Вопросы для самопроверки.
1.Что такое условные варианты, для чего они вводятся?
2.Как связаны условные выборочные характеристики с выборочными характеристиками?
3.В чем сущность метода произведений? Какова расчетная схема этого метода?
4.Как свести вычисления к случаю равноотстоящих вариант, если данные наблюдения не являются
равноотстоящими числами?
Содержание задания.
1.Усвоить понятие «условные варианты» и цель их использования.
2.Установить связь условных выборочных характеристик
свыборочными характеристиками.
3.Изложить сущность метода произведений и расчетную схему этого метода.
4.Усвоить методику сведения вычисления к случаю равноотстоящих вариант, если данные наблюдения не являются равноотстоящими числами.
5.Дано распределение количества рабочих в зависимости от количества деталей, изготовляемых каждым рабочим за 1 час.
Количество |
120- |
130- |
140- |
150- |
160- |
170- |
180- |
190- |
||
деталей за |
||||||||||
130 |
140 |
150 |
|
160 |
170 |
180 |
190 |
200 |
||
1 час |
|
|||||||||
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
167 |
|
|
|
|
|
Количество |
|
4 |
|
16 |
15 |
|
31 |
51 |
58 |
|
65 |
|
69 |
|||||
рабочих |
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
200- |
|
|
210- |
|
220- |
|
|
230- |
|
240- |
|
|
|
||||
|
210 |
|
|
220 |
|
230 |
|
|
240 |
|
250 |
|
|
|
||||
|
50 |
|
|
|
57 |
|
33 |
|
|
21 |
|
16 |
|
|
|
Найти выборочную среднюю, выборочную дисперсию, исправленную дисперсию.
6. Решить задачи [5], № 467, 471, 472, 480-484, 486, 487.
Тема 4.
Элементы теории корреляции.
Литература: [2], стр. 253-268
Рассмотрим две случайные величины X и Y.
Условным средним yx называют среднее арифметическое
наблюдавшихся значений Y, соответствующих Х = х. Например, если при х1 = 2 величина Y приняла значения y1 = 5, y2 = 6, y3 = 10, то условное среднее
5 |
6 |
10 |
|
|
yx |
|
|
|
7. |
|
3 |
|
||
1 |
|
|
|
|
|
|
|
|
Аналогично определяется условное среднее xy .
Зависимость случайной величины Y от другой величины называется статистической, если изменение одной из величин влечет изменение распределения другой. В частности, если при изменении одной величины изменяется среднее значение другой, то статистическая зависимость называется корреляционной.
Пример 1. Пусть Х – количество внесенного на поле удобрения, Y – урожай, собранный с этого поля. Известно, что внесенные удобрения не определяют однозначно урожайность,
168
на нее влияет еще много случайных факторов: влажность, качество обработки почвы, качество задела семян, температура и т.д. Это приводит к тому, что функциональной зависимости между Х и Y нет, но какая-то зависимость существует. Как показывает опыт, средний урожай является функцией от количества удобрений, то есть Y связан с Х корреляционной зависимостью.
Так как условное математическое ожидание M(Y/X) является функцией от х, то условное среднее yx также
функция от х. Обозначив эту функцию через f * x , получим уравнение yx f * x . Это уравнение называют выборочным
уравнением регрессии Y на Х, а ее график – выборочной линией регрессии Y на Х.
Это уравнение имеет вид:
|
|
y |
|
y r |
y |
(x |
x ) , |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
x |
b |
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
nxy |
xy nx y |
|
где x, y – варианты признаков Х и Y; |
rв |
|
|
- |
|||||||
|
|
||||||||||
|
|
|
|
|
|
|
|
|
n x y |
||
выборочный |
коэффициент |
корреляции; x , y - |
выборочные |
||||||||
средние; x , |
y - |
выборочные |
среднеквадратические |
отклонения; nxy - частота пары вариант; n – объем выборки.
Следует обратить особое внимание на смысл выборочного коэффициента корреляции: выборочный коэффициент корреляции rв является оценкой коэффициента корреляции r
генеральной совокупности и поэтому также служит для измерения линейной связи между величинами – количественными признаками Y и X. Он показывает, насколько хорошо в среднем может быть представлена каждая из величин в виде линейной функции от другой.
Далее необходимо выяснить все свойства выборочного коэффициента корреляции, а затем переходить к изучению
169
методики его вычисления. Предварительно надо усвоить устройство корреляционной таблицы.
Пример 2. Вычислить выборочный коэффициент по данным корреляционной таблицы
|
|
|
|
X |
|
|
|
Y |
20 |
25 |
30 |
|
35 |
40 |
ny |
|
|
||||||
16 |
4 |
6 |
- |
|
- |
- |
10 |
26 |
- |
8 |
10 |
|
- |
- |
18 |
36 |
- |
- |
32 |
|
3 |
9 |
44 |
46 |
- |
- |
4 |
|
12 |
6 |
22 |
56 |
- |
- |
- |
|
1 |
5 |
6 |
|
|
|
|
|
|
|
|
nx |
4 |
14 |
46 |
|
16 |
20 |
n = 100 |
1. Составим корреляционную таблицу в условных вариантах. В качестве ложных нулей выбираем с1 = 30 и с2 = 36, так как каждая из этих вариант расположена в середине соответствующего вариационного ряда. Шаги h1 и h2 равны разности между двумя соседними вариантами соответственно
h1 = 25 – 20 = 5, h2 = 26 – 16 = 10. Тогда
|
x c |
|
x 30 |
|
y j c2 |
|
y j 36 |
|
|
Ui |
i 1 |
|
i |
;Vj |
|
|
|
. |
|
h1 |
5 |
h2 |
10 |
||||||
|
|
|
Практически корреляционную таблицу в условных вариантах составляют следующим образом: в первом столбце вместо ложного нуля с2 (варианты 36) пишут 0; над нулем последовательно записывают –1, -2, под нулем пишут 1, 2. В первой строке вместо ложного нуля с1 (варианты 30) пишут 0; слева от нуля последовательно записывают –1, -2; справа от нуля пишут 1, 2. Все остальные данные переписывают из первоначальной корреляционной таблицы. В итоге получим корреляционную таблицу в условных вариантах
170