3 Семестр ИНФ / Macenko_Selivanov
.pdf
71
Пример 3. Задана функция совместного распределения системы двух случайных величин
F (x, y) =1 − 3−x − 3− y + 3−x − y |
при x ≥ 0, y ≥ 0; F (x, y) = 0 в |
остальных |
||
случаях. Найти f (x, y). |
|
|
|
|
Решение. Используем формулу (11.1). |
Найдем частные производные: |
|||
F 'x = (3−x − 3−x − y ) ln 3, |
F ''xy |
= 3−x − y ln2 3. |
Итак, искомая |
плотность |
распределения имеет вид |
f (x, y) = 3−x − y ln2 3 при x ≥ 0, y ≥ 0; |
f ( x, y ) = 0 |
||
в остальных случаях. |
|
|
|
|
Ответ: f (x, y) = 3−x − y ln2 3 при x ≥ 0, y ≥ 0; f ( x, y ) = 0 в остальных
случаях.
11.1. Задан закон совместного распределения системы дискретных случайных величин (Х, Y):
X |
26 |
30 |
41 |
50 |
Y |
|
|
|
|
|
|
|
|
|
2,3 |
0,05 |
0,12 |
0,08 |
0,04 |
2,7 |
0,09 |
0,30 |
0,11 |
0,21 |
|
|
|
|
|
Найти законы распределения составляющих Х и Y.
11.2. Найти закон совместного распределения системы независимых случайных величин (Х, Y), если компоненты Х и Y имеют законы распределения
X |
-1 |
3 |
5 |
p |
0,5 |
0,3 |
0,2 |
Y |
2 |
4 |
p |
0,6 |
0,4 |
11.3. По мишени производится один выстрел. Вероятность попадания равна р. Рассматриваются две случайных величины: Х – число попаданий; Y – число промахов. Построить функцию распределения данной системы.
11.4. Задана функция совместного распределения системы случайных величин:
F (x, y) = (1 − e−4x ) (1 − e−2 y ) при x ≥ 0, y ≥ 0; F (x, y) = 0 в осталь-
ных случаях. Найти плотность совместного распределения системы.
11.5. Задана плотность совместного распределения системы случайных величин
f (x, y) = |
20 |
. |
π 2 (16 + x2 )(25 + y2 ) |
Найти F (x, y).
72
11.6. Задана двумерная плотность вероятности системы
f (x, y) = C(R − x2 + y 2 ) для x2 + y2 ≤ R2 ; f (x, y) = 0 |
для |
x2 + y2 > R2 .Найти: а) постоянную С; б) вероятность |
попадания слу- |
чайной точки (Х, Y) в круг радиуса r = 0,5R с центром в начале коорди-
нат.
11.7. Задана двумерная плотность вероятности системы случайных величин
f (x, y) = |
C |
|
|
. |
|
(9 + x2 )(16 + y2 ) |
||
Найти постоянную С.
11.8. Имеются две независимые случайные величины Х и Y, подчиненные каждая показательному закону:
f (x) = ae−ax |
при x ≥ 0, |
f (x) = 0 |
при x < 0; |
1 |
|
1 |
|
f2 ( y) = be−by |
при y ≥ 0, |
f2 ( y) = 0 |
при y < 0. |
Написать выражения: а) плотности распределения системы (X, Y); б) функции распределения системы (X, Y).
11.9. Система случайных величин распределена по закону
f (x, y) = a . 1 + x2 + y2 + x2 y2
а) Найти коэффициент a. б) Установить, являются ли величины Х и Y зависимыми. в) Найти f1(x), f2 ( y). г) Найти вероятность попадания случайной точки в пределы квадрата: −1 ≤ x ≤1, −1 ≤ y ≤1.
11.10. Имеются независимые случайные величины Х и Y. Случайная величина Х распределена по нормальному закону с параметрами:
mX = 0, σ X =1/
2. Случайная величина Y распределена равномерно на
интервале (0; 1). Написать выражение для плотности совместного распределения f (x, y).
11.11. Имеется система случайных величин Х и Y. Случайная величина Х распределена по показательному закону
f (x) = ae−αx |
при x ≥ 0, |
f (x) = 0 при x < 0. |
||
1 |
|
|
1 |
|
Случайная величина Y имеет условный закон распределения |
||||
f2 ( y / x ) = xe− xy |
при y ≥ 0 , |
f2 ( y / x ) = 0 при y < 0. |
||
а) Написать плотность распределения |
f (x, y) системы. б) Найти плот- |
|||
ность распределения |
f2 ( y) случайной |
величины Y. Найти условную |
||
плотность f1 (x / y). |
|
|
|
|
11.12. Определить корреляционный момент и коэффициент корреляции случайных величин Х и Y, заданных законом совместного распределения
73
X |
-2 |
2 |
Y |
|
|
0 |
0,1 |
0 |
1 |
0,5 |
0,4 |
11.13. Определить корреляционный момент и коэффициент корреляции случайных величин Х и Y, заданных законом совместного распределения
X |
0 |
1 |
3 |
Y |
|
|
|
2 |
0,3 |
0,2 |
0,1 |
5 |
0,1 |
0,1 |
0,2 |
12. СТАТИСТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ
Статистическое исследование начинается со сбора данных. Для этого производится n опытов (наблюдений) и регистрируются их результаты. Если xi - значение исследуемой случайной величины Х, полученное i-м
опыте, то последовательность x1, x2 , x3 , ... , xn называют выборкой. Число
опытов n называется объемом выборки. Выборка является исходным материалом для всех дальнейших статистических выводов о случайной величине Х.
Если элементы выборки записать в порядке их возрастания, то полученная последовательность будет называться вариационным рядом. Разность между максимальным и минимальным элементами выборки назы-
вают размахом выборки.
Если в выборке объема n элемент xi встречается ni раз, то число ni называют частотой элемента xi , а последовательность пар (xi , ni ) - ста-
тистическим рядом. Обычно статистический ряд записывают в виде таблицы, первая строка которой содержит элементы xi , а вторая - их часто-
ты ni .
При большом объеме выборки ее элементы объединяют в группы (разряды), представляя результаты опытов в виде группированной выборки. Для этого весь интервал значений выборки разбивают на k частичных интервалов или разрядов; в зависимости от объема выборки число интервалов k берется от 6 до 20. Затем для каждого интервала [ai ;ai +1 ) подсчи-
тывают число mi значений выборки, попавших в этот интервал. Очередное значение xi относится к i-му интервалу, если ai ≤ xi < ai +1 .
74
Числа mi называются частотами. Результат этой группировки сводится
в таблицу (см. табл. 12.1). Первые три колонки этой таблицы и представляют группированную выборку.
Наряду с частотами одновременно подсчитываются и заносятся в таблицу представители интервалов, в качестве которых обычно берут
середины |
интервалов |
zi = (ai + ai +1) / 2, относительные |
частоты |
|||
pi * = mi / n и плотности относительных частот |
fi * = |
mi |
|
. Для |
||
n(ai +1 |
|
|||||
|
|
|
|
−ai ) |
||
контроля |
правильности |
вычислений следует |
проверить |
равенства |
||
m1 + m2 +... + mk = n и p1 * + p2 * + +... + pn * =1.
Статистической или эмпирической функцией распределения случай-
ной величины Х по имеющейся выборке называется функция F * (x), равная относительной частоте события {Х <х} , то есть F * (x) = nx / n, где nx - число значений в выборке, меньших x; n − объём выборки.
Гистограммой называется совокупность прямоугольников, основаниями которых служат частичные интервалы, а высоты равны соответствующим плотностям относительных частот. Если середины верхних сторон прямоугольников соединить ломаной линией, то полученная ломанная называется полигоном. Гистограмма и полигон могут служить некоторым приближением графика неизвестной плотности распределения f (x) случайной величины Х. Точность приближения возрастает с ростом
объема выборки и количества частичных интервалов.
Таблица 12.1
Группированная выборка
Номер |
Грани- |
Частота |
Предста- |
Относи- |
Плот- |
ин- |
цы ин- |
mi |
витель |
тельная- |
ность от- |
терва- |
тервала |
интер- |
частота |
носи- |
|
ла |
ai - ai+1 |
|
вала |
pi * |
тельной |
|
|
|
zi |
|
частоты |
|
|
|
|
fi * |
|
1. |
a1 − a2 |
m1 |
z1 |
p1 * |
f1 * |
2. |
a2 − a3 |
m2 |
z2 |
p2 * |
f2 * |
. . . |
. . . |
. . . |
. . . |
. . . |
. . . |
k. |
ak − ak +1 |
mk |
zk |
pk * |
fk * |
75
В некоторых случаях строят полигон абсолютных частот, представ-
ляющий собой ломаную, |
отрезки которой соединяют точки |
(x1,n1), (x2 ,n2 ), ..., (xk ,nk ), где |
xi - варианты выборки а ni - соответст- |
вующие им частоты. Он так же позволяет судить о предполагаемом законе распределения случайной величины Х.
Пример 1. Записать в виде вариационного и статистического рядов выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.
Решение. Объем выборки n = 15. Упорядочив элементы выборки по величине, получим вариационный ряд
2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10 .
Статистический ряд записывается в виде таблицы
xi |
2 |
3 |
4 |
5 |
7 |
10 |
ni |
3 |
1 |
2 |
3 |
4 |
2 |
Пример 2. Представить выборку из 55 наблюдений в виде группированной выборки, используя 7 интервалов равной длины. Построить гистограмму и полигон. Выборка:
17 19 23 18 21 15 16 13 20 18 15
20 14 20 16 14 20 19 15 19 16 19
15 22 21 12 10 21 18 14 14 17 16
13 19 18 20 24 16 20 19 17 18 18 21 17 19 17 13 17 11 18 19 19 17 .
Решение. Размах выборки 24 - 10= 14. Длина интервала 14/7=2. Результаты группировки сводим в табл.12.2.
10 |
12 |
14 |
16 |
18 |
20 |
22 |
24 |
х |
Рис. 12.1. Полигон и гистограмма выборки
76
Таблица 12.2
Группированная выборка
Номер |
Грани- |
Частота |
Предста- |
Относи- |
Плот- |
интер- |
цы ин- |
mi |
витель |
тельная |
ность от- |
вала |
тервала |
интер- |
частота |
носи- |
|
|
ai - ai+1 |
|
вала |
pi * |
тельной |
|
|
zi |
|
частоты |
|
|
|
|
|
fi * |
|
1. |
10 – 12 |
2 |
11 |
0,0364 |
0,0182 |
2. |
12 – 14 |
4 |
13 |
0,0727 |
0,0364 |
3. |
14 – 16 |
8 |
15 |
0,1455 |
0,0728 |
4. |
16 – 18 |
12 |
17 |
0,2182 |
0,1091 |
5. |
18 – 20 |
16 |
19 |
0,2909 |
0,1456 |
6. |
20 – 22 |
10 |
21 |
0,1818 |
0,0909 |
7. |
20 – 24 |
3 |
23 |
0,0545 |
0,0273 |
12.1. Записать эмпирическую функцию распределения для выборки, представленной статистическим рядом.
а) |
xi |
15 |
16 |
17 |
18 |
19 |
|
|
|
ni |
1 |
4 |
5 |
4 |
2 |
|
|
б) |
|
|
|
|
|
|
|
|
xi |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
|
ni |
1 |
3 |
4 |
6 |
5 |
2 |
1 |
12.2. Построить полигон и гистограмму для группированной выбор-
ки:
77
а)
|
Гра- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ницы |
|
10-20 |
20-30 |
30-40 |
40-50 |
50-60 |
|
60-70 |
|
70-80 |
|||||||||
|
ин- |
|
|
|
||||||||||||||||
|
терва- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
лов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Часто- |
|
1 |
|
2 |
|
7 |
|
18 |
|
12 |
|
8 |
|
|
2 |
|
|||
|
ты mi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
б |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Грани- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
цы ин- |
5-7 |
7-9 |
9-11 |
|
11-13 |
13-15 |
15-17 |
|
||||||||||
|
|
терва- |
|
|
||||||||||||||||
|
|
лов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
Часто- |
8 |
|
14 |
40 |
|
26 |
|
6 |
|
|
4 |
|
|
|||||
|
|
ты mi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12.3. Время решения контрольной работы студентами (в минутах): 38 60 41 51 33 42 45 21 53 60 68 52 47 46 49 49 14 57 54 59 77 47 28 48 58 32 42 58 61 30 61 35 47 72 41 45 44 55 30 40
67 65 39 48 43 60 54 42 59 50
Найти размах выборки, число и длину равных интервалов, если первый интервал 14 - 23. Составить группированную выборку, построить гистограмму и полигон.
12.4. Время работы компьютерного класса в день (в часах):
13,4 |
14,7 |
15,2 |
15,1 |
13,0 |
8,8 |
14,0 |
17,9 |
15,1 |
16,5 |
16,6 |
14,2 |
16,3 |
14,6 |
11,7 |
16,4 |
15,1 |
17,6 |
14,1 |
18,8 |
11,6 |
13,9 |
18,0 |
12,4 |
17,2 |
14,5 |
16,3 |
13,7 |
15,5 |
16,2 |
8,4 |
14,7 |
15,4 |
11,3 |
10,7 |
16,9 |
15,8 |
16,1 |
12,3 |
14,0 |
17,7 |
14,7 |
16,2 |
17,1 |
Построить статистическую функцию распределения группированной выборки, если ее первый интервал 8,4 - 10,4 и все интервалы равны.
12.5. Построить полигон частот по данному распределению выборки:
а)
xi |
2 |
3 |
5 |
6 |
ni |
10 |
15 |
5 |
20 |
|
|
|
|
|
78 |
|
б) |
|
|
|
|
|
|
|
xi |
15 |
20 |
25 |
30 |
35 |
|
ni |
10 |
15 |
30 |
20 |
25 |
13. СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ
Случайная величина Х характеризуется целым рядом числовых параметров: математическим ожиданием, дисперсией, модой, медианой и т.д. Эти параметры называют параметрами генеральной совокупности.
Их приближенные значения можно вычислить на основе выборочных данных. Приближенное значение параметра, вычисленное на основе выборочных данных, называется его статистической оценкой. Оценка параметра обычно обозначается символом тильдой (~) наверху.
Для оценки математического ожидания применяется выборочное
среднее ~ mX
~ |
|
1 |
n |
|
mX |
= |
|
∑ xi . |
(13.1) |
|
||||
|
|
n i=1 |
|
|
Для группированной выборки вместо (13.1) используется следующая формула
~ |
|
1 |
k |
|
mX |
= |
|
∑ zi mi , |
(13.2) |
|
||||
|
|
n i=1 |
|
|
которую можно получить из предыдущей, если считать все mi значений выборки, попавших в i-й интервал, равными представителю zi этого ин-
тервала (k - число интервалов).
Для оценки дисперсии по выборке используется формула
~ |
n |
1 |
n |
2 |
~ |
|
2 |
|
|
||
D[ X ] = |
|
|
|
|
∑ xi |
− (mX |
) |
|
. |
(13.3) |
|
n − 1 |
|
|
|||||||||
|
n i=1 |
|
|
|
|
|
|
||||
В случае группированной выборки используется оценка
~ |
n |
1 |
k |
2 |
|
~ |
|
2 |
|
|
||
D[ X ] = |
|
|
|
|
∑ zi |
mi |
− (mX |
) |
|
. |
(13.4) |
|
n − 1 |
|
|
||||||||||
|
n i=1 |
|
|
|
|
|
|
|
||||
Отметим, что при больших n коэффициент n/(n-1) в выражениях (13.3) и (13.4) близок к единице, и его можно опустить.
В качестве оценки среднеквадратического отклонения используется
~ |
~ |
σ X = |
D[ X ] . |
Оценкой моды d X унимодального (одновершинного) распределения
является элемент выборки, встречающийся с наибольшей частотой. Оценкой медианы hX называют число, которое делит вариационный
ряд на две части, содержащие равное число элементов. Если объем вы-
79
борки n - нечетное число (т.е. n = 2k+1), то |
~ |
= xk +1 , т.е. является эле- |
hX |
ментом вариационного ряда со средним номером. Если же n = 2k , то
~ |
= 0,5(xk + xk +1 ) . |
hX |
Оценки начальных и центральных моментов l-го порядка вычисляются по формулам
~ |
|
1 |
n |
l |
|
~ |
|
1 |
n |
~ |
l |
|
αl |
= |
|
∑ xi |
, |
µl |
= |
|
∑(xi |
− mX |
) |
, l = 1,2,3,... |
|
|
|
|||||||||||
|
|
n i=1 |
|
|
|
|
n i=1 |
|
|
|
||
По группированной выборке оценки моментов вычисляются по формулам
~ |
|
1 |
k |
l |
|
~ |
|
1 |
k |
~ |
l |
|
αl |
= |
|
∑ zi |
mi , |
µl |
= |
|
∑(xi |
− mx |
) |
mi , l = 1,2,3,... |
|
|
|
|||||||||||
|
|
n i=1 |
|
|
|
|
n i=1 |
|
|
|
||
Форма распределения случайной величины Х характеризуется коэффициентами асимметрии и эксцесса, оценки которых вычисляются по формулам
~ |
|
~ |
|
|
~ |
|
|
~ |
|
|
|||
= |
|
|
3 |
|
|
= |
|
|
4 |
− 3 . |
|||
A |
|
|
, |
E |
|
|
|
||||||
~ 3 |
X |
~ 4 |
|||||||||||
X |
|
|
|
|
|
||||||||
|
|
σ X |
|
|
|
|
σ X |
|
|||||
Пример 1. Определить выборочные среднее, дисперсию, моду и ме-
диану для выборки: 5, 6, 8, 2, 3, 1, 4, 1 .
Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4, 5, 6, 8. Выборочное среднее находим по формуле (13.1).
~
mX = 1/8 (1+1+2+3+4+5+6+8) = 3,75.
Для расчета выборочной дисперсии воспользуемся формулой (13.3).
~ |
8 |
|
2 |
|
|
D[Х ]= |
|
|
( 1/8 (1+1+4+9+16+25+36+64) - 3,75 |
|
) = 6,21 . |
7 |
|
||||
|
|
|
|
||
Все элементы входят в выборку по одному разу, кроме 1, следовательно,
выборочная мода |
~ |
|
|
|
|
|
|
~ |
|
|
||||||||
d X = 1. Так как n = 8, то медиана hX = 0,57 (3+4) = |
||||||||||||||||||
=3,5. |
|
|
|
~ |
|
|
~ |
~ |
~ |
|
|
|
|
|||||
Ответ: |
|
|
= 3,5 . |
|
|
|||||||||||||
mX = 3,75; |
D[Х ]= |
6 ,21; d X |
= 1; hX |
|
|
|||||||||||||
Пример 2. Найти выборочные среднее и дисперсию для группиро- |
||||||||||||||||||
ванной выборки: |
|
|
|
|
|
|
|
|
|
|
|
|||||||
Границы |
|
|
34-36 |
|
36-38 |
|
38-40 |
|
40-42 |
|
42-44 |
44-46 |
|
|||||
интервалов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Частоты mi |
|
|
2 |
|
|
3 |
|
30 |
|
40 |
|
20 |
5 |
|
||||
Решение. Объем выборки равен 100. |
По формуле (13.2) находим |
|||||||||||||||||
~ |
= |
1 |
|
(35 2 + 37 |
3 + 39 30 + 41 40 + 43 20 + 45 5) = 40,76. |
|||||||||||||
mX |
|
|
|
|||||||||||||||
100 |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
80
Для вычисления выборочной дисперсии воспользуемся уже формулой
(13.4)
~ |
= |
100 |
( |
1 |
(352 2 + 372 3 + 392 |
30 + 412 |
40 + 432 20 + |
||||
DX |
|
|
|
|
|
||||||
99 |
|
100 |
|||||||||
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
+ 452 5) − 40,762 ) = 4,0. |
|
||
Ответ: |
~ |
|
|
|
~ |
|
|
||||
mX = 40,76; |
D [X] = 4,0. |
|
|
||||||||
В задачах 13.1-13.3 вычислить выборочные среднее, дисперсию, моду и медиану выборок.
13.1.1; 2; 3; 4; 5; 5; 9.
13.2.7; 3; 3; 6; 4; 5; 1; 2; 1; 3.
13.3.3,1; 3,0; 1,5; 1,8; 2,5; 3,1; 2,4; 2,8; 1,3.
Вычислить выборочные средние и дисперсии группированных выборок:
13.4.
|
Границы |
5-7 |
7-9 |
9-11 |
11-13 |
13-15 |
15-17 |
|
интервалов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Частоты mi |
8 |
14 |
40 |
26 |
6 |
4 |
13.5. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Границы |
10-14 |
14-18 |
18-22 |
22-26 |
26-30 |
30-34 |
|
интервалов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Частоты mi |
1 |
5 |
10 |
20 |
18 |
3 |
13.6. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Границы |
2-4 |
4-6 |
6-8 |
8-10 |
10-12 |
12-14 |
|
интервалов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Частоты |
10 |
20 |
10 |
8 |
4 |
1 |
|
m i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13.7. Как изменятся выборочные среднее, мода и дисперсия выборки, если каждый член выборки:
а) увеличить (уменьшить) на число d; б) увеличить (уменьшить) в k раз.
13.8. Студентам был предложен тест из 24 вопросов. По числу правильных ответов студенты распределились следующим образом:
