Пример решения контрольной работы №6
Пример 1. Задана выборка X. Для выборки X необходимо:
1) составить интервальный ряд распределения;
2) найти выборочную среднюю, выборочную дисперсию и выборочное среднее
квадратическое отклонение;
3) найти эмпирическую функцию распределения и построить ее график;
4) построить гистограмму относительных частот;
5) проверить гипотезу о нормальном распределении генеральной совокупности с
помощью критерия Пирсона при уровне значимости 0,05;
6) построить график теоретической плотности вероятности;
7) найти доверительный интервал для оценки неизвестного математического ожидания
генеральной совокупности с надежностью 0,95;
РЕШЕНИЕ.
Определяем объем выборки: n = 100.
1. По значениям выборки X составляем вариационный ряд (табл. 1).
Таблица 1
Определяем минимальное и максимальное значения выборки X: xmin=41, xmax=82.
Длину интервала находим по формуле Стерджеса
hx
x max− x min
1 3,332 lg n
.
Вычисляем: hx = (82 – 41)/(1 + 3,332lg100) = 5,3497. Округляем полученное значение
до ближайшего целого числа. Принимаем длину интервала hx = 6. За начало первого
интервала рекомендуется принимать значение xнач= xmin – hx /2. В данном случае xнач= 38.
Составляем интервальный ряд распределения. Варианту, значение которой совпадает с
нижней границей интервала, включаем в i-й интервал, а варианту, значение которой
44
48 |
70 |
49 |
52 |
68 |
61 |
62 |
51 |
61 |
75 |
64 |
61 |
55 |
51 |
53 |
59 |
47 |
69 |
66 |
53 |
68 |
61 |
57 |
60 |
51 |
65 |
48 |
48 |
70 |
76 |
64 |
59 |
69 |
61 |
41 |
45 |
66 |
56 |
61 |
56 |
65 |
49 |
51 |
60 |
69 |
53 |
49 |
74 |
54 |
59 |
65 |
65 |
44 |
64 |
65 |
74 |
76 |
65 |
67 |
65 |
60 |
57 |
68 |
55 |
64 |
67 |
61 |
69 |
56 |
56 |
61 |
68 |
82 |
54 |
53 |
69 |
48 |
60 |
43 |
62 |
52 |
71 |
67 |
57 |
56 |
51 |
72 |
48 |
73 |
61 |
55 |
64 |
55 |
74 |
49 |
57 |
60 |
66 |
61 |
62 |
xi |
41 |
43 |
44 |
45 |
47 |
48 |
49 |
51 |
52 |
53 |
54 |
55 |
56 |
57 |
59 |
60 |
61 |
mi |
1 |
1 |
1 |
1 |
1 |
5 |
4 |
5 |
2 |
4 |
2 |
4 |
5 |
4 |
3 |
5 |
10 |
xi |
62 |
64 |
65 |
66 |
67 |
68 |
69 |
70 |
71 |
72 |
73 |
74 |
75 |
76 |
82 |
mi |
3 |
5 |
7 |
3 |
3 |
4 |
5 |
2 |
1 |
1 |
1 |
3 |
1 |
2 |
1 |
совпадает с верхней границей интервала, включаем в следующий (i+1)-й интервал.
Данные заносим в расчетную таблицу (табл. 2).
Таблица 2
Накопленные
частости
для
каждого
интервала
находятся
последовательным
суммированием относительных частот всех предшествующих интервалов, включая
данный.
2. Находим выборочную среднюю, выборочную дисперсию и выборочное среднее
квадратическое отклонение для выборки X.
n 100
= 60,44.
Dв
n
2
=
(41 - 60,44) 2 ·2 (47 - 60,44) 2 ·12 (53 - 60,44) 2 ·17
100
+
+
(59 - 60,44) 2 ·27 (65 - 60,44) 2 ·21 (71 - 60,44) 2 ·14 (77 - 60,44) 2 ·6
100
+
(83 - 60,44) 2 ·1
100
=
80,7264.
в Dв = 80,7264 = 8,98.
3. Записываем эмпирическую функцию распределения (по значениям столбца "wiнак"
табл. 2).
⎧0 x≤ 41
⎪
⎪0,14 47 x≤ 53
⎪
⎪
⎪
⎪0,93 71 x≤ 77
⎪0,99 77 x≤ 83
⎪1 x 83
45
Начало Конец интервала интервала xi xi+1 |
Середина интервала ~ x i |
Частота интервала mi |
Относитель ная частота wi=mi/n |
Плотность частоты wi/hx |
Накопленны е частости нак wi |
38 44 |
41 |
2 |
0,02 |
0,0333 |
0,02 |
44 50 |
47 |
12 |
0,12 |
0,0200 |
0,14 |
50 56 |
53 |
17 |
0,17 |
0,0283 |
0,31 |
56 62 |
59 |
27 |
0,27 |
0,0450 |
0,58 |
62 68 |
65 |
21 |
0,21 |
0,0350 |
0,79 |
68 74 |
71 |
14 |
0,14 |
0,0233 |
0,93 |
74 80 |
77 |
6 |
0,06 |
0,0100 |
0,99 |
80 86 |
83 |
1 |
0,01 |
0,0017 |
1,00 |
∑ ~i mi 41·2 47·12 53·17 59·27 65·21 71·14 77·6 83·1
x в =
∑~i− x в mi
x
⎪0,02 41 x≤ 47
⎪0,31 53 x≤ 59
F∗x⎨0,58 59 x≤ 65
⎪0,79 65 x≤ 71
⎩
Строим график эмпирической функции распределения (рис.1)
F 1,2
1
0,8
0,6
0,4
0,2
0
32
38
44
50
56
62
68
74
80
86
92
Рис. 1
4. По интервальному ряду распределения (значения столбца "wx /hx" табл. 2) строим
гистограмму относительных частот для выборки X (рис.2).
w x
0,05
0,04
0,03
0,02
0,01
0
32
38
44
50
56
62
68
74
80
86
92
Рис. 2
5. Проверяем гипотезу о нормальном законе распределения случайной величины X.
Теоретические (выравнивающие) частоты находятся по формуле
miT = n [ Ф(zi+1) – Ф(zi)]
где Ф(z) - значения функции Лапласа (Приложение 2),
x− x в
в
,
x− xв
в
.
Составляем расчетную таблицу (табл. 3)
Таблица 3
46
xi |
xi+1 |
zi |
zi+1 |
Ф(zi) |
Ф(zi+1) |
pi= Ф(zi+1) - |
T mi = npi |
38 |
44 |
−∞ |
-1,83 |
-0,5 |
- |
0,0336 |
3,36 |
44 |
50 |
-1,83 |
-1,16 |
- |
- |
0,0894 |
8,94 |
50 |
56 |
-1,16 |
-0,49 |
- |
- |
0,1891 |
18,91 |
56 |
62 |
-0,49 |
0,17 |
- |
0,0675 |
0,2554 |
25,54 |
62 |
68 |
0,17 |
0,84 |
0,0675 |
0,2995 |
0,2320 |
23,20 |
68 |
74 |
0,84 |
1,51 |
0,2995 |
0,4345 |
0,1350 |
13,50 |
74 |
80 |
1,51 |
2,18 |
0,4345 |
0,4854 |
0,0509 |
5,09 |
80 |
86 |
2,18 |
∞ |
0,4854 |
0,5 |
0,0146 |
1,46 |
|
|
|
|
|
|
Σ pi=1 |
Σ miT |
∗x
x
h x
x
z i i
z i1 i1
Получаем таблицу для эмпирических и теоретических частот (табл. 4)
Таблица 4
Проверяем гипотезу о нормальном распределении выборки X с помощью критерия
Пирсона
Объединяем малочисленные
теоретические частоты (табл. 5).
эмпирические
(mi<5)
и
соответствующие
им
Таблица 5
Вычисляем наблюдаемое значение критерия Пирсона
2
m T 12,30 18,91 25,54 23,20
+
(14 - 13,50) 2
13,50
+
(7 - 6,55) 2
6,55
= 0,71.
По таблице критических точек распределения χ2 по заданному уровню значимости α =
0,05 и числу степеней свободы k = s – 3 (s – число интервалов, оставшихся после
объединения малочисленных частот) находим критическую точку правосторонней
критической области (Приложение 3)
кр2 (0,05; 3)=7,8.
2
величины принимаем.
6. Теоретическая плотность нормального распределения определяется формулой
fx
1
x 2
e
−
x− a x2
2 x2
,
где a x x в , x в
Таким образом, теоретическая плотность случайной величины X запишется в виде
fx
1
8,98 2
e
−
x−60, 44
161,3
2
.
Для построения графика плотности распределения составляем расчетную таблицу
(табл. 6).
Таблица 6
График теоретической плотности строим на одном рисунке с гистограммой (рис.2).
47
x |
ax – 3σx |
ax – 2σx |
ax – σx |
ax |
ax + σx |
ax + 2 σx |
ax + 3 σx |
f(x) |
0,0005 |
0,006 |
0,0269 |
0,0444 |
0,0269 |
0,006 |
0,0005 |
mi |
2 |
12 |
17 |
27 |
21 |
14 |
6 |
1 |
T mi |
3,36 |
8,94 |
18,91 |
25,54 |
23,20 |
13,50 |
5,09 |
1,46 |
mi |
14 |
17 |
27 |
21 |
14 |
7 |
T mi |
12,30 |
18,91 |
25,54 |
23,20 |
13,50 |
6,55 |
i
Так как набл < кр2 , то гипотезу о нормальном распределении исследуемой случайной
7. Для оценки неизвестного математического ожидания при неизвестном среднем
квадратическом отклонении генеральной совокупности служит интервал
,
n− 1 n− 1
где tγ = t(1 – γ; n – 1) – критическая точка распределения Стьюдента (Приложение 4). По
условию γ = 0,95; n = 100. Отсюда tγ = t(0,05; 99) = 1,984.
Находим искомый интервал
60,44 – 1,984 8,98 < ax < 60,44 + 1,984 8,98 ,
99 99
или окончательно
58,66 < ax < 62,22.
Пример 2. Данные наблюдений над двумерной случайной величиной XY представлены в
корреляционной таблице. Найти выборочное уравнение прямой линии регрессии Y на X
y x− y rв
РЕШЕНИЕ.
Находим выборочные средние признаков X и Y:
x в
∑ n x x i
n
5⋅ 6 13⋅ 9 23⋅12 27⋅15 23⋅18 9⋅ 21
100
1431
100
= 14,31.
y в
∑ n y y i
n
6⋅ 2 14⋅ 4 41⋅ 6 29⋅ 8 10⋅ 10
100
646
100
= 6,46.
Находим вспомогательные величины x 2 и y 2 (начальные моменты 2-го порядка):
2
n
2
5⋅ 36 13⋅ 81 23⋅ 144 27⋅ 225 23⋅ 324 9⋅ 441
100
= 220,41.
2
n
2
6⋅ 4 14⋅ 16 41⋅ 36 29⋅ 81 10⋅ 100
100
= 45,8.
Находим выборочные средние квадратические отклонения:
2
2
48
y\x 6 |
9 |
12 |
15 |
18 |
21 |
ny |
2 2 |
3 |
1 |
- |
- |
- |
6 |
4 3 |
6 |
4 |
1 |
- |
- |
14 |
6 - |
4 |
13 |
14 |
10 |
- |
41 |
8 - |
- |
5 |
10 |
8 |
6 |
29 |
10 - |
- |
- |
2 |
5 |
3 |
10 |
nx 5 |
13 |
23 |
27 |
23 |
9 |
n = 100 |
x в− t
a x x в t
x− x .
x
∑ n x x i
y
∑ n y y i
Выборочный коэффициент корреляции находится по формуле
.
Предварительно находим значение величины∑ n xy xy :
∑ n xy xy 2⋅ 6⋅ 2 3⋅ 9⋅ 2 1⋅ 12⋅ 2 3⋅ 6⋅ 4 6⋅ 9⋅ 4 4⋅ 12⋅ 4 1⋅ 15⋅ 4 4⋅ 9⋅ 6 +
+ 13⋅ 12⋅ 6 14⋅ 15⋅ 610⋅ 18⋅ 6 5⋅ 12⋅ 8 10⋅ 15⋅ 8 8⋅ 18⋅ 8 6⋅ 21⋅ 8 +
+ 2⋅ 15⋅ 10 5⋅ 18⋅ 10 3⋅ 21⋅ 10 = 9804.
Вычисляем значение выборочного коэффициента корреляции
= 0,702.
100⋅ 3,954⋅ 2,016
Находим искомое уравнение прямой линии регрессии Y на X
y x− 6,46 0,702
2,016
3,954
x− 14,31 ,
или окончательно
y x = 0,358x – 1,337.
49
rв
∑ n xy xy− n⋅ x⋅ y
n x y
rв
9804− 100⋅14,31⋅ 6,46