Тер.вер(решение задач)
.pdfЗадача 117. Дана таблица:
X |
[1; 3) |
[3; 5) |
[5; 7) |
[7; 9) |
[9; 11) |
[11; 13) |
[13; 15] |
n |
7 |
25 |
38 |
58 |
40 |
24 |
8 |
Задание:
1)построить гистограмму частот. Найти несмещенные оценки генеральной средней и генеральной дисперсии;
2)используя результаты пункта 1, обосновать гипотезу о нормальном распределении генеральной совокупности. Записать выражение соответствующего теоретического распределения;
3)вычислить для всех интервалов значений X соответствующие вероятности и теоретические частоты, используя критерий Пирсона (с уровнем значимости α = 0,1). Проверить обоснованную выше гипотезу;
4)в предположении, что выборка извлечена из нормально распределенной генеральной совокупности, найти доверительный интервал, заключающий генеральную среднюю признака с надежностью γ = 0,98.
Решение.
1) Объем выборки n = ∑ni = 200 . Величины всех интервалов одинаковы и равны h = 2 .
i
Для построения гистограммы частот составим таблицу.
Номер |
|
|
Середина |
|
Сумма частот |
Относительная |
Плотность |
||||||||
Частичный |
|
относительной |
|||||||||||||
интерва |
интервала |
|
вариант |
частота |
частоты |
||||||||||
ла |
интервал |
~ |
|
xi + xi+1 |
|
частичного |
w |
= |
ni |
|
wi |
||||
|
xi - хi+1 |
xi |
= |
|
|
интервала ni |
|
|
|
|
|||||
|
|
|
|
|
|
||||||||||
i |
|
|
|
|
2 |
|
i |
|
|
n |
|
|
|
||
|
|
|
|
|
|
|
|
|
h |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|||||
1 |
1 |
– 3 |
|
|
2 |
|
7 |
0,035 |
|
0,0175 |
|||||
2 |
3 |
– 5 |
|
|
4 |
|
25 |
0,125 |
|
0,0625 |
|||||
3 |
5 |
– 7 |
|
|
6 |
|
38 |
0,19 |
|
|
0,095 |
||||
4 |
7 |
– 9 |
|
|
8 |
|
58 |
0,29 |
|
|
0,145 |
||||
5 |
9 – 11 |
|
|
10 |
|
40 |
|
0,2 |
|
|
|
0,1 |
|||
6 |
11 |
– 13 |
|
|
12 |
|
24 |
0,12 |
|
|
0,06 |
||||
7 |
13 |
– 15 |
|
|
14 |
|
8 |
0,04 |
|
|
0,02 |
Гистограмма частот имеет следующий вид:
Несмещенные оценки генеральной средней |
xB |
и генеральной дисперсии s2 случайной |
||||
|
1 |
m |
|
1 |
8 |
|
величины Х найдем по формулам: a = |
∑xi ni , |
s2 = |
∑(xi − a)2 ni , где xi – середина i-го |
|||
|
|
|||||
|
n i=1 |
|
n −1 i=1 |
интервала; m = 7. Подставив данные из последней таблицы в расчетные формулы, получим:
|
1 |
m |
|
|
|
1 |
|
|
|
|
|
|
|
|
1606 |
|
|
|
|
|
a = |
∑xi ni |
= |
|
|
(2 7 + 4 25 +K+14 8) = |
= 8,03 ; |
|
|
|
|||||||||||
|
|
200 |
|
200 |
|
|
|
|||||||||||||
|
n i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
1 |
8 |
|
|
|
|
|
|
1 |
|
|
|
|
|
|
1635,82 |
|
|
s2 = |
|
∑(xi |
− a)2 ni |
= |
[(2 −8,03)2 7 +K+ (14 −8,03)2 8] = |
= 8,2202 . |
||||||||||||||
|
|
999 |
199 |
|||||||||||||||||
|
|
n −1 i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Определим также среднеее квадратическое отклонение s случайной величины Х по |
||||||||||||||||||||
формуле: s = |
s2 |
= |
|
8,2202 = 2,8671 . |
|
|
|
|
|
|
|
|
||||||||
2) Рассмотрение полученной гистограммы частот позволяет предположить гипотезу о |
||||||||||||||||||||
нормальном |
распределении |
генеральной |
совокупности. |
Выражение |
плотности |
|||||||||||||||
соответствующего теоретического распределения имеет вид |
|
|
|
|||||||||||||||||
f (x) = |
1 |
e− |
( x−a)2 |
= |
|
1 |
|
e− |
( x−8,03)2 |
|
|
|
|
|
|
|||||
|
|
|
|
5,7342 . |
|
|
|
|
|
|||||||||||
2s |
|
2π |
|
|
|
|
|
|||||||||||||
|
|
|
s |
2π |
|
|
|
|
|
2,8671 |
|
|
|
|
|
|
|
|
3) Проверить предложенную выше гипотезу о нормальности распределения, используя критерий Пирсона (с уровнем значимости α = 0,1).
Для расчета вероятностей pi попадания случайной величины X в интервалы [xi , xi+1 ]
используем функцию Лапласа в соответствии со свойством нормального распределения:
pi (xi ≤ X ≤ xi+1 ) = |
1 |
|
x |
i+1 |
− a |
x |
i |
− a |
|
1 |
|
x |
i+1 |
−8,03 |
|
x |
i |
−8,03 |
|
||||||||||||||
|
Φ |
|
|
|
|
− Φ |
|
|
|
|
≈ |
|
Φ |
|
|
|
|
−Φ |
|
|
. |
||||||||||||
2 |
|
|
s |
|
|
|
|
s |
|
2 |
|
2,867 |
|
2,867 |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
Например, p1 (1 ≤ X ≤ |
|
|
1 |
|
3 −8,03 |
|
|
|
1 −8,03 |
= |
1 |
[Φ(−1,7544) |
− Φ(−2,452)]= |
||||||||||||||||||||
3) = |
|
|
Φ |
|
|
|
|
|
|
− Φ |
|
|
|
|
|
||||||||||||||||||
2 |
|
2,867 |
|
|
2,867 |
2 |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
= |
1 |
(−0,9206 + 0,9858) = 0,0326 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
и, соответствующая первому интервалу теоретическая частота np1 = 200 0,0326 = 6,515 и т.д.
Для определения расчетной статистики ψрасч удобно составить таблицу:
№№ |
[x |
i |
, x |
i+1 |
] |
ni |
pi |
npi |
(n |
−np )2 |
|
(ni − npi )2 |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
i |
i |
|
npi |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
1 |
|
1 |
– 3 |
|
7 |
0,0326 |
6,5149 |
0,2353 |
0,0361 |
|
||||
2 |
|
3 |
– 5 |
|
25 |
0,1056 |
21,1225 |
15,0354 |
0,7118 |
|
||||
3 |
|
5 |
– 7 |
|
38 |
0,2144 |
42,8822 |
23,8358 |
0,5558 |
|
||||
4 |
|
7 |
– 9 |
|
58 |
0,2727 |
54,5487 |
11,9114 |
0,2184 |
|
||||
5 |
9 – 11 |
|
40 |
0,2174 |
43,4876 |
12,1633 |
0,2797 |
|
||||||
6 |
11 |
– 13 |
|
24 |
0,1086 |
21,7233 |
5,1832 |
0,2386 |
|
|||||
7 |
13 |
– 15 |
|
8 |
0,0340 |
6,7951 |
1,4518 |
0,2137 |
|
|||||
Всего |
|
|
|
− |
|
|
200 |
0,9854 |
197,0743 |
|
− |
ψрасч = 2,2541 |
Итак, расчетное значение статистики ψ расч = 2,254 . Поскольку число интервалов m = 7, а
нормальный закон распределения определяется S = 2 параметрами, то число степеней свободы k = m − S −1 = 7 −2 −1 = 4 . Соответствующие верхнее и нижнее критические значения статистики определим из статистической таблицы:
ψкр.в |
= χ20,1 |
(4) = χ0,052 (4) = 9,488 , ψкр.н |
= χ2 |
0,1 (4) = χ0,952 (4) = 0,711 . |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
1− |
|
|
|
2 |
|
|
|
|
|
|
2 |
|
||||
|
|
|
|
|
|
|
|
|
|||||
Т.к. |
χ02,95 (4) ≤ ψрасч ≤ χ02,05 (4) , гипотеза о выбранном теоретическом нормальном законе с |
||||||||||||
параметрами a = 8,03 ; s = 2,867 согласуется с опытными данными. |
|||||||||||||
4) Доверительный интервал для генеральной средней равен |
|||||||||||||
a − |
≤ |
|
0 |
|
≤ a + , |
|
|
|
|
|
|
||
x |
|
|
|
|
|
|
|
||||||
где = tγ ,n−1s |
− предельная ошибка малой выборки. |
||||||||||||
|
n −1 |
|
|
|
|
|
|
|
|
|
|
||
Подставив исходные данные, получим: |
|
|
|
||||||||||
= |
t1−γ,n−1s |
= |
t0,02;199 2,867 |
= |
2,345 2,867 |
= 0,4766 . |
|||||||
n −1 |
199 |
14,107 |
|
||||||||||
|
|
|
|
|
|
|
Отсюда доверительный интервал, заключающий генеральную среднюю признака с надежностью γ = 0,98, равен
8,03 −0,477 ≤ x0 ≤ 8,03 + 0,477 , или 7,553 ≤ x0 ≤ 8,03 +8,507 .
Задача 118. В таблице указаны курс акций E и эффективность рынка F на протяжении ряда кварталов. Найти регрессию курса акций на эффективность рынка, а также оценки характеристик акций: «собственной» вариации v и a, r (эффективность безрисковых вложений равна 6).
E |
25 |
24 |
24 |
25 |
26 |
26 |
26 |
25 |
24 |
25 |
F |
10 |
9 |
9 |
10 |
10 |
11 |
12 |
10 |
9 |
10 |
Решение.
Уравнение регрессии курса акций на эффективность рынка имеет вид
F = b0 +b1 E .
Поскольку по условию эффективность безрисковых вложений равна 6, то b0 = 6 . Отсюда искомое уравнение преобразуем к виду
F = 6 +b1 E .
Минимизируем сумму квадратов ошибок:
|
10 |
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Q(b1 ) = ∑ei2 = ∑(Fi −6 −b1 Ei )2 . |
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
i=1 |
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Отсюда коэффициент b1 определим из условия Q′ = 0 : |
|
|
|
|
|
|
|
|
|||||||||||
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Q′(b1 ) = −2∑Ei (Fi −6 −b1 Ei ) = 0 , |
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
откуда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
10 |
|
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
b1 ∑Ei2 = ∑Ei Fi −6∑Ei , |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
i=1 |
|
i=1 |
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
b = |
∑Ei Ei −6∑Ei |
|
= |
2506 |
−6 250 |
= 0,161. |
|
|
|
|
|
|
|
|
|
||||
i=1 |
i=1 |
|
|
|
|
|
|
|
|
|
|
||||||||
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
1 |
|
|
|
|
|
6256 |
|
|
|
|
|
|
|
|
|
|
|||
|
|
∑Ei2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вспомогательные расчеты приведены в таблице: |
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
№№ |
F |
|
|
E |
E 2 |
F E |
(F − |
F |
)2 |
(E |
i |
− |
E |
)2 |
|||
|
|
|
|
|
|
i |
|
|
i |
i |
i i |
i |
|
|
|
|
|||
|
|
1 |
|
|
10 |
|
|
25 |
625 |
250 |
0 |
|
|
|
|
0 |
|
|
|
|
|
2 |
|
|
9 |
|
|
24 |
576 |
216 |
1 |
|
|
|
|
1 |
|
|
|
|
|
3 |
|
|
9 |
|
|
24 |
576 |
216 |
1 |
|
|
|
|
1 |
|
|
|
|
|
4 |
|
|
10 |
|
|
25 |
625 |
250 |
0 |
|
|
|
|
0 |
|
|
|
|
|
5 |
|
|
10 |
|
|
26 |
676 |
260 |
0 |
|
|
|
|
1 |
|
|
|
|
|
6 |
|
|
11 |
|
|
26 |
676 |
286 |
1 |
|
|
|
|
1 |
|
|
|
|
|
7 |
|
|
12 |
|
|
26 |
676 |
312 |
4 |
|
|
|
|
1 |
|
|
|
|
|
8 |
|
|
10 |
|
|
25 |
625 |
250 |
0 |
|
|
|
|
0 |
|
|
|
|
|
9 |
|
|
9 |
|
|
24 |
576 |
216 |
1 |
|
|
|
|
1 |
|
|
|
|
|
10 |
|
|
10 |
|
|
25 |
625 |
250 |
0 |
|
|
|
|
0 |
|
|
|
|
|
Всего |
|
|
100 |
|
250 |
6256 |
2506 |
8 |
|
|
|
|
6 |
|
|
||
|
|
Среднее |
|
10 |
|
|
25 |
625,6 |
250,6 |
- |
|
|
|
|
- |
|
|
Определим оценки характеристик акций: «собственной» вариации v и a, r.
Средний курс акций равен
a = 1 ∑10 Ei = 25 . 10 i=1
Дисперсия курса акций равна
|
|
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s2 = |
∑Ei2 |
− a2 |
|
= |
6256 − 25 |
2 |
|
= 625,667 . |
|
|
|
|
|||||||
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
10 −1 |
|
|
9 |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Среднее квадратическое отклонение курса акций равно |
|
|
|||||||||||||||||
s = |
s2 |
= |
625,667 = 25,013 . |
|
|
|
|
|
|
||||||||||
Отсюда «собственная» вариация курса акций равна |
|
|
|
||||||||||||||||
v = |
s |
= |
|
25,013 |
=1,0005, или 100,1%. |
|
|
|
|
|
|||||||||
a |
|
25 |
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Коэффициент корреляции между курсом акций и эффективностью рынка равен |
|||||||||||||||||||
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
n |
|
|
|
r = |
|
|
∑(Ei − E)(Fi − F) |
|
|
|
∑Ei Fi − nEF |
|
|||||||||||
|
|
|
i=1 |
|
|
|
|
|
|
= |
|
|
i=1 |
|
= |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
n |
|
|
|
|
|
n |
|
|
|
|
n |
|
n |
|
|
|
|
|
∑(Ei − E)2 |
∑(Fi − |
F)2 |
|
∑(Ei |
− E)2 |
∑(Fi − F)2 |
||||||||||
|
|
|
i=1 |
|
|
|
|
i=1 |
|
|
|
i=1 |
i=1 |
|
= 2506 −10 25 10 = 0,866 . 8 6
Задача 119. Найдите степень корреляции между следующими парами значений x и y. Определите уравнение регрессии y = a +bx для каждого случая
а)
x |
2 |
3 |
4 |
5 |
6 |
y |
8 |
11 |
14 |
17 |
20 |
б)
x |
2 |
3 |
4 |
5 |
6 |
y |
10 |
8 |
8 |
5 |
4 |
в)
x |
2 |
3 |
4 |
5 |
6 |
y |
3 |
7 |
4 |
9 |
6 |
Для каждого из этих случаев с помощью уравнения регрессии определите значение y при x = 7 и прокомментируйте вероятную точность этих прогнозов.
Решение.
Коэффициенты регрессии a, b находим методом наименьших квадратов, решая систему линейных уравнений:
an +b∑xi = ∑yi ,a∑xi +b∑xi2 = ∑yi xi ,
где n = 5.
Решение данной системы имеет вид:
|
n∑xi yi − |
|
|
|
|
|
|
|
|
|
|
∑xi |
∑yi |
|
|||||
b = |
i |
|
i |
|
|
|
i |
|
, |
n∑xi2 − |
|
|
2 |
|
|||||
|
|
|
|
||||||
|
|
∑xi |
|
|
|||||
|
i |
|
|
|
i |
|
|
|
∑yi −b∑xi
a = |
i |
i |
. |
|
n |
||
|
|
|
Коэффициент корреляции между x и y равен:
|
|
|
∑xi2 |
|
|
2 |
|
|
sx |
|
− |
∑xi |
|
||
r = b |
= b |
i |
|
i |
|
. |
|
sy |
|
|
|
2 |
|||
|
|
∑yi2 |
|
|
|||
|
|
|
− |
∑yi |
|
||
|
|
|
i |
|
i |
|
|
Построим уравнение регрессии y = a +bx для каждого случая.
а) Вспомогательная таблица имеет вид:
|
|
|
|
№№ |
x |
y |
x2 |
|
y2 |
xy |
|
|
|
|
|
1 |
2 |
8 |
4 |
|
64 |
16 |
|
|
|
|
|
2 |
3 |
11 |
9 |
|
121 |
33 |
|
|
|
|
|
3 |
4 |
14 |
16 |
|
196 |
56 |
|
|
|
|
|
4 |
5 |
17 |
25 |
|
289 |
85 |
|
|
|
|
|
5 |
6 |
20 |
36 |
|
400 |
120 |
|
|
|
|
|
Всего |
20 |
70 |
90 |
|
1070 |
310 |
|
|
|
|
|
Среднее |
4 |
14 |
18 |
|
214 |
62 |
|
Отсюда, используя приведенные выше формулы, получим |
|
|
|||||||||
b = |
|
5 310 − 20 70 |
= 3 , |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
||||
|
|
5 90 − 202 |
|
|
|
|
|
|
|||
a = |
70 −3 20 |
= 2 . |
|
|
|
|
|
|
|
||
5 |
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
Уравнение регрессии имеет вид y = 2 +3x .
Коэффициент корреляции между x и y равен:
r = 3 |
90 − 202 |
|
=1. |
||
1070 |
−70 |
2 |
|||
|
|
Прогноз среднего значения y при x = 7 равен y(7) = 2 +3 7 = 23.
б) Вспомогательная таблица имеет вид:
|
|
|
№№ |
|
x |
y |
x2 |
y2 |
xy |
|
|
|
|
1 |
|
2 |
10 |
4 |
100 |
20 |
|
|
|
|
2 |
|
3 |
8 |
9 |
64 |
24 |
|
|
|
|
3 |
|
4 |
8 |
16 |
64 |
32 |
|
|
|
|
4 |
|
5 |
5 |
25 |
25 |
25 |
|
|
|
|
5 |
|
6 |
4 |
36 |
16 |
24 |
|
|
|
|
Всего |
|
20 |
35 |
90 |
269 |
125 |
|
|
|
|
Среднее |
|
4 |
7 |
18 |
53,8 |
25 |
|
Отсюда, используя приведенные выше формулы, получим: |
|
|||||||||
b = |
|
5 125 − 20 35 |
= −1,5 , |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|||
|
|
5 90 − 202 |
|
|
|
|
|
|||
a = |
35 +1,5 20 |
=13 . |
|
|
|
|
|
|
||
5 |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
Уравнение регрессии имеет вид y =13 −1,5x .
Коэффициент корреляции между x и y равен:
r = −1,5 |
90 |
− 202 |
= −0,968 . |
|
|
|
|
|
||
269 − 252 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|||
Прогноз среднего значения y при x = 7 равен y(7) =13 −1,5 7 = 2,5 . |
|
|||||||||
в) Вспомогательная таблица имеет вид: |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№№ |
x |
y |
x2 |
y2 |
|
xy |
|
|
|
|
|
1 |
2 |
3 |
4 |
9 |
|
6 |
|
|
|
|
2 |
3 |
7 |
9 |
49 |
|
21 |
|
|
|
|
3 |
4 |
4 |
16 |
16 |
|
16 |
|
|
|
|
4 |
5 |
9 |
25 |
81 |
|
45 |
|
|
|
|
5 |
6 |
6 |
36 |
36 |
|
36 |
|
|
|
Всего |
20 |
29 |
90 |
191 |
|
124 |
|
|
|
|
Среднее |
4 |
5,8 |
18 |
38,2 |
|
24,8 |
Отсюда, используя приведенные выше формулы, получим:
b = |
|
5 124 − 20 29 |
= 0,8 , |
||
|
5 90 − 202 |
||||
|
|
|
|||
a = |
29 −0,8 20 |
= 2,6 . |
|||
5 |
|||||
|
|
|
Уравнение регрессии имеет вид y = 0,8 + 2,6x .
Коэффициент корреляции между x и y равен:
r = −1,5 |
90 |
− 20 |
2 |
= 0,530 . |
|
191− 292 |
|||||
|
|
Прогноз среднего значения y при x = 7 равен y(7) = 0,8 + 2,6 7 = 8,2 .
Вслучае а) имеем линейную функциональную связь. Поэтому точность прогноза здесь 100%-ная. Такие связи в регрессионном анализе не рассматриваются.
Вслучае б) имеем значимую линейную регрессионную зависимость.
Вслучае в) коэффициент корреляции мал, поэтому связь между величинами статистически не значимая.
Задача 120. Крупный коммерческий банк заказал маркетинговое исследование по выявлению эффекта «премирования» как стимула для открытия счета в банке. Для проверки случайным образом было отобрано 200 «премированных» посетителей и 200 «непримированных». В результате выяснилось, что 89% посетителей, которым предлагалась премия, и 79% посетителей, которым не предлагалась премия, открыли счет в банке в течение 6 месяцев.
Используя эти данные, проверьте гипотезу о том, что доля «премированных» посетителей, открывших счет в банке, существенно отличается от удельного веса «непремированных» посетителей, открывших счет в банке. Принять уровень значимости α = 0,05 .
Решение.
Проверим гипотезу о равенстве математических ожиданий удельных весов случайных величин при неизвестных дисперсиях. Расчетное значение t-статистики определяется по формуле:
t расч = |
|
a1 − a2 |
|
|
|
|
n n |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
1 |
2 |
, |
|||
−1)s2 + (n |
|
|
|
n1 + n2 |
||||||
|
(n |
2 |
−1)s2 |
|
||||||
1 |
1 |
|
2 |
|
|
|
|
|||
|
|
n1 + n2 − 2 |
|
|
|
|
|
|||
где n1 = n2 = 200 , a1 = 0,89 , a2 |
= 0,79 . |
|
|
|||||||
Определим дисперсии долей: |
|
|
|
s12 = a1 (1 − a1 ) = 0,89 0,11 = 0,0979 , s22 = a2 (1 − a2 ) = 0,79 0,21 = 0,1659 .
В результате критическая статистика равна
t рвсч = |
0,89 − 0,79 |
|
200 200 |
= 2,753 . |
||
(200 |
−1) 0,0979 |
+ (200 −1) 0,1659 |
|
200 + 200 |
|
|
|
|
200 + |
200 − 2 |
|
|
|
Критическое значение статистики определим по таблице:
tкр = tα (n1 + n2 − 2) = t0,025 (398) = 2,250 .
2
Поскольку t расч > tкр ,
то на уровне значимости α = 0,05 принимаем гипотезу о том, что доля «премированных» посетителей, открывших счет в банке, существенно отличается от удельного веса «непремированных» посетителей, открывших счет в банке.
Задача 121. Опрос случайно выбранных 10 студентов, проживающих в общежитии университета, позволяет выявить зависимость между средним баллом по результату предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку.
Средний балл |
4,6 |
4,3 |
3,8 |
3,8 |
4,2 |
4,3 |
3,8 |
4,0 |
3,1 |
3,9 |
|
|
|
|
|
|
|
|
|
|
|
Число часов |
25 |
22 |
9 |
15 |
15 |
30 |
20 |
30 |
10 |
17 |
|
|
|
|
|
|
|
|
|
|
|
Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при α = 0,05 . Постройте уравнение регрессии и дайте интерпретацию полученных результатов. Если студент занимается самостоятельно по 12 ч в неделю, то каков прогноз его успеваемости?
Решение.
Построим диаграмму рассеяния исходных данных (см. рис. 1).
По графику можно предположить линейный характер зависимости успеваемости от числа часов в неделю, затраченных студентом на самостоятельную подготовку.
Средний балл
5
4,5
4
3,5
3
2,5
2
0 |
5 |
10 |
15 |
20 |
25 |
30 |
35 |
Число часов
Рис. 1. Диаграмма рассеяния исходных данных.
Выборочный коэффициент линейной корреляции Пирсона определяется по формуле
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
rxy = |
∑(xi − x)( yi − y) |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
n |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
∑(xi − x)2 |
|
∑( yi − y)2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
i=1 |
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Составим вспомогательную таблицу расчетов: |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
№№ |
|
Число |
Средний |
|
x2 |
y2 |
xy |
(x − |
|
)2 |
( y − |
|
)2 |
(x − |
|
)( y − |
|
) |
||
x |
y |
x |
y |
||||||||||||||||||
|
|
|
часов, x |
балл, y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
1 |
|
25 |
|
4,6 |
|
625 |
21,16 |
115 |
32,49 |
0,3844 |
3,534 |
|
|
|||||||
|
2 |
|
22 |
|
4,3 |
|
484 |
18,49 |
94,6 |
7,29 |
0,1024 |
0,864 |
|
|
|||||||
|
3 |
|
9 |
|
3,8 |
|
81 |
14,44 |
34,2 |
106,09 |
0,0324 |
1,854 |
|
|
|||||||
|
4 |
|
15 |
|
3,8 |
|
225 |
14,44 |
57 |
18,49 |
0,0324 |
0,774 |
|
|
|||||||
|
5 |
|
15 |
|
4,2 |
|
225 |
17,64 |
63 |
18,49 |
0,0484 |
-0,946 |
|
|
|||||||
|
6 |
|
30 |
|
4,3 |
|
900 |
18,49 |
129 |
114,49 |
0,1024 |
3,424 |
|
|
|||||||
|
7 |
|
20 |
|
3,8 |
|
400 |
14,44 |
76 |
0,49 |
0,0324 |
-0,126 |
|
|
|||||||
|
8 |
|
30 |
|
4 |
|
900 |
16 |
120 |
114,49 |
0,0004 |
0,214 |
|
|
|||||||
|
9 |
|
10 |
|
3,1 |
|
100 |
9,61 |
31 |
86,49 |
0,7744 |
8,184 |
|
|
|||||||
|
10 |
|
17 |
|
3,9 |
|
289 |
15,21 |
66,3 |
5,29 |
0,0064 |
0,184 |
|
|
|||||||
|
Всего |
|
193 |
|
39,8 |
|
4229 |
159,92 |
786,1 |
504,1 |
1,516 |
17,96 |
|
|
|||||||
|
Среднее |
|
19,3 |
|
3,98 |
|
422,9 |
15,992 |
78,61 |
50,41 |
0,1516 |
1,796 |
|
|
Отсюда выборочный коэффициент линейной корреляции Пирсона равен