Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Грудцына Л.Ю. ТВиМС Метод. указания

..pdf
Скачиваний:
46
Добавлен:
10.02.2015
Размер:
575.52 Кб
Скачать

Теперь строим кумуляту – кривую накопленных частот отмечая на горизонтальной оси концы частичных интервалов ai, на вертикальной оси – соответствующие накопленные частоты nхi .

б) По формулам, приведенным выше, находим числовые характеристики данного ряда. Для удобства вычислений определим середину каждого интервала.

Номер i

1

2

3

4

5

 

 

 

 

6

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервалы

[16, 21)

[21, 26)

[26, 31)

[31, 36)

[36, 41)

 

[41, 46)

 

[46, 51]

[ai, ai+1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Середины

18,5

23,5

28,5

33,5

38,5

 

 

 

 

43,5

 

 

48,5

интервалов хi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Частоты ni

4

7

10

16

7

 

 

 

 

5

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å xi ni

 

 

 

 

 

 

 

 

Выборочное среднее вычисляется по формуле:

x =

i=1

 

.

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x =

18,5× 4 + 23,5 ×7 + 28,5 ×10 + 33,5 ×16 + 38,5× 7 + 43,5×5 + 48,5×3

» 32,54 .

 

 

 

 

 

 

 

 

 

52

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

2ni

 

 

 

 

 

 

 

 

 

 

 

 

å xi

 

 

Выборочное среднее квадратическое отклонение: s =

i=1

 

 

 

- (х)2 .

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s 2 =

(18 ,5)2 × 4 + (23,5)2 × 7 + (28 ,5)2 ×10 + (33,5)2 ×16 + (38 ,5)2 × 7

+

 

 

 

 

 

 

 

52

 

 

 

 

 

 

 

 

 

 

 

 

 

 

21

+ (43,5)2 ×5 + (48,5)2 ×3 - (32,54)2 » 60,5 . 52

s = 60,5 » 7,78 .

Мода интервального статистического ряда может быть приближенно найдена графическим путем с помощью гистограммы. На гистограмме распределения (см. рис.) находим прямоугольник с наибольшей частотой. Соединяя отрезками прямых вершины этого прямоугольника с соответствующими вершинами двух соседних прямоугольников, получим точку пересечения этих отрезков. Опуская из этой точки перпендикуляр на

~

ось Ох, получим моду: Мо ≈ 32,5 .

Медиану интервального статистического ряда можно найти графическим путем с помощью кумуляты как значение признака, для которого nхi = n / 2 .

На рисунке проводим горизонтальную прямую у=26 (n=52, n/2=26), соответствующую накопленной частоте nхi = 26 , до пересечения с

кумулятой. Опуская из точки пересечения перпендикуляр на ось Ох, получим

 

 

~

 

 

 

 

 

 

 

 

приближенно медиану: Ме » 33.

 

 

 

 

 

 

Ответ: а) см. рис.

б) R=35; х = 32,54 ;

s ≈ 7,78 ;

~

 

~

Мо » 32,5 ;

Ме » 33 .

Задание 9.

Службой

контроля проверен расход

электроэнергии в

течение месяца в 25 квартирах жилого дома.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расход

 

 

 

 

 

 

 

 

 

 

энергии

70–90

90–110

 

110–130

 

130-150

 

150–170

(кВт.ч.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число

2

 

5

 

8

 

 

6

 

4

квартир

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Предполагается,

что

выборка

получена

из

 

нормально

распределенной генеральной совокупности.

 

 

 

 

 

Требуется найти: а) оценки x и s2 для генеральных средней и дисперсии;

б) границы, в которых с надежностью 0,95 будет заключен средний расход электроэнергии в доме.

22

Решение.

а) Выборочная средняя x используется как оценка генеральной средней;

“исправленная”

выборочная

дисперсия

s 2

используется как оценка

генеральной дисперсии.

 

 

 

 

 

 

Вычислим

выборочные

среднюю и “исправленную” дисперсию (n

объем выборки, xi – середины интервалов, ni

интервальные частоты):

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

å xi ni

 

 

80

×2 +100×5 +120×8+140×6 +160×4

 

 

x =

i=1

 

=

=124 ;

 

 

n

 

 

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å(xi - x)2 ×ni

2 × 2 + (100 -124)2 ×5 + (120 -124)2 ×8 +

s

2 =

i=1

 

 

 

 

= (80 -124)

 

 

 

 

 

n -1

 

 

 

25 -1

 

 

+

(140 -124)2 × 6 + (160 -124)2 × 4

» 566,7 .

 

 

 

 

 

 

 

25 -1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) Найдем границы, в которых с надежностью 0,95 будет заключен средний расход электроэнергии в доме, т.е. определим доверительный интервал для генеральной средней.

Доверительный интервал уровня надежности γ для генеральной средней определяется по формуле x - D < xген < x + D .

Если объем выборки n=25≤30, то этот интервал строится только для нормально распределенной генеральной совокупности и для повторной

выборки. Считаем выборку повторной. Следовательно, D = tγ ,k × sn .

Коэффициент tγ,k определяется по таблице распределения Стьюдента (см. Приложения) в зависимости от надежности γ=0,95 и числа степеней свободы k=n-1=25-1=24. В данном случае tγ,k=2,06.

Значения выборочной средней и “исправленной” дисперсии были вычислены ранее: x =124, s » 566,7 » 23,8 .

Имеем следующий доверительный интервал:

124 - 2,06×

23,8

< x <124 + 2,06×

23,8

;

 

 

 

 

25

 

ген

25

 

 

 

 

114,2 < xген < 133,8 ;

т.е.

xген Î(114,2; 133,8) .

Ответ. а) x =124, s 2 ≈ 566,7 ; б)

x

Î(114,2; 133,8) .

 

 

 

 

 

ген

 

 

 

 

23

Задание 10. Имеется

выборка

(из

нормально

распределенной

генеральной совокупности) об уровне механизации труда X (%) и

производительности труда Y (усл. ед.) для 14 предприятий.

 

X

Y

X

Y

 

 

 

 

32

20

54

37

30

24

60

38

36

28

55

40

40

30

61

41

41

31

67

43

47

33

69

45

56

34

76

48

 

 

 

 

Требуется: а) вычислить выборочный коэффициент линейной корреляции r; б) проверить значимость коэффициента на уровне α=0,05, сделать

вывод о тесноте и направлении связи между величинами X и Y;

в) найти выборочное уравнение линейной регрессии Y на X; г) построить корреляционное поле и график прямой регрессии.

Решение.

а) Выборочный коэффициент линейной корреляции вычислим по

формуле:

r =

xy

-

x

×

y

, где

x , у ,

 

 

выборочные

средние значения

xy

 

 

 

 

sx sy

 

 

 

 

 

 

 

 

 

 

величин Х, Y и Х·Y соответственно;

а

sx

и sy – выборочные средние

квадратические отклонения Х и Y соответственно.

 

 

 

Для вычисления r составим расчетную таблицу.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

yi

 

 

 

xi2

 

y2i

 

xi × yi

 

 

1

 

32

 

 

 

 

20

 

1024

 

400

 

640

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

30

 

 

 

 

24

 

900

 

576

 

720

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

36

 

 

 

 

28

 

1296

 

784

 

1008

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

40

 

 

 

 

30

 

1600

 

900

 

1200

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

41

 

 

 

 

31

 

1681

 

961

 

1271

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

47

 

 

 

 

33

 

2209

 

1089

 

1551

 

 

7

 

56

 

 

 

 

34

 

3136

 

1156

 

1904

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

54

 

 

 

 

37

 

2916

 

1369

 

1998

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

xi

yi

xi2

y2i

xi × yi

 

 

 

 

 

 

9

60

38

3600

1444

2280

10

55

40

3025

1600

2200

11

61

41

3721

1681

2501

 

 

 

 

 

 

12

67

43

4489

1849

2881

 

 

 

 

 

 

13

69

45

4761

2025

3105

 

 

 

 

 

 

14

76

48

5776

2304

3648

 

 

 

 

 

 

724

492

40134

18138

26907

Вычислим средние значения, подставляя полученные значения сумм:

 

 

 

1

 

m

 

1

 

 

 

 

 

 

 

 

x =

 

 

 

×

å xi

=

 

 

 

 

×724 » 51,71;

 

n

14

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

m

2

 

 

1

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

х

 

=

 

 

 

× å x

 

=

 

 

 

 

 

×40134

» 2866,71

;

 

n

i

14

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

1

m

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xy =

 

 

 

× å xi yi =

 

 

 

 

× 26907

»1921,93 .

 

n

14

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

1

 

m

 

1

 

 

 

у =

 

 

×å yi

=

 

 

 

 

× 494 » 35,14 ;

n

14

 

 

 

 

i=1

 

 

 

 

 

 

 

1

m

2

 

 

 

1

 

 

2

 

 

 

 

 

 

у

 

=

 

 

× å у

 

=

 

 

 

×18138 » 1295,57

 

n

i

14

 

 

 

 

i=1

 

 

 

Вычислим средние квадратические отклонения, подставляя полученные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- (

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

значения сумм: sx =

x2

 

 

=

2866,71- (51,71)2

 

»13,87 ;

 

x

 

 

 

 

 

- (

 

)2

=

 

 

 

 

 

 

 

 

 

 

 

sy =

 

y2

 

1295,57 - (35,14)2

» 7,78 .

 

 

y

 

Коэффициент корреляции равен: r =

 

-

 

×

 

= 1921,93- 51,71×35,14

 

xy

x

y

» 0,97 .

 

 

 

 

 

 

 

 

 

 

 

 

 

sx sy

13,87×7,78

 

б) Проверим значимость найденного коэффициента на уровне α=0,05.

Для этого вычислим статистику: t = r × n - 2 = 0,97× 14 - 2 »13,82 .

1- r2 1- (0,97)2

По таблице значений tγ,k-критерия Стьюдента (см. Приложения) в

зависимости от

γ = 1-α = 1-0,05 = 0,95 (α

– уровень значимости)

и числа

степеней

свободы k = n-2 = 14-2 = 12

находим

критическое

значение

tкр = tγ,k = 2,18.

 

 

 

 

Так как

| t |≈13,82 > tкр=2,18, то делаем вывод о значимом отличии от нуля

найденного по выборке коэффициента линейной корреляции r.

 

Поскольку

r ≈ 0,97 – статистически

значим

и абсолютное

значение

коэффициента корреляции близко к единице (| r |

>0,7), то можно сделать

25

вывод о тесной (высокой) линейной зависимости между величинами X и Y. Положительное значение коэффициента свидетельствует о том, что связь прямая (Y увеличивается с увеличением Х).

в)

Выборочное уравнение прямой регрессии Y на X можно

найти по

формуле: yx = y + r ×

sy

×(x - x) .

 

 

sx

 

 

 

 

 

 

 

 

Учитывая, что

x ≈ 51,71,

у ≈ 35,14 , r ≈ 0,97 , sx »13,87 ,

sy » 7,78 ,

получим: yx = 35,14 + 0,97×

7,78

×(x - 51,71) ;

 

 

 

 

 

 

13,87

 

 

 

yx = 35,14 + 0,544×(x - 51,71) ;

 

 

yx = 7 + 0,544× x .

 

 

в)

Построим корреляционное поле. Для этого на координатной плоскости

отмечаем все заданные пары чисел (xi, уi) – всего 14 точек.

На этом же чертеже построим график функции регрессии yx = 7 + 0,544x . Для построения данной прямой найдем две точки, через которые она

проходит. Во-первых,

прямая

проходит через точку с

координатами

(x, y) = (51,71; 35,14) .

Положим

х=30,

тогда

из уравнения

получим:

yx=30 = 7 + 0,544×30 » 23,3 . Во-вторых,

прямая

проходит

через

точку с

координатами (30; 23,3).

 

 

 

 

 

Ответ. а) r ≈ 0,97 ; б) коэффициент – значим, связь – прямая, тесная; в) yx = 7 + 0,544x ; г) см. рис.

26

КРАТКАЯ ТЕОРЕТИЧЕСКАЯ СПРАВКА

1. НЕПОСРЕДСТВЕННОЕ ВЫЧИСЛЕНИЕ ВЕРОЯТНОСТЕЙ

Эксперимент, испытание, опыт – это возникновение или преднамеренное создание определенного комплекса условий, результатом которого является тот или иной исход.

Исход испытания называется событием (случайным событием). События, как правило, обозначаются большими латинскими буквами А, В, С, ... . Среди событий различают достоверное и невозможное события. Достоверное событие (Ω) – это событие, которое обязательно произойдет в результате испытания, невозможное событие (Ø) – событие, которое не может произойти.

Те из событий, которые нельзя разложить на составляющие их события, называются элементарными (случаями).

Под вероятностью события (P) понимается некоторая числовая характеристика возможности наступления этого события. Существует несколько подходов к определению вероятности. Для непосредственного вычисления вероятности используется ее классическое определение.

Классической схемой (схемой случаев) называется испытание, при котором число элементарных исходов конечно и все из них равновозможны.

Классической вероятностью события А называется отношение числа m элементарных событий, благоприятствующих событию А, к общему числу n всех элементарных событий из этой схемы:

Р(А) = mn .

Из определения следует, что Р(Ω)=1, Р(Ø)=0 и 0≤Р(А)≤1.

Пример 1. Студент знает ответы на 21 вопрос из 30. Какова вероятность того, что он вытащит на зачете известный ему вопрос?

Решение. Событие А – студент вытащит известный вопрос.

Число всех вопросов – n=30; число известных (благоприятных событию А)

вопросов – m=21. Р(А)=m/n=21/30=0,7.

При решении задач часто приходится в заданном множестве выбирать подмножества элементов, которые обладают определенным свойством.

27

Пусть некоторое множество содержит n элементов. Каждое его упорядоченное подмножество, состоящее из k элементов, называется

размещением из n элементов по k:

Ank =

n!

 

= n×(n -1)

×...×(n - k +1) ,

(n - k)!

 

 

 

где n!=1·2·3·…·n («эн-факториал») – произведение всех натуральных чисел от 1 до n. Условно считается, что 0!=1.

Размещение из n элементов по n называется перестановкой из n

элементов: Рn = n!

Пусть задано множество из n элементов. Каждое его неупорядоченное подмножество, содержащее k элементов, называется сочетанием из n

элементов по k:

 

 

n!

 

 

k

Сnk

=

=

An

.

(n - k)!×k!

 

 

 

 

k!

Пример 2. В торговом представительстве фирмы работают 10 девушек и 5 юношей. Разыгрывается 3 путевки в Турцию. Какова вероятность того, что путевки получат 3 девушки?

Решение. Событие А – путевки получат 3 девушки.

Всего участников розыгрыша 10+5=15 человек. Каждый набор (подмножество) из 3-х человек отличается от другого только составом участников (т.к. порядок распределения между 3-мя участниками 3-х одинаковых путевок не имеет значения). Следовательно, для нахождения общего числа вариантов выбора 3-х элементных неупорядоченных

подмножеств

из 15-ти элементного множества используем сочетания:

n = С153 =

 

15!

=

13×14×15

= 455 .

(15

- 3)!×3!

 

1×2×3

 

 

 

Т.к. девушек в розыгрыше только 10, число случаев, благоприятных

событию А: m = С103

=

 

10!

=

8×9×10

= 120 .

 

(10

- 3)!×3!

1×2×3

 

 

 

 

 

 

 

 

 

 

Согласно

 

классическому

определению

вероятности,

P(A) =

m

=

120

» 0,264 .

 

 

 

 

 

n

 

 

 

 

 

 

 

455

 

 

 

 

 

 

 

 

28

2. ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ ВЕРОЯТНОСТЕЙ

Суммой событий А и В называется такое событие С=А+В, которое означает наступление А или В.

Произведением событий А и В называется такое событие С=А·В, которое означает наступление А и В (одновременно).

События А и В называются несовместными, если они не могут появиться одновременно в одном опыте, т.е. А·В=Ø (в противном случае – совместными).

Противоположным событию А называется событие А , которое определяется равенствами: А· А =Ø, А+ А =Ω.

Теорема сложения

Пусть А и В несовместные события, тогда вероятность их суммы равна сумме вероятностей: Р(А+В) = Р(А)+Р(В).

Теорема сложения вероятностей верна и для конечного числа n попарно несовместных событий.

Для произвольных событий верна более общая теорема:

Р(А+В) = Р(А)+Р(В)-Р(А·В).

Следствие из теоремы сложения: Р(А)+Р( А )=1, Р( А )=1-Р(А). Вероятность события А, вычисленная при условии, что произошло

событие В, называется условной вероятностью А и обозначается Р(А/В). События А и В называются независимыми, если появление одного из

событий не влияет на вероятность появления другого, т.е. Р(А/В)=Р(А) (в противном случае – зависимыми).

Теорема умножения

Пусть А и В независимые события, тогда вероятность их произведения равна произведению вероятностей: Р(А·В) = Р(АР(В).

Теорема умножения вероятностей верна и для конечного числа n попарно независимых событий.

Для произвольных событий верна более общая теорема:

Р(А·В) = Р(А/В) · Р(В) = Р(В/А) · Р(А).

Пример 3. Вероятность того, что потребитель увидит рекламу некоторого продукта по телевидению, равна 0,04. Вероятность того, что потребитель увидит рекламу того же продукта на рекламном стенде, равна 0,06. Какова вероятность того, что потребитель увидит рекламу данного продукта?

29

Решение. Событие С – потребитель увидит рекламу продукта, А – увидит рекламу продукта по телевидению, В – увидит рекламу на рекламном стенде.

Р(А)=0,04; Р(В)=0,06.

Тот факт, что потребитель увидит рекламу продукта, означает: он увидит рекламу по телевидению или на стенде. Т.е. С=А+В. События А и В совместны (потребитель может увидеть рекламу и по телевидению, и на стенде), следовательно, по теореме сложения:

Р(С)=Р(А+В) = Р(А)+Р(В)-Р(А·В).

Будем считать события А и В независимыми (появление одного из событий не влияет на вероятность появления другого), следовательно, по теореме умножения: Р(А·В) = Р(АР(В).

Р(С)=0,04+0,06-0,04·0,06=0,0976.

Пример 4. Студент пришел на экзамен, изучив 20 из 25 вопросов программы. Экзаменатор задал студенту два вопроса. Вычислить вероятность того, что студент верно ответит на оба вопроса.

Решение. Событие С – студент верно ответит на два вопроса, А – студент верно ответит на первый вопрос, В – студент верно ответит на второй вопрос.

Наступление события С означает, что студент верно ответит на первый и второй вопросы, т.е. С=А·В.

События А и В зависимы, т.к. появление события А повлияет на вероятность события В. Согласно классическому определению, P(A) = 2025

(общее число исходов – 25, число благоприятных исходов – 20). После того, как студент успешно ответил на первый вопрос, преподаватель задает второй (общее число исходов изменилось – 25-1=24, число благоприятных исходов

также изменилось – 20-1=19), следовательно, P(В / А) = 2025 .

По теореме умножения: P(A× B) = P(A) × P(A/ B) = 2025 × 1924 » 0,63 .

30