Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

конспекты / end_3

.pdf
Скачиваний:
32
Добавлен:
21.02.2016
Размер:
855.41 Кб
Скачать

101

1.

 

 

N =1000

 

n =100

 

 

x = 50

σ =1

γ = 0,95

 

m =10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

 

 

N = 2000

 

n = 400

 

x =100

σ =1,5

γ = 0,954

 

m = 30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.

 

 

N =1500

 

n = 200

 

 

x = 40

σ = 0,8

γ = 0,99

 

m = 20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.

 

 

N = 2500

 

n = 300

 

 

x = 70

σ =1,2

γ = 0,95

 

m =15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5.

 

 

N =1200

 

n = 200

 

 

x = 45

σ =1

γ = 0,954

 

m = 30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6.

 

 

N = 2500

 

n = 300

 

 

x =120

σ = 2

γ = 0,99

 

m = 30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7.

 

 

N =1800

 

n = 200

 

 

x = 75

σ =1,5

γ = 0,95

 

m = 20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8.

 

 

N =1500

 

n = 300

 

 

x =150

σ = 2

γ = 0,954

 

m =15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9.

 

 

N = 2000

 

n = 400

 

x = 80

σ =1

γ = 0,99

 

m = 20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10.

 

N =1000

 

n = 200

 

 

x = 90

σ =1,3

γ = 0,954

 

m = 30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример.

 

Из 1000 образцов бетона для контроля прочности

 

 

 

 

 

 

бесповторным путем отобрали 200 образцов. Изучение выборочной

 

 

совокупности

дало

величину выборочной

средней

x = 50 МПа и

 

 

выборочное

среднее

квадратическое отклонение σ = 2 МПа. Двадцать

 

 

образцов признано некондиционными (не соответствующими стандартам

 

 

качества).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найти:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а) с вероятностью 0,95 доверительный интервал для генеральной средней;

 

 

б) с вероятностью 0,954 долю некондиционных изделий в генеральной

 

 

совокупности.

 

 

 

 

N =1000 ,

n = 200,

x = 50мм,

σ = 2мм,

 

 

 

а) По

 

условию,

 

 

γ = 0,95.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доверительный интервал для генеральной средней имеет границы:

 

 

 

 

~

x + ∆x ,

 

 

 

 

 

 

 

 

 

 

 

x − ∆x x

 

 

 

 

 

 

 

 

 

 

 

где x

- предельная ошибка для бесповторной выборки

 

 

 

 

 

x = tµx

= t

σ

2

n

 

 

 

 

 

 

 

 

 

 

1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

N

 

 

 

 

 

 

 

 

 

Параметр t определяется из равенства 2Φ(t)=γ ,

или

Φ(t)= γ . По

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

102

таблице функции Лапласа находят аргумент t , которому соответствует значение функции Лапласа, равное γ2 .

В нашем примере t =1,96 .

x = tµx = t

σ 2

 

n

= 2

4

 

200

 

= 0,248 (МПа).

n

1

 

200

1

1000

 

 

 

 

N

 

 

 

 

 

Тогда доверительный интервал для нашего примера: 50 0,248 ~x 50 + 0,248 ;

49,752 ~x 50,248 .

Свероятностью 0,95 (в строительстве применяют термин

надежность) генеральная средняя прочности бетона находится от 49,752 МПа до 50,248 МПа, т.е. с надежностью 0,95 прочность образцов лежит в найденном интервале. На практике при вычислении доверительного интервала для прочности используется нижняя граница интервала, т.к. нас интересует большая прочность. Тогда прочность образцов будет больше, чем x −∆x , с вероятностью (1γ) / 2 .

В нашей задаче прочность будет больше, чем 49,752, с вероятностью

0,025.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) γ = 0,95,

t =1,96 .

 

 

 

 

 

 

 

 

 

Выборочная доля некондиционных изделий

 

 

 

 

W =

m

=

20

 

= 0,1.

 

 

 

 

 

 

 

 

 

 

200

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

Предельная ошибка для генеральной доли

 

 

 

 

p = tµp = t

W (1W )

n

= 2

0,1 0,9

 

200

= 0,0372.

n

1

 

200

1

 

 

 

 

 

 

 

 

N

 

 

 

1000

 

W − ∆p p W + ∆p ,

0,10,0372 p 0,1+ 0,0372,

0,0628 p 0,1372.

С вероятностью 0,95 доля некондиционных изделий во всей партии составляет от 6,28% до 13,72%.

411-420. С целью изучения статистического признака Х проведено исследование. Результаты представлены в таблице. Определить:

1)среднее значение признака Х;

2)дисперсию, среднее квадратическое отклонение;

3)коэффициент вариации;

4)моду признака Х (аналитически и графически);

5)медиану признака Х (аналитически и графически).

103

411. Распределение рабочих цеха по возрасту.

 

Возраст (X),

 

 

17 - 20

 

 

20 - 30

 

 

30 - 40

40 - 50

50 - 59

 

 

 

всего

 

 

 

годы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Количество

 

 

29

 

 

 

 

 

 

40

 

 

14

 

 

 

 

11

 

6

 

 

 

100

 

 

рабочих

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

412. Распределение рабочих по стажу работы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Стаж работы (X),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

годы

 

 

 

 

 

 

до 5

 

5-10

 

 

 

10-15

 

15-20

20-25

25-30

св. 30

всего

 

Кол - во рабочих

 

11

 

19

 

 

 

40

 

 

25

 

 

15

 

 

6

 

 

4

 

 

 

120

 

 

413. Распределение студентов по росту.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рост

 

до

 

 

164-

 

 

168-

 

 

 

172-

 

 

176-

 

 

180-

 

 

 

 

 

 

 

 

 

(X)

в

164

 

 

168

 

 

 

172

 

 

 

 

176

 

 

180

 

 

 

184

 

 

св. 184

 

всего

 

(см)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

кол-во

12

 

 

 

18

 

 

22

 

 

 

31

 

 

27

 

 

 

 

22

 

8

 

 

 

140

 

 

414. Распределение рабочих цеха по уровню зарплаты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зар. пл.

 

 

 

100-

 

 

 

110-

 

120-

 

130-

 

140-

 

 

 

150-

 

160-

 

 

 

 

 

(X), (грн.)

 

 

110

 

 

 

120

 

130

 

 

140

 

150

 

 

 

160

 

170

 

 

 

всего

 

Число

 

 

 

5

 

 

 

 

10

 

 

20

 

 

 

 

25

 

 

20

 

 

 

15

 

5

 

 

 

100

 

рабочих

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

415. Распределение рабочих механического завода по общему стажу

работы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общий

стаж

 

до 5

 

5-10

 

 

 

 

10-15

 

 

15-20

20-25

 

 

25 и

 

итого

(лет)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

более

 

 

 

Число

 

 

 

 

 

35

 

 

 

 

25

 

 

 

 

15

 

 

11

 

 

 

 

9

 

5

 

 

 

100

 

рабочих

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

416. Распределение рабочих цеха по производительности труда.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Производи

 

 

до 100

 

100-102

 

102-104

 

104-106

106-108

св. 108

 

 

итого

 

тельность

 

 

 

 

 

 

 

труда (%)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число

 

 

 

 

 

11

 

 

 

 

 

21

 

 

 

 

37

 

 

24

 

 

 

 

5

 

2

 

 

 

100

 

рабочих

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

417. Распределение рабочих по уровню зарплаты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зарплата (грн.)

 

 

до 100

100-

 

 

 

120-

140-

 

160-

 

180-

 

св. 200

итого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

120

 

 

 

140

 

 

160

 

180

 

200

 

 

 

 

 

 

 

 

Число рабочих

 

 

 

 

7

 

13

 

 

 

20

 

 

40

 

34

 

26

 

10

 

 

 

150

 

104

418. Распределение рабочих по выработке изделий за смену.

 

Кол-во

 

 

 

 

до 60

 

60-70

 

 

70-80

 

 

 

80-90

 

 

90-100

 

 

итого

 

изделий, (шт.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число

 

 

 

 

 

 

10

 

 

 

 

20

 

 

50

 

 

 

15

 

 

 

 

 

 

5

 

 

100

 

рабочих (чел.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

419. Распределение рабочих по возрасту.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Возраст, (годы)

 

 

18-20

 

 

20-30

30-40

40-50

50-60

св. 60

 

итого

Число

рабочих,

 

 

 

 

3

 

 

 

18

 

 

42

 

 

 

25

 

 

7

 

 

5

 

 

100

 

(чел)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

420. Распределение рабочих по уровню зарплаты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зарплата,

 

 

 

 

 

 

до

 

 

 

150-

 

 

160-

 

 

170-

 

 

 

180-

 

 

190-

 

 

св.

 

итого

(грн.)

 

 

 

 

 

150

 

 

160

 

 

170

 

 

180

 

 

 

190

 

 

200

 

200

 

 

 

Число

 

 

 

 

 

11

 

 

 

14

 

 

23

 

 

37

 

 

 

15

 

 

12

 

8

 

 

 

120

 

рабочих

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. Распределение рабочих предприятия по уровню зарплаты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зарплата

 

 

 

 

 

до 150

150-

 

170-

 

190-

 

210-230

св.230

 

 

итого

 

(грн.), xi

 

 

 

 

 

 

 

 

 

 

 

170

 

190

 

210

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число

 

 

 

 

 

11

 

14

 

 

25

 

40

 

 

17

 

 

 

 

 

13

 

 

120

 

рабочих

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(чел.), ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Основной характеристикой вариационного ряда является среднее

 

значение

 

 

(среднее арифметическое взвешенное)

 

 

 

 

значение

 

 

 

x. Среднее

 

 

находится по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x =

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для интервальных рядов в качестве значений вариант берутся

 

середины интервалов. Найдем среднее значение для вышеуказанного ряда.

 

В качестве x1 берется значение 140 грн. (первый интервал считается 130-

 

150), x6 равно 240 грн.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

140 11+160 14 +180 25 +200 40 +220 17 +240 30

=

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

23140

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

=192,83 (грн.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя

зарплата

на данном предприятии

192,83 грн.

Выборки,

105

имеющие одинаковые средние могут значительно отличаться друг от друга по степени разброса (вариации). Для оценки вариации применяется дисперсия:

 

 

 

 

xi 2ni

(

 

)2 =

 

 

(

 

)2 .

 

 

 

 

D =

 

x2

 

 

 

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислим дисперсию для приведенного распределения

 

D =

1402

11+1602 14 +1802

25 + 2002 40 + 2202 17 +

2402 13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

 

 

 

4555600

 

 

 

 

 

 

 

 

(192,83)2

 

=

192,432

= 778,64.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

Корень квадратный из дисперсии называется среднеквадратическим

отклонением.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ =

 

 

 

 

 

 

Dв .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В рассматриваемом примере

 

 

 

 

σ =

 

 

 

 

 

 

778,64 = 27,90 (грн.)

 

 

 

 

Для проверки однородности выборки применяется коэффициент

вариации:

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V =

100%,

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В тех случаях, когда V 20%, выборку можно считать однородной.

Для примера

 

 

 

 

V =

 

 

 

27,90

 

100% =14,50%.

 

 

 

 

192,43

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вышеприведенную выборку можно считать однородной.

Модой распределения называется наиболее часто встречающаяся варианта. Для интервального ряда мода находится по формуле:

Mo = xMo + h

 

nMo nMo1

 

,

 

 

 

 

 

где xMo

 

nMo nMo1 + nMo nMo+1

начало

модального интервала, т.е. интервала, имеющего

наибольшую частоту, h

длина модального интервала, nMo1 частота

предмодального интервала,

nMo+1 частота послемодального интервала.

В рассматриваемом

примере

модальный интервал 190 210 грн,

xMo =190,

nMo = 40,

nMo1 = 25, nMo+1 =17, h = 20.

Mo =190 + 20

40 25

 

=197,89 (грн.)

40 25 + 40 17

На рассматриваемом предприятии наиболее часто встречается зарплата 197,89 грн.

Графически мода находится с помощью гистограммы. Модальным

106

является наибольший прямоугольник.

n

40

25

17

14

13

11

X

130

150

170

190

210

230

250

Медианой называется варианта, делящая вариационный ряд пополам, т.е. количество вариант, меньших медианы и больших медианы, равны между собой. Для нахождения медианы необходимо понятие накопленной частоты.

Накопленной частотой S(x) называется сумма вариант, меньших x. Для указанного распределения напишем накопленные частоты.

xi

 

130-150

150-170

 

 

170-190

190-210

210-230

 

230-250

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

11

 

14

 

 

 

 

 

25

 

40

 

17

 

 

 

13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Si

 

11

 

11+14=25

 

11+14+25=

50+40=90

90+17=

 

107+13=120

 

 

 

 

 

 

 

 

 

 

 

 

=50

 

 

=107

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Медианным называется интервал, в котором накопленная частота

 

 

впервые принимает

половину объема

выборки

 

n

= 60. в

примере

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

медианный интервал 190 210 грн. Формула вычисления медианы

 

 

 

 

 

 

 

 

 

 

n

SMe1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Me = xMe

+ h

2

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nMe

 

 

 

 

 

 

 

 

 

 

 

где xMe начало медианного интервала,

h длина медианного интервала,

 

 

nMe

частота

медианного интервала,

SMe1

накопленная

частота

107

предмодального интервала. В примере

 

 

 

120

50

 

 

 

 

 

Me =190 + 20

2

=195 (грн.)

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

Количество рабочих с зарплатой менее 195 грн. и более равны между

собой.

 

 

 

 

 

 

 

 

 

Графически медиана находится из графика:

 

 

S

 

 

 

 

 

 

 

 

 

130

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

*

110

 

 

 

 

 

 

*

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

90

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

80

 

 

 

 

 

 

 

 

 

70

 

 

 

 

 

 

 

 

 

60

 

 

 

 

 

*

 

 

 

50

 

 

 

 

 

*

 

 

 

40

 

 

 

 

 

 

 

 

 

30

 

 

 

 

*

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

*

 

 

 

 

 

X

0

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

120

140

160

180

200

220

240

260

421-430. Составить уравнение линейной регрессии, найти коэффициент корреляции и сделать вывод о связи Х и Y. Нанести прямую регрессии на корреляционное поле.

421.

X

 

 

2

 

 

3

 

 

4

 

 

 

 

5

 

6

7

8

Y

 

 

3

 

 

5

 

 

5,5

 

 

 

4

 

7

7,5

8,5

 

422.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

5

 

 

2

4

 

6

 

7

 

 

3

 

5

 

6

Y

 

10

 

 

18

14

 

8

 

5

 

 

15

 

8

 

5

 

423.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

8

 

 

7,5

 

6

 

 

 

 

8,2

 

7,5

6,5

5,5

Y

 

3

 

 

2,5

 

1,5

 

 

 

3,5

 

3

2,5

1,5

 

424.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

1,7

 

 

2,4

3

 

3,5

 

2,5

 

2

 

1,5

 

4

Y

 

3

 

 

5

6,2

 

7,1

 

3,5

 

2,8

 

1,5

 

8,2

108

425.

 

 

X

 

10

 

12

 

8

 

 

 

15

 

 

 

 

14

 

16

 

 

 

 

12

 

 

 

13

 

 

 

 

Y

 

5,5

 

6,2

 

3,9

 

 

 

8

 

 

 

 

7,5

 

8,5

 

 

 

5

 

 

 

6,2

 

 

 

 

426.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

3,7

 

4,2

 

 

3,9

 

 

 

4,3

 

 

 

5

 

 

 

5,2

 

 

5,3

 

 

 

 

Y

 

 

 

11

 

12,4

 

 

15,2

 

 

16,6

 

 

 

17,2

 

 

 

18,1

 

 

19,2

 

 

 

 

427.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

5,2

 

7,1

 

 

8,1

 

 

 

9,2

 

 

 

10,2

 

 

 

11,3

 

 

11,5

 

 

 

 

Y

 

10,5

 

14,3

 

 

18,5

 

 

20,3

 

 

 

22,1

 

 

 

24,2

 

 

25,2

 

 

 

 

428.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

12,2

 

14,3

 

10,6

 

 

 

8,2

 

 

 

 

9,5

 

14,2

 

 

18,1

 

 

22,2

 

 

 

Y

 

6,5

 

7,5

 

5,8

 

 

 

4,7

 

 

 

 

5,1

 

7,2

 

 

 

10,2

 

 

12,1

 

 

 

429.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

36

 

 

 

24

 

 

18

 

 

 

 

 

25

 

 

 

 

 

 

31

 

 

 

 

33

 

 

 

24

 

 

 

Y

 

 

 

108

 

 

63

 

 

47

 

 

 

 

 

80

 

 

 

 

 

 

92

 

 

 

 

102

 

 

71

 

 

 

 

430.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

5,9

 

7,2

 

6,1

 

 

10,2

 

 

14,2

 

 

15,1

 

16,8

 

 

 

19,2

 

 

20,1

 

 

 

Y

 

6

 

 

 

 

5,4

 

4,3

 

 

8,3

 

 

 

12,1

 

 

 

12,4

 

13,2

 

 

 

15,1

 

 

18,2

 

 

 

 

 

 

 

Пример.

 

Имеются

выборочные данные

по 10

однородным

 

 

 

 

 

 

 

 

предприятиям

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Электровооруженность

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

труда на одного рабочего,

 

2

 

5

 

3

 

7

 

2

 

6

 

4

 

9

8

 

4

 

 

 

квт/ч

(х)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выпуск готовой продукции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

на раб., т

 

 

(y)

 

 

 

 

3

 

6

 

4

6

4

8

6

 

9

9

 

5

 

 

 

 

 

 

 

Линейная регрессия выражается уравнением прямой (линейной

 

 

функцией) вида:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yx

= a0 + a1x ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты уравнения регрессии могут быть найдены методом наименьших квадратов.

Сущность метода наименьших квадратов заключается в нахождении параметров модели (a1,a2 ) , при которых минимизируется сумма квадратов

отклонений эмпирических (фактических) значений результативного

109

признака от теоретических, полученных по выбранному уравнению регрессии

S = (Y Yx )2 min

Пусть имеются данные о признаках X и Y

X1

X2 ...

Xi ...

Xn

Y1

Y2 ...

Yi ...

Yn

Для линейной зависимости

 

S= ( yi a0 a1xi )2 min

 

Возьмем частные производные по a0 и a1 :

Sa0

Sa1

=2(a0 + a1xi yi )= 0

=2(a0 + a1xi yi )x = 0

Откуда система нормальных уравнений для нахождения линейной парной регреcсии имеет следующий вид:

na

+ a

x

=

y

i

 

0

1 i

 

 

xi

+ a1 xi2 =

xi yi

a0

Показателем тесноты линейной связи между факторным и результативным признаком является выборочный коэффициент корреляции.

Коэффициент корреляции вычисляется по формуле:

r = (x x)(y y)

σxσ y

Раскрыв данное соотношение, можем получить его в другой форме:

r= xy xy

σxσ y

Данная формула может быть преобразована к виду:

r =

 

 

n xy − ∑ x y

 

 

 

 

 

 

 

 

 

 

 

 

n x2 (x)2 n y2 (y)2

 

 

 

или

 

 

 

 

 

 

 

 

 

xy − ∑x

y

 

 

 

r =

 

 

n

 

(y)2 .

 

 

 

 

 

 

2

 

(x)2

 

 

2

 

x

 

 

 

n y

 

 

 

 

n

 

n

 

 

 

 

 

 

 

110

Для коэффициента корреляции выполняется

 

r

 

1.

Если r > 0,

то

 

 

между x и y прямая связь (чем больше x, тем больше y),

если r < 0,

то

между x и y обратная связь (чем больше x, тем меньше y).

 

 

Если r 0,3, то между x и y практически отсутствует связь, близкая к линейной, если 0,3 r 0,5, то между x и y умеренная связь, если r 0,7, то между x и y функциональная связь.

При помощи коэффициента корреляции уравнение линейной

регрессии может быть записано в виде:

 

 

 

yx y = r

 

σ y

 

(x x) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σx

 

 

 

 

 

Вернемся к решению задачи.

 

 

 

Составим расчетную таблицу:

 

 

 

x

 

 

 

 

y

 

 

 

 

xy

 

x2

y2

yx

(y-yx)2

2

 

 

 

 

3

 

 

 

6

 

4

9

3,61

0,3721

5

 

 

 

 

6

 

 

 

30

 

25

36

6,01

0,0001

3

 

 

 

 

4

 

 

 

12

 

9

16

4,41

0,1682

7

 

 

 

 

6

 

 

 

42

 

49

36

7,60

2,56

2

 

 

 

 

4

 

 

 

8

 

4

16

3,61

0,1521

6

 

 

 

 

8

 

 

 

48

 

36

64

6,80

1,44

4

 

 

 

 

6

 

 

 

24

 

16

36

5,20

0,64

9

 

 

 

 

9

 

 

 

81

 

81

81

9,18

0,0324

8

 

 

 

 

9

 

 

 

72

 

64

81

8,38

0,381

4

 

 

 

 

5

 

 

 

20

 

16

25

5,20

0,04

Σ = 50

 

 

 

 

60

 

 

 

343

 

304

400

60

5,761

среднее=

 

 

6

 

 

 

34,3

 

30,4

40,0

6,0

0,5761

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

na0 + a1 x = ∑ y

 

 

 

 

 

a

0

x + a x2 = ∑xy

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

10a

 

 

+50a

= 60

;

 

 

 

 

 

 

 

0

 

1

 

 

 

 

 

 

 

50a0 +304a1 = 343

 

 

 

 

 

решая систему уравнений, получаем решения:

 

 

a

0

= 2,02

.

 

 

 

 

 

 

 

 

 

 

 

 

0,796

 

 

 

 

 

 

 

 

a1 =

 

 

 

 

 

 

 

 

 

 

yx

= 2,02 + 0,796x .

 

 

 

 

 

Коэффициент корреляции:

 

 

 

Соседние файлы в папке конспекты