Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УМК Статистика.doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
6.94 Mб
Скачать

Типовая задача

Известны следующие данные о средней продолжительности жизни и потреблении мяса на душу населения по 20 странам мира:

п/п

Страна

Средняя ожидаемая продолжительность жизни, лет

Потребление мяса, кг/чел. в год

1

Австрия

77,0

95

2

Австралия

78,2

104

3

Белоруссия

68,0

59

4

Великобритания

77,2

72

5

Венгрия

70,9

59

6

Германия

77,2

86

7

Дания

75,7

98

8

Италия

78,2

79

9

Казахстан

67,6

50

10

Канада

79,0

98

11

Латвия

68,4

56

12

Нидерланды

77,0

88

13

Россия

66,6

46

14

Румыния

69,9

43

15

США

76,7

114

16

Украина

68,8

37

17

Финляндия

76,8

63

18

Франция

78,1

91

19

Чехия

73,9

70

20

Швейцария

78,6

56

Определить наличие и форму связи между средней ожидаемой продолжительностью жизни и потреблением мяса на душу населения. Постройте уравнение регрессии и определите его параметры. По приведенным данным вычислите линейный коэффициент корреляции и детерминации, проверьте правильность выбора формы связи. Сделайте выводы.

Решение

Примем в качестве факторного признака x  потребление мяса на душу населения в год (кг), а в качестве результативного y  среднюю ожидаемую продолжительность жизни (лет).

Для выявления наличия связи между признаками построим поле корреляции:

Точки поля корреляции расположены близко друг к другу и группируются вокруг некоторой линии. Таким образом, можно сказать, что связь между признаками х и у присутствует. Предположим, что она линейная, т.е. можно построить такую прямую линию, расстояние от всех точек графика до которой будет наименьшим (см. рис. ниже).

Построим уравнение регрессии и определим его параметры.

Уравнением, которое характеризует линейную зависимость между двумя показателями, является уравнение прямой (уравнение однофакторной корреляционной связи):

ўx=a + bx,

Определим параметры a и b с помощью метода наименьших квадратов, для этого решим систему нормальных уравнений:

yx= na + bx,

yx x= ax + bx2,

где n — количество наблюдений.

Построим рабочую таблицу для промежуточных расчетов:

п/п

x

y

x2

xy

1

95

77

9025

7315

2

104

78,2

10816

8132,8

3

59

68

3481

4012

4

72

77,2

5184

5558,4

5

59

70,9

3481

4183,1

6

86

77,2

7396

6639,2

7

98

75,7

9604

7418,6

8

79

78,2

6241

6177,8

9

50

67,6

2500

3380

10

98

79

9604

7742

11

56

68,4

3136

3830,4

12

88

77

7744

6776

13

46

66,6

2116

3063,6

14

43

69,9

1849

3005,7

15

114

76,7

12996

8743,8

16

37

68,8

1369

2545,6

17

63

76,8

3969

4838,4

18

91

78,1

8281

7107,1

19

70

73,9

4900

5173

20

56

78,6

3136

4401,6

Сумма

1464

1483,8

116828

110044

Ср.знач.

73,2

74,19

-

5502,21

Подставим полученные данные в систему нормальных уравнений:

1483,8= 20a + 1464b,

110044= 1464a + 116828b.

Решив систему уравнений, получим а = 63,21, b = 0,15. Следовательно, уравнение регрессии имеет вид:

ўx=63,21 + 0,15x.

Таким образом, можно утверждать, что связь между душевым потреблением мяса и ожидаемой продолжительностью жизни прямая (т.к. b > 0), причем при увеличении потребления мяса на 1 кг на душу населения в год, средняя продолжительность жизни увеличивается на 0,15 лет.

Для оценки тесноты связи между признаками определим линейный коэффициент корреляции:

.

Рассчитаем недостающие данные:

, тогда

.

Т.к. коэффициент корреляции |r|>0,7, то связь между признаками х и у сильная (тесная).

Оценим качество построенной модели (правильность выбора формы связи), для этого определим коэффициент детерминации:

.

Таким образом, можно утверждать, что на среднюю ожидаемую продолжительность жизни только на 58% влияет факторный признак, т.е. среднедушевое потребление мяса в год. На остальные 42% влияют неучтенные факторы. В данном случае, возможно, целесообразно подобрать другое уравнение регрессии, которое будет более точно описывать связь между изучаемыми признаками.