
- •Федеральное агентство по образованию
- •Содержание
- •Глава 1. Сводка и группировка статистических данных
- •Механизм проведения группировки данных
- •Название таблицы (общий заголовок)
- •Типовая задача
- •Задачи для самостоятельной работы Задача 1.1
- •Задача 1.2
- •Задача 1.3
- •Задача 1.4
- •Задача 1.5
- •Задача 1.6
- •Задача 1.7
- •Задача 1.8
- •Задача 1.9
- •Тестовые задания
- •Домашнее задание
- •Глава 2. Абсолютные, относительные и средние величины
- •Типовая задача 1
- •Типовая задача 2
- •Степенные средние
- •Структурные средние
- •Типовая задача 3
- •Типовая задача 4
- •Задачи для самостоятельной работы Задача 2.1
- •Задача 2.2
- •Задача 2.3
- •Задача 2.4
- •Задача 2.5
- •Задача 2.6
- •Задача 2.7
- •Задача 2.15
- •Задача 2.16
- •Задача 2.17
- •Тестовые задания
- •Домашнее задание
- •Глава 3. Вариация признака
- •Типовая задача 1
- •Типовая задача 2
- •Задачи для самостоятельной работы
- •Глава 4. Выборочное наблюдение
- •Распределение вероятности в выборках в зависимости от величины t и объема выборки n
- •Типовая задача 1
- •Типовая задача 2
- •Задачи для самостоятельной работы Задача 4.1
- •Задача 4.2
- •Задача 4.3
- •Задача 4.4
- •Задача 4.5
- •Задача 4.6
- •Глава 5. Анализ рядов динамики
- •Типовая задача 1
- •Типовая задача 2
- •Типовая задача 3
- •Задачи для самостоятельной работы Задача 5.1
- •Задача 5.2
- •Задача 5.3
- •Задача 5.4
- •Задача 5.5
- •Задача 5.6
- •Задача 5.7
- •Задача 5.8
- •Тестовые задания
- •Глава 6. Индексы
- •Основные формулы исчисления индивидуальных и сводных индексов
- •Типовая задача 1
- •Типовая задача 2
- •Типовая задача 3
- •Задачи для самостоятельной работы Задача 6.1
- •Задача 6.2
- •Задача 6.3
- •Задача 6.4
- •Задача 6.5
- •Задача 6.6
- •Задача 6.7
- •Задача 6.8
- •Задача 6.9
- •Задача 6.10
- •Тестовые задания
- •Глава 7. Изучение взаимосвязи социально-экономических явлений
- •Типовая задача
- •Задачи для самостоятельной работы Задача 7.1
- •Задача 7.2
- •Задача 7.3
- •Исходные данные по странам за 2002 год
- •Задача 7.4
- •Задача 7.5
- •Тестовые задания
- •Медведева т.Ю. Статистика (общая теория статистики)
Типовая задача
Известны следующие данные о средней продолжительности жизни и потреблении мяса на душу населения по 20 странам мира:
№ п/п |
Страна |
Средняя ожидаемая продолжительность жизни, лет |
Потребление мяса, кг/чел. в год |
1 |
Австрия |
77,0 |
95 |
2 |
Австралия |
78,2 |
104 |
3 |
Белоруссия |
68,0 |
59 |
4 |
Великобритания |
77,2 |
72 |
5 |
Венгрия |
70,9 |
59 |
6 |
Германия |
77,2 |
86 |
7 |
Дания |
75,7 |
98 |
8 |
Италия |
78,2 |
79 |
9 |
Казахстан |
67,6 |
50 |
10 |
Канада |
79,0 |
98 |
11 |
Латвия |
68,4 |
56 |
12 |
Нидерланды |
77,0 |
88 |
13 |
Россия |
66,6 |
46 |
14 |
Румыния |
69,9 |
43 |
15 |
США |
76,7 |
114 |
16 |
Украина |
68,8 |
37 |
17 |
Финляндия |
76,8 |
63 |
18 |
Франция |
78,1 |
91 |
19 |
Чехия |
73,9 |
70 |
20 |
Швейцария |
78,6 |
56 |
Определить наличие и форму связи между средней ожидаемой продолжительностью жизни и потреблением мяса на душу населения. Постройте уравнение регрессии и определите его параметры. По приведенным данным вычислите линейный коэффициент корреляции и детерминации, проверьте правильность выбора формы связи. Сделайте выводы.
Решение
Примем в качестве факторного признака x потребление мяса на душу населения в год (кг), а в качестве результативного y среднюю ожидаемую продолжительность жизни (лет).
Для выявления наличия связи между признаками построим поле корреляции:
Точки поля корреляции расположены близко друг к другу и группируются вокруг некоторой линии. Таким образом, можно сказать, что связь между признаками х и у присутствует. Предположим, что она линейная, т.е. можно построить такую прямую линию, расстояние от всех точек графика до которой будет наименьшим (см. рис. ниже).
Построим уравнение регрессии и определим его параметры.
Уравнением, которое характеризует линейную зависимость между двумя показателями, является уравнение прямой (уравнение однофакторной корреляционной связи):
ўx=a + bx,
Определим параметры a и b с помощью метода наименьших квадратов, для этого решим систему нормальных уравнений:
yx= na + bx,
yx x= ax + bx2,
где n — количество наблюдений.
Построим рабочую таблицу для промежуточных расчетов:
№ п/п |
x |
y |
x2 |
xy |
1 |
95 |
77 |
9025 |
7315 |
2 |
104 |
78,2 |
10816 |
8132,8 |
3 |
59 |
68 |
3481 |
4012 |
4 |
72 |
77,2 |
5184 |
5558,4 |
5 |
59 |
70,9 |
3481 |
4183,1 |
6 |
86 |
77,2 |
7396 |
6639,2 |
7 |
98 |
75,7 |
9604 |
7418,6 |
8 |
79 |
78,2 |
6241 |
6177,8 |
9 |
50 |
67,6 |
2500 |
3380 |
10 |
98 |
79 |
9604 |
7742 |
11 |
56 |
68,4 |
3136 |
3830,4 |
12 |
88 |
77 |
7744 |
6776 |
13 |
46 |
66,6 |
2116 |
3063,6 |
14 |
43 |
69,9 |
1849 |
3005,7 |
15 |
114 |
76,7 |
12996 |
8743,8 |
16 |
37 |
68,8 |
1369 |
2545,6 |
17 |
63 |
76,8 |
3969 |
4838,4 |
18 |
91 |
78,1 |
8281 |
7107,1 |
19 |
70 |
73,9 |
4900 |
5173 |
20 |
56 |
78,6 |
3136 |
4401,6 |
Сумма |
1464 |
1483,8 |
116828 |
110044 |
Ср.знач. |
73,2 |
74,19 |
- |
5502,21 |
Подставим полученные данные в систему нормальных уравнений:
1483,8= 20a + 1464b,
110044= 1464a + 116828b.
Решив систему уравнений, получим а = 63,21, b = 0,15. Следовательно, уравнение регрессии имеет вид:
ўx=63,21 + 0,15x.
Таким образом, можно утверждать, что связь между душевым потреблением мяса и ожидаемой продолжительностью жизни прямая (т.к. b > 0), причем при увеличении потребления мяса на 1 кг на душу населения в год, средняя продолжительность жизни увеличивается на 0,15 лет.
Для оценки тесноты связи между признаками определим линейный коэффициент корреляции:
.
Рассчитаем недостающие данные:
,
тогда
.
Т.к. коэффициент корреляции |r|>0,7, то связь между признаками х и у сильная (тесная).
Оценим качество построенной модели (правильность выбора формы связи), для этого определим коэффициент детерминации:
.
Таким образом, можно утверждать, что на среднюю ожидаемую продолжительность жизни только на 58% влияет факторный признак, т.е. среднедушевое потребление мяса в год. На остальные 42% влияют неучтенные факторы. В данном случае, возможно, целесообразно подобрать другое уравнение регрессии, которое будет более точно описывать связь между изучаемыми признаками.