- •Статистика
- •О.В. Рудакова,
- •Введение
- •Раздел 1 описательная статистика
- •Глава 1. Статистическое наблюдение
- •1.1. Основные понятия
- •1.2. Тест
- •1. Объект статистического наблюдения – это:
- •2. Субъект, от которого поступают данные в ходе статистического наблюдения, называется:
- •Глава 2. Статистическая сводка и группировка
- •2.1. Основные понятия
- •1) По формуле Стерджесса:
- •2100–9100 – 1-Я группа;
- •9100–16100 – 2-Я группа;
- •16100–23100 – 3-Я группа.
- •2.3.2 Задачи
- •Глава 3. Статистические показатели
- •3.1. Основные понятия
- •3.3.2 Задачи
- •Глава 4. Средние величины
- •4.1. Основные понятия
- •4.3.2 Задачи
- •Раздел 2 аналитическая статистика
- •Глава 5. Показатели вариации
- •5.1. Основные понятия
- •5.2. Тест
- •1. Вариация – это:
- •2. К абсолютным показателям вариации не относятся:
- •5.3.2 Задачи
- •Глава 6. Ряды динамики
- •6.1. Основные понятия
- •6.3.2. Задачи
- •Глава 7. Экономические индексы
- •7.1. Основные понятия
- •7.3.2. Задачи
- •Глава 8. Выборочное наблюдение
- •8.1. Основные понятия
- •8.3.2. Задачи
- •Глава 9. Статистическое изучение взаимосвязи социально-экономических явлений
- •9.1. Основные понятия
- •9.3.2. Задачи
- •Раздел 3 социально-экономическая статистика
- •Глава 10. Статистика национального богатства. Статистика основных фондов
- •10.1. Основные понятия
- •С точки зрения накопленного капитала национальное богатство включает:
- •5. Какими показателями может характеризоваться наличие основных фондов?
- •6. Какие виды оценки основных фондов используются в практике учета и статистики?
- •7. Как определяется показатель фондоотдачи основных фондов?
- •8. Как определяется показатель фондовооруженности?
- •Глава 11. Статистика цен
- •11.1. Основные понятия
- •11.3 Задачи
- •Глава 12. Статистика населения
- •12.1. Основные понятия
- •12.3.2 Задачи
- •Глава 13. Статистика рынка труда
- •13.1. Основные понятия
- •Глава 14. Статистика уровня жизни населения
- •14.1. Основные понятия
- •Заключение
- •Литература
Глава 9. Статистическое изучение взаимосвязи социально-экономических явлений
9.1. Основные понятия
Все социально-экономические явления взаимосвязаны. Связь между ними носит причинно-следственный характер. Признаки, характеризующие причины и условия связи, называются факторными (х), а те, которые характеризуют последствия связи, - результативными (у). Между признаками х и у возникают разные по природе и характеру связи, в частности функциональные и стохастические. При функциональной связи каждому значению признака х отвечает одно четко определенное значение у. Эта связь проявляется однозначно в каждом конкретном случае. При стохастической связи каждому значению признака х отвечает определенное множество значений у, которые образовывают так называемое условное распределение. Как закон эта связь проявляется только в массе случаев и характеризуется изменением условных распределений у. Если заменить условные распределения средней величиной у, то образуется разновидность стохастической связи – корреляционная. В случае корреляционной связи каждому значению признака х отвечает среднее значение результативного признака у.
Примером стохастической и, в частности, корреляционной связи является распределение проданных на бирже недвижимости однокомнатных квартир по их стоимости у и размеру общей площади х (табл. 9.1).
Таблица 9.1 – Распределение проданных на бирже недвижимости однокомнатных квартир по их стоимости и размеру на 1.01.2010 г.
Размер общей площади, м2, x |
Количество квартир стоимостью тыс. усл. ед. |
Средняя
стоимость квартиры. тыс. усл. ед.
|
|||||
9–11 |
11–13 |
13–15 |
15–17 |
17–19 |
Всего,
|
||
До 25 |
26 |
12 |
2 |
– |
– |
40 |
10,8 |
25–30 |
4 |
9 |
12 |
5 |
– |
30 |
13,2 |
30–35 |
– |
4 |
6 |
10 |
4 |
24 |
15,2 |
35 и более |
– |
– |
– |
– |
6 |
6 |
18,0 |
Всего: |
30 |
25 |
20 |
15 |
10 |
100 |
13,0 |
Каждой группе по факторному признаку отвечает свое распределение у, которое отличается от других групп и от безусловного итогового распределения. Следовательно, наблюдается стохастическая связь между признаками.
Условные распределения можно заменить средними значениями результативного признака, которые вычисляют как среднюю арифметическую взвешенную.
Постепенное изменение средних от одной группы к другой свидетельствует о наличии корреляционной связи между признаками.
Характеристикой
корреляционной связи является линия
регрессии,
которую рассматривают в двух моделях
- аналитической группировки и регрессионного
анализа. В модели
аналитической группировки это
эмпирическая линия регрессии, которая
образовывается из групповых средних
значений результативного признака
для каждого значения (интервала)
.
Эффекты воздействия х на у определяют как отношение приростов средних групповых значений:
,
где
.
По
данным таблицы 9.1 приросты
во всех группах одинаковы – 5 м², а
средняя стоимость проданных квартир
увеличивается по группам следующим
образом:
тыс.
усл. ед.;
Следовательно, с увеличением размера общей площади квартир на 1 м² их стоимость в среднем растет соответственно на:
тыс.
усл. ед. и на
0,4 и 0,56.
Оценка плотности связи основывается на правиле сложения дисперсий. В модели аналитической группировки мерой плотности связи выступает отношение межгрупповой дисперсии к общей, которое называется корреляционным отношением:
,
где – общая дисперсия, которая измеряет вариацию результативного признака у, обусловленную воздействием всех возможных факторов;
– межгрупповая дисперсия, которая измеряет вариацию результативного признака у под воздействием только группировочного признака х.
Корреляционное
отношение колеблется от нуля до единицы,
а если выразить в процентах, то от 0 до
100 %. При отсутствии связи
,
а при условии функциональной связи
Чем
больше
приближается к единице, тем более плотная
связь.
По данным таблицы 9.1 общая дисперсия стоимости проданных квартир будет равна:
В таблице 9.2 приведена аналитическая группировка проданных квартир, которая описывает зависимость их стоимости от общей площади. Там же дан расчет межгрупповой дисперсии.
Таблица 9.2 – Аналитическая группировка проданных на бирже квартир
Общая
площадь квартиры
|
Количество
квартир
|
Средняя стоимость квартиры , тыс. усл. ед. |
|
|
До 25 |
40 |
10,8 |
-2,2 |
193,6 |
25÷30 |
30 |
13,2 |
0,2 |
1,2 |
30÷35 |
24 |
15,2 |
2,2 |
116,2 |
35 и более |
6 |
18,0 |
5,0 |
150,0 |
Итого |
100 |
13,0 |
- |
461,0 |
Корреляционное отношение
следовательно, вариация стоимости проданных квартир на 66 % объясняется вариацией их общей площади и на 34 % - вариацией других факторов, т.е. связь между признаками достаточно плотная.
Однако
плотная связь может возникнуть случайно,
поэтому необходимо проверить ее тесноту,
т.е. доказать неслучайность связи.
Проверка
тесноты связи
– это сравнение фактического значения
с
его критическим значением
для определенного уровня тесноты α и
числа степеней свободы
и
,
где
-
число групп,
-
объем совокупности. Если
,
то связь признается существенной.
Критические значения корреляционного
отношения для
приведены в специальных таблицах.
В
нашем примере
Из-за отсутствия в таблице критических
значений
используем ближайшее (
),
тогда
.
Поскольку
то связь признается существенной с
вероятностью 0,95.
В
модели регрессивного анализа
характеристикой
корреляционной связи является
теоретическая линия регрессии, описываемая
функцией
которая называется уравнением
регрессии. В
зависимости от характера связи используют:
- линейные
уравнения
когда с
изменением х
признак у
изменяется более или менее равномерно;
- нелинейные
уравнения, когда
изменение взаимосвязанных признаков
происходит неравномерно (с ускорением,
замедлением или с переменным направлением
связи), в частности: степенное
гиперболическое
параболическое
и т.п.
Чаще
применяют линейные уравнения или
приведенные к линейному виду. В линейном
уравнении параметр b
- коэффициент
регрессии
указывает, на сколько единиц в среднем
изменится у
с изменением х
на единицу. Он имеет единицу измерения
результативного признака. В случае
прямой связи b
– величина положительная, а при обратной
- отрицательная. Параметр a
– свободный
член уравнения регрессии, т.е. это
значение Y
при х = 0.
Если х не
приобретает нулевые значения, то данный
параметр имеет только расчетное значение.
Параметры определяются методом
наименьших
квадратов,
согласно которому сумма квадратов
отклонений эмпирических значений у
от Y
минимальна:
В соответствии с условием минимизации
параметры линейного уравнения регрессии
вычисляют на основании системы нормальных
уравнений:
Отсюда
Для расчета параметров уравнения параболы второго порядка методом наименьших квадратов система нормальных уравнений имеет следующий вид:
Коэффициент регрессии в небольших по объему совокупностях подвержен случайным колебаниям. Поэтому проверяют его существенность с помощью t критерия (Стьюдента):
где b – коэффициент регрессии;
-
стандартная погрешность, которую
рассчитывают по формуле:
где
–
соответственно остаточная и факторная
дисперсии;
n – объем совокупности.
Характеристикой относительного изменения у вследствие изменения х есть коэффициент эластичности:
который показывает, на сколько процентов в среднем меняется результативный признак с изменением факторного на 1 %.
На основании уравнения регрессии определяют теоретические значения Y, т.е. значение результативного признака при условии воздействия только фактора х при неизменном уровне других факторов.
Отклонения эмпирических значений у от теоретических Y называют остаточными. Они характеризуют воздействие на результативный признак всех других факторов, кроме х. Средний размер этих отклонений определяет остаточная дисперсия
.
Вариацию у, обусловленную воздействием только фактора х, называют факторной дисперсией:
Доля факторной дисперсии в общей характеризует плотность связи и называется коэффициентом детерминации:
Он
имеет такой же смысл, интерпретацию и
цифровые границы, что и
Плотность
связи оценивается также индексом
корреляции
,
однако интерпретируется только
Для линейной связи используют линейный
коэффициент корреляции (Пирсона) r:
который
принимает значения в границах
,
поэтому характеризует не только
плотность, но и направление связи.
Положительное значение свидетельствует
о прямой связи, а отрицательное – об
обратной.
Абсолютное значение r равно индексу корреляции:
Однако
для интерпретации r
необходимо перейти к уравнению
Проверка существенности связи выполняется
таким же образом, как и в модели
аналитической группировки, путем
сравнения
и
Отличия касаются только определения
,
в которых m
– число параметров уравнения регрессии.
Проверка
существенности связи в обеих моделях
может определяться также по критерию
Фишера, который функционально связан
с
и
:
или
поэтому процедура проверки и выводы идентичны.
9.2. Тест
Выберите правильный ответ:
1. По направлению связи бывают:
а) умеренные;
б) прямые;
в) прямолинейные.
2. Функциональной является связь:
а) между двумя признаками;
б) при которой определенному значению факторного признака соответствует несколько значений результативного признака;
в) при которой определенному значению факторного признака соответствует одно значение результативного признака.
3. Математическое выражение коэффициента линейной корреляции имеет следующий вид:
а) |
б) |
в) |
4. С помощью корреляционно-регрессионного анализа изучают следующие типы взаимосвязей между явлениями:
а) компонентные;
б) факторные;
в) балансовые.
5. Факторный признак – это:
а) признак, обуславливающий изменение другого, связанного с ним;
б) признак, изменяющийся под воздействием другого.
6. Зависимость между результативным и одним факторным признаком при фиксированном значении других признаков – это:
а) множественная корреляция;
б) частная корреляция;
в) парная корреляция.
7. Изменение тесноты, направления связи и установление аналитического выражения связи носит название:
а) корреляционного анализа;
б) корреляционно-регрессионного анализа;
в) регрессионного анализа.
8. Коэффициент детерминации (d) выражается следующим образом:
а) |
б) |
в) |
9. Косвенные связи имеют место в случае:
а) когда факторы взаимодействуют между собой непосредственно;
б) когда связь устанавливается формально, подтверждаясь только количественными оценками;
в) когда связь характеризуется участием какой-либо переменной, опосредующей связь между изучаемыми признаками.
10. Установление формы зависимости, определение функции регрессии, использование уравнения для оценки значений зависимой переменной – это задачи:
а) регрессионного анализа;
б) корреляционного анализа;
в) корреляционно-регрессионного анализа.
11. Анализ тесноты и направления связей двух признаков осуществляется на основе:
а) парного коэффициента корреляции;
б) частного коэффициента корреляции;
в) множественного коэффициента детерминации.
12. Для проверки типичности параметров уравнения регрессии используется:
а) критерий Фишера;
б) среднее квадратическое отклонение;
в) критерий Стьюдента.
13. Аналитическое выражение связи определяется с помощью методов анализа:
а) корреляционного;
б) регрессионного;
в) группировок.
14. Показателем, показывающим, какая часть общей вариации результативного признака объясняется изучаемым признаком - фактором, является:
а) коэффициент детерминации;
б) индекс корреляции;
в) индекс регрессии.
15. Коэффициент
эластичности
определяется следующим образом:
а) |
б) |
в) |
16. Для расчета коэффициента множественной корреляции применяется формула:
а)
;
б)
;
в)
.
9.3 Задачи
9.3.1. Примеры решения задач
Пример 1. При проверке веса импортируемого груза на таможне методом случайной повторной выборки было отобрано 200 изделий. В результате был установлен средний вес изделия 30 г при среднем квадратическом отклонении 4 г. С вероятностью 0,997 определите пределы, в которых находится средний вес изделий в генеральной совокупности.
Решение:
Сначала рассчитаем предельную ошибку выборки.
Так, при р = 0,997, t = 3. При случайном повторном отборе предельная ошибка выборки определяется по формуле:
Определим пределы генеральной средней:
.
30
– 0,84
30 +0,84, или 29,16
30,84.
Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в генеральной совокупности находится в пределах от 29,16 до 30,84 г.
Пример 2. В городе проживает 250 тыс. семей. Для определения среднего числа детей в семье была организована 2 %-я случайная бесповторная выборка семей. По её результатам было получено следующее распределение семей по числу детей (табл. 9.1).
Таблица 9.1 – Распределение семей по числу детей
в городе в 2010 г.
Число детей в семье, чел. |
Количество детей, чел. |
0 |
1 000 |
1 |
2 000 |
2 |
1 200 |
3 |
400 |
4 |
200 |
5 |
200 |
С вероятностью 0,954 найдите пределы, в которых будет находиться среднее число детей в генеральной совокупности.
Решение: вначале на основе имеющегося распределения семей определим выборочную среднюю и дисперсию. Для удобства расчет оформим в виде таблицы 9.2.
Таблица 9.2 – Вспомогательные расчеты для определения дисперсии и выборочной средней
Число детей в семье |
Количество семей |
|
|
|
|
0 |
1000 |
0 |
-1,5 |
2,25 |
2250 |
1 |
2000 |
2000 |
-0,5 |
0,25 |
500 |
2 |
1200 |
2400 |
0,5 |
0,25 |
300 |
3 |
400 |
1200 |
1,5 |
2,25 |
900 |
4 |
200 |
800 |
2,5 |
6,25 |
1250 |
5 |
200 |
1000 |
3,5 |
12,25 |
2450 |
Итого: |
5000 |
7400 |
– |
– |
7650 |
чел.;
Вычислим теперь предельную ошибку выборки (с учетом того, что p = 0,954 и t = 2). Для случайной бесповторной выборки предельная ошибка вычисляется по формуле:
Следовательно, пределы генеральной средней:
Таким образом, с вероятностью 0,954 можно утверждать, что в среднем на каждые две семьи приходятся три ребенка.
Пример 3. С целью определения доли сотрудников коммерческих банков области в возрасте старше 40 лет предполагается организовать типическую выборку пропорционально численности сотрудников мужского и женского пола с механическим отбором внутри групп. Общее число сотрудников банков составляет 12 тыс. человек, в том числе 7 тыс. мужчин и 5 тыс. женщин.
На основании предыдущих обследований было известно, что средняя из внутригрупповых дисперсий составляет 1600. Определите необходимый объем выборки при вероятности 0,997 (t = 3) и ошибке 5 %.
Решение: рассчитаем общую численность типической бесповторной выборки:
человек.
Вычислим объем отдельных типических групп:
человек;
человек.
Таким образом, необходимый объем выборочной совокупности сотрудников коммерческих банков составляет 550 человек, в том числе 321 мужчина и 231 женщина.

;