
- •«Статистика»
- •Цели и задачи дисциплины «Статистика» и ее место в учебном процессе
- •Задачи изучения статистики.
- •Требования к студентам:
- •Тема 1. Предмет, метод, задачи и функции статистической науки. Организация статистического учета в рф
- •Основные вопросы занятия:
- •Вопросы для экспресс-интервью по теме «Предмет, метод и организация статистики»:
- •Тема 2. Статистическое наблюдение
- •Основные вопросы занятия:
- •Вопросы для самоконтроля и проверки знаний:
- •Индивидуальное задание 1.
- •Формулы для расчета объема выборки:
- •Тема 3. Сводка и группировка материалов статистического наблюдения
- •Основные вопросы занятия:
- •Вопросы для самоконтроля и проверки знаний:
- •Методические указания к выполнению задач
- •Задачи для самостоятельного решения
- •Тема 4. Статистические таблицы, их виды
- •Правила оформления статистических таблиц:
- •Тема 5. «Абсолютные и относительные величины» Методические указания по выполнению задач
- •2. Процент выполнения плана характеризует степень выполнения плана (прогноза):
- •3. Коэффициент динамики (роста) характеризует изменение явления во времени:
- •Задачи для практических занятий и самостоятельного решения
- •Тема 6, 7. Средние величины. Показатели вариации
- •Методические указания к решению задач
- •Виды средних величин
- •2. Средняя гармоническая
- •3. Средняя геометрическая.
- •4. Средняя хронологическая
- •Показатели вариации
- •3. Наиболее распространенным показателем вариации является среднее квадратическое отклонение .
- •Задачи для практических занятий и самостоятельного решения
- •Тема 8. Ряды динамики
- •Средние показатели ряда динамики:
- •3. Средний темп роста:
- •Задачи для самостоятельного решения.
- •Тема 9. Индексы Сущность и виды индексов
- •Алгоритм расчета индивидуального индекса
- •Алгоритм расчета общего индекса
- •Средние индексы
- •Индексы структурных сдвигов
- •Задачи для практических занятий и самостоятельного решения
- •Тема 10. Корреляционно-регрессионный анализ Методические указания к теме
- •Тема 11. Демографическая статистика Методические указания к теме
- •Показатели механического движения населения.
- •Перспективная численность населения
- •Задачи для практических занятий и самостоятельного решения
- •Тема 12. Статистика занятости и безработицы Задачи для практических занятий и самостоятельного решения
- •Тема 13. Статистика труда Задачи для практических занятий и самостоятельного решения
- •Тема 14.Статистика основных фондов Методические указания к теме
- •1. По полной стоимости:
- •Тема 15.Статистика оборотных активов Методические указания к теме
- •1. Коэффициент оборачиваемости
- •Тема 16. Статистика уровня жизни и оплаты труда Задачи для практических занятий и самостоятельного решения
- •Тема 17. Статистический анализ эффективности функционирования предприятий разных форм собственности Задачи для практических занятий и самостоятельного решения
- •Библиографический список Учебная литература
- •Оглавление
Тема 10. Корреляционно-регрессионный анализ Методические указания к теме
В экономических исследованиях встречаются стохастические зависимости, которые отличаются приблизительностью, неопределенностью. Они наблюдаются только в среднем по значительному количеству объектов (наблюдений). Например, увеличение фондовооруженности труда рабочих дает разный прирост производительности труда на разных предприятиях. Это объясняется тем, что все факторы, от которых зависит производительность труда, действуют в комплексе.
Корреляционная (стохастическая) связь – это неполная зависимость между показателями, которая проявляется только в массе наблюдений.
Различают парную и множественную корреляцию.
Парная корреляция – это связь между двумя показателями, один из которых является факторным, а другой – результативным.
Множественная корреляция возникает от взаимодействия нескольких факторов с результативным показателем.
Основное уравнение связи находят с помощью составления параллельных рядов, группировки данных и линейных графиков. Размещение точек на графике покажет, какая зависимость образовалась между изучаемыми показателями: прямолинейная или криволинейная.
Необходимые условия применения корреляционного анализа.
Наличие достаточно большого количества наблюдений о величине исследуемых факторных и результативных показателей (в динамике или за текущий год по совокупности однородных объектов).
Исследуемые факторы должны иметь количественное изменение и отражение в тех или иных источниках информации.
Этот метод призван решать следующие задачи:
1) Выявить зависимость признаков;
2) Установить форму связи и находить ее аналитическое выражение;
3) Измерять степень тесноты связи;
4) Рассчитывать теоретические уровни;
5) Анализировать результаты.
Первая задача – предполагает логическую обработку первичного материала, отбор фактов, влияющих на результативный признак, выявление зависимостей с помощью метода группировок.
Вторая задача – предполагает измерение степени тесноты связи с помощью коэффициента корреляции с целью суждения об адекватности полученной модели данному экономическому процессу или явлению.
Третья задача – состоит в том, чтобы по полученному уравнению регрессии находить теоретические уровни, т.е. плановые показатели на предстоящий период или прогнозировать развитие явления.
Термин «корреляция» от латинского «correlatio» - соотношение, заимствована из естествознания. Суть в том, что значениям факторного признака соответствуют не строго определенные значения результативного признака, как в функциональных связях, а распределение этих значений,
Термин «регрессия» – заимствовано из биологии, от латинского «regressio» – движение назад.
Корреляционно-регрессионный метод исследования состоит из двух этапов.
Корреляционный метод решает следующие задачи:
-выявить зависимость между признаками;
-установить форму связи и находить ее аналитическое выражение;
-измерять степень тесноты связи.
Регрессионный метод решает следующие задачи:
-дает выражение аналитической форме связи в виде уравнения связи (регрессии);
-на основании этого выражения рассчитываются ожидаемые или планируемые показатели на предстоящий период.
Исходные эмпирические (фактические) данные наносим на графике корреляционного поля и на основании графика делаем вывод о форме связи. На оси абсцисс откладываем факторные значения признака, а на оси ординат результативные. Построив график по эмпирическим значениям обоих признаков, делаем вывод о форме связи, ее направлении, а по разбросу точек – о тесноте связи.
Расположение точек на графике («корреляционное поле») может показать прямую, обратную зависимость или отсутствие зависимости. Графический метод – это самый простой метод определения формы связи.
Прежде чем перейти к построению уравнения регрессии необходимо определить коэффициент корреляции парной или множественной, с тем, чтобы убедиться в необходимости дальнейших расчетов.
Следующим этапом исследования является количественное определение степени влияния факторных признаков на результативный. Мерой существенности влияния являются показатели тесноты связи: линейный коэффициент корреляции (r) при прямолинейной форме связи и корреляционное отношение (n) при криволинейной форме связи, которые дают возможность судить в будущем о соответствии полученной экономико-статистической модели экономическому процессу или явлению.
Линейный коэффициент корреляции обозначается «r» и изменяется при прямой связи от 0 до +1, а при обратной связи – от 0 до –1. О тесноте связи свидетельствует абсолютная величина коэффициента корреляции, Чем теснее связь между признаками, тем ближе к единице будет значение линейного коэффициента корреляции и наоборот. Для качественной оценки связи используется таблица Чеддока.
Таблица Чеддока
Значение коэффициента |
0,1-0,3 |
0,3-0,5 |
0,5-0,7 |
0,7-0,9 |
0,9-0,99 |
Характеристика тесноты связи |
Слабая |
Умеренная |
Заметная |
Высокая |
Весьма высокая |
При наличии криволинейной связи «r» недооценивает тесноту связи и в некоторых случаях дает неверное представление о степени тесноты связи.
На этом заканчивается первый этап исследования – корреляционный анализ, который позволил определить направление, форму и силу тесноты связи. Результаты корреляционного анализа служат основой для проведения регрессионного анализа, дающего выражение аналитической форме связи в виде построения теоретического уравнения регрессии.
В качестве примера, приведем расчеты выполненные для ЦББ (Центральная Бассейновая больница).
Как правило, исследуемые процессы характеризуются большой сложностью и многообразием, и представляют собой результат действия многих факторов. Поэтому, чтобы отразить это влияние на результативный признак, необходимо производить расчеты на основе методов множественной корреляции. Это очень громоздкие расчеты, но использование современного программного обеспечения позволяет сократить трудоемкость расчетов. Но смысл корреляционно-регрессионного анализа не теряется, если для упрощения расчетов будем исходить из двухфакторного комплекса, т.е. такая постановка задачи выполнена выше. В расчетах будут участвовать два признака, на результативный будет действовать один факторный признак.
При анализе должно выполняться основное условие – качественная и количественная однородность единиц наблюдения, которое обеспечивает получение регрессионной модели, адекватной эмпирическим данным (статистическому материалу).
Выполняются соответствующие расчеты для каждой больницы на статистическом материале за последние 4 года.
Для центральной больницы формируем расчетную таблицу для нахождения линейного коэффициента корреляции и параметров уравнения регрессии.
Расчетная таблица для «r» и уровня регрессии
Х Объем медицинских услуг в койко-днях, тыс.койко-дней |
У Расходы по заработной плате медперсонала, тыс. руб. |
ХУ |
Х2 |
У2 |
Ух |
46540 |
22258 |
1035887320 |
2165971600 |
495418564 |
22156 |
50728 |
36020 |
1827222560 |
2573329984 |
1297440400 |
36395 |
53591 |
46410 |
2487158310 |
2871995281 |
2153888100 |
46129 |
52952 |
43911 |
2325175272 |
2803914304 |
1928175921 |
43956 |
åХ |
åУ |
åХУ |
åХ2 |
åУ2 |
|
203811 |
148599 |
7675443462 |
10415211169 |
5874922985 |
|
Линейный коэффициент корреляции для парной зависимости исчисляется по следующей формуле:
|
(84) |
где n - количество точек в выборке.
Существуют и другие модификации этой формулы. Подставляя значения в формулу, получим 0,69, что свидетельствует о высокой тесноте связи между изучаемыми признаками, а знак при коэффициенте «плюс» – о прямой связи.
В целях синтезирования модели y от x определите уравнение прямолинейной связи и нанесите полученную при этом теоретическую линию регрессии на график корреляционного поля.
Уравнение прямой линии имеет вид:
Ух= ао + а1 х;
|
(85)
|
где Ух – индивидуальные значения результативного признака;
х - индивидуальные значения факторного признака;
ао, а1 – параметры уравнения регрессии.
Способом наименьших квадратов решим систему нормальных уравнений, находя параметры ао и а1:
|
(86) |
Делим каждое уравнение на коэффициенты при ао и получаем:
Путем вычитания из второго уравнения первого получаем:
150 а1 = 510: а1 = 3,4
Подставляя значение а1 в первое уравнение получаем:
Ао+50950 ×3,4 = 37150:ао = -136,080
Уравнение регрессии примет вид:
Ух= - 136,080 + 3,4х
Проверка указана в последней графе таблицы.
Соответствующие расчеты свидетельствуют о тесноте связи между признаками, т.е. о степени адекватности предполагаемой регрессионной модели процессу, который она описывает: ЦББ – 0,69. Линейный коэффициент корреляции изменяется, при прямой связи, от 0 до 1, а она такова, что было доказано построением графиков на корреляционных полях. Чем теснее связь между признаками, тем ближе к единице будет значение коэффициента корреляции. Для качественной оценки тесноты связи используется таблица Чеддока, в соответствии с которой для ЦББ – связь оценивается как высокая.
Таким образом, используя полученную модель, можно достаточно быстро просчитать различные прогнозные варианты затрат по заработной плате в зависимости от различных вариантов объема медицинских услуг.
Соответствующие расчеты свидетельствуют о тесноте связи между признаками, т.е. о степени адекватности предполагаемой регрессионной модели процессу, который она описывает: ЦББ – 0,69. Линейный коэффициент корреляции изменяется, при прямой связи, от 0 до 1, а она такова, что было доказано построением графиков на корреляционных полях. Чем теснее связь между признаками, тем ближе к единице будет значение коэффициента корреляции. Для качественной оценки тесноты связи используется таблица Чеддока, в соответствии с которой для ЦББ – связь оценивается как высокая.
Таким образом, используя полученную модель, можно достаточно быстро просчитать различные прогнозные варианты затрат по заработной плате в зависимости от различных вариантов объема медицинских услуг.
Задача 67
По данным таблицы определить зависимость урожайности зерновых культур (Y) от качества земли (Х).
Зависимость урожайности зерновых культур и качества земли
Номер хозяйства |
Качество земли, балл |
Урожайность, ц/га |
Номер хозяйства |
Качество земли, балл |
Урожайность, ц/га |
1 |
32 |
19,5 |
11 |
45 |
24,2 |
2 |
33 |
19,0 |
12 |
46 |
25,0 |
3 |
35 |
20,5 |
13 |
47 |
27,0 |
4 |
37 |
21,0 |
14 |
49 |
26,8 |
5 |
38 |
20,8 |
15 |
50 |
27,2 |
6 |
39 |
21,4 |
16 |
52 |
28,0 |
7 |
40 |
23,0 |
17 |
54 |
30,0 |
8 |
41 |
23,3 |
18 |
55 |
30,2 |
9 |
42 |
24,0 |
19 |
58 |
32,0 |
10 |
44 |
24,5 |
20 |
60 |
33,0 |
Система уравнений имеет вид:
Значения x, y, xy, x2 рассчитать на основе фактических данных, расчеты свести в таблицу.
n |
x |
y |
xy |
x2 |
y2 |
Yx |
1 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
3 |
|
|
|
|
|
|
… |
|
|
|
|
|
|
20 |
|
|
|
|
|
|
Итого |
|
|
|
|
|
|
Задача 68
Определить зависимость производительности труда (Y) от возраста работников (Х).
Поскольку при увеличении одного показателя значение другого возрастает до определенного уровня, а затем начинает снижаться (зависимость производительности труда от возраста), то для записи зависимости подходит парабола второго порядка:
Yx = a + bx + cx2 |
(87) |
Система уравнений имеет вид:
|
(88) |
Средний возраст по группе (Х) |
Средняя месячная выработка (Y) |
X/10 |
YX |
X2 |
X2Y |
X3 |
X4 |
Yx |
20 |
4,2 |
|
|
|
|
|
|
|
25 |
4,8 |
|
|
|
|
|
|
|
30 |
5,3 |
|
|
|
|
|
|
|
35 |
6,0 |
|
|
|
|
|
|
|
40 |
6,2 |
|
|
|
|
|
|
|
45 |
5,8 |
|
|
|
|
|
|
|
50 |
5,3 |
|
|
|
|
|
|
|
55 |
4,4 |
|
|
|
|
|
|
|
60 |
4,0 |
|
|
|
|
|
|
|
Всего |
46,0 |
|
|
|
|
|
|
|
Задача 69
Определить влияние на рентабельность (Y) материалоотдачи (Х1), фондоотдачи (Х2), производительности труда (Х3), продолжительности оборота оборотных средств (Х4), удельного веса продукции высшей категории качества. Рассчитать влияние каждого фактора на прирост уровня рентабельности.
Исходные данные для корреляционного анализа
|
№ п/п |
Y |
X1 |
X2 |
X3 |
X4 |
X5 | ||
---|---|---|---|---|---|---|---|---|---|
|
1 |
22,5 |
2,4 |
80,0 |
8,00 |
25,0 |
25,00 | ||
|
2 |
23,8 |
2,7 |
88,0 |
7,30 |
23,0 |
22,5 | ||
|
3 |
24,7 |
2,5 |
87,0 |
7,90 |
22,0 |
26,0 | ||
|
… |
|
|
|
|
|
| ||
|
40 |
32,4 |
3,20 |
94,4 |
9,90 |
18,0 |
36,5 | ||
|
|
Yх = a + b1x1 + b2x2 + b3x3 + … + bnxn
|
(89) |
Расчет влияния факторов на прирост уровня рентабельности:
Факторный показатель |
Уровень показателя |
Хi |
bi |
Yxi | |
план |
факт | ||||
Х1 |
205 |
2.4 |
|
|
|
Х2 |
90.0 |
80.0 |
|
|
|
Х3 |
8.2 |
8.0 |
|
|
|
Х4 |
22.0 |
25.0 |
|
|
|
Х5 |
30.0 |
25.0 |
|
|
|
Y |
25.0 |
22.5 |
|
- |
|
Задача 70
По группам рабочих судостроительного завода имеются следующие данные:
Стаж работы, лет (x ) |
1 |
2 |
3 |
4 |
5 |
Выработка одного рабочего за смену, штук (y) |
80 |
90 |
120 |
130 |
160 |
Рассчитайте линейный коэффициент корреляции стажа работы и выработки и коэффициент корреляции рангов. Проанализируйте параметры уравнения регрессии.