
- •Статистический анализ взаимосвязи социально-экономических явлений
- •Брянск издательство бгту
- •Карабан, л.А. Статистический анализ взаимосвязи социально-экономических явлений: учеб.- практ. Пособие / л.А. Карабан. – бгту, 2010. – 152 с. – (Сер. «Необъятная статистика»).
- •Предисловие
- •Введение
- •Раздел I. МетоДы изучения взаимосвязей в статистике
- •Глава 1. Теоретические основы исследования взаимосвязей социально-экономических явлений
- •Виды и формы взаимосвязи между явлениями
- •1.2. Общие понятия о стохастических, функциональных и корреляционных связях
- •1.4. Основные приемы изучения взаимосвязей
- •Глава 2. Теоретические основы Корреляционного анализа
- •2.2. Статистические методы изучения корреляционной связи
- •2.3. Измерение тесноты корреляционной связи
- •Рассмотрим использование парных коэффициентов корреляции для измерения многофакторной связи
- •2.5. Корреляционный анализ порядковых переменных или ранговая корреляция
- •Рассмотрим применение коэффициента корреляции рангов Спирмэна
- •Оценим возможности использования коэффициента корреляции рангов Кендэлла
- •Определим возможности применения коэффициента конкордации
- •2.6. Корреляция категоризированных (номинальных) переменных
- •Рассмотрим использование коэффициентов взаимной сопряженности
- •Глава 3. Дисперсионный анализ как метод установления тесноты связи между Явлениями
- •3.1. Общее понятие и цели дисперсионного анализа
- •3.2. Оценка существенности и достоверности связи. Многофакторный дисперсионный анализ
- •Глава 4. Проведение регрессионного анализа
- •4.1. Построение однофакторного уравнения регрессии
- •4.3. Построение и статистический анализ двухфакторной линейной модели (трехмерной регрессии)
- •4. 4. Экономическая интерпретация многофакторной регрессионной модели
- •Раздел II. Практическая реализация методов расчета показателей связи ______________________________________________
- •Глава 1. Использование средств microsoft excel для оценки взаимосвязей явлений
- •1.1.Технология решения задач корреляционного
- •Рассмотрим процедуру построения системы показателей и анализ матрицы коэффициентов парной корреляции.
- •Проведём обзор выбора вида моделей с оценкой их параметров
- •Рассмотрим порядок проведения проверки качества построенной модели
- •Рассмотрим практическую оценку влияния отдельных факторов на зависимую переменную в построенной модели регрессии.
- •Разберём вопрос использования многофакторных моделей для анализа и прогнозирования развития экономических систем.
- •Глава 2. Примеры решения типовых задач
- •2.1. Определение параметров уравнения регрессии
- •2.2. Вычисление линейного коэффициента корреляции
- •2. 3. Задачи для закрепления изученного материала
- •2.4. Задачи для самостоятельного выполнения
- •Правила ответа на письменный тест
- •Заключение
- •Список использованной и рекомендуемой литературы
- •Приложения приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
Глава 4. Проведение регрессионного анализа
Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчетных значений зависимой переменной (функции регрессии).
4.1. Построение однофакторного уравнения регрессии
Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции.
Сложность заключается в том, что из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типа функции может опираться на теоретические знания об изучаемом явлении, опыт предыдущих аналогичных исследований, или осуществляться эмпирически — перебором и оценкой функций разных типов и т.п.
При изучении связи экономических показателей производства (деятельности) используют различного вида уравнения прямолинейной и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) линейной корреляционной связи имеет вид:
(46)
где
— теоретические
значения результативного признака,
полученные по уравнению регрессии;
,
— коэффициенты
(параметры) уравнения регрессии.
Поскольку а0 является средним значением у в точке х=0, экономическая интерпретация часто затруднена или вообще невозможна.
Коэффициент парной линейной регрессии а имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Уравнение показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, т.е. вариацию у, приходящуюся на единицу вариации х. Знак а1 указывает направление этого изменения.
Параметры
уравнения а0,
а1
находят
методом
наименьших квадратов (метод
решения систем уравнений, при котором
в качестве решения принимается точка
минимума суммы квадратов отклонений),
т.е. в основу этого метода положено
требование минимальности сумм квадратов
отклонений эмпирических данных
от
выравненных
:
(47)
Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
;
(48)
.
Решим эту систему в общем виде
;
(49)
.
(50)
Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
,
(51)
или
,
(52)
где
Определив
значения а0,
а1
и
подставив их в уравнение связи
,
находим
значения
,
зависящие только от заданного значения
х
[6].
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
│►12. Рассмотрим построение однофакторного уравнения регрессии зависимости производительности труда у от стажа работы х по данным табл. 4. (10 рабочих одной бригады заняты производством радиоэлектронных изделий, данные ранжированы по стажу их работы). Исходя из экономических соображений стаж работы выбран в качестве независимой переменной х. Сопоставление данных параллельных рядов признаков х и у показывает, что с возрастанием признака х (стажа работы), растет, хотя и не всегда, результативный признак у (производительность труда). Следовательно, между х и у существует прямая зависимость, пусть неполная, но выраженная достаточно ясно.
Таблица 13 Распределение рабочих бригады по выработке и стажу работы
Для уточнения формы связи между рассматриваемыми признаками используем графический метод. Нанесем на график точки, соответствующие значениям х, у, получим корреляционное поле, а соединив их отрезками, — ломаную регрессии* (рис. 3). Анализируя ломаную линию, можно предположить, что возрастание выработки у идет равномерно, пропорционально росту стажа работы рабочих х. В основе этой зависимости в данных конкретных условиях лежит прямолинейная связь (см. пунктирную линию на рис. 3), которая может быть выражена простым линейным уравнением регрессии:
где
Данный метод эффективен лишь при небольшом объеме совокупности и достаточно тесной связи между признаками. Более наглядную характеристику связи можно получить, построив ломаную регрессии по частным средним.
10
8
6 6
4
1 3 5 7 9 х, годы Рис.3. Зависимость выработки одного рабочего у от стажа работы х (по данным табл.13)
Пользуясь расчетными значениями (табл. 13), исчислим параметры для данного уравнения регрессии:
Следовательно, регрессионная модель распределения выработки по стажу работы для данного примера может быть записана в виде конкретного простого уравнения регрессии:
Это уравнение характеризует зависимость среднего уровня выработки рабочими бригады от стажа работы. Расчетные значения у, найденные по данному уравнению, приведены в табл.1. Правильность расчета параметров уравнения регрессии может быть проверена сравнением сумм итогов граф по у и У табл.13 (при этом возможно некоторое расхождение вследствие округления расчетов). ◄
|
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
4.2. ПРОВЕРКА АДЕКВАТНОСТИ РЕГРЕССИОННОЙ МОДЕЛИ
Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.
Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объему совокупности. Поэтому показатели регрессии и корреляции — пара метры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.
При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют, на сколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.
Рассмотрим t-критерий Стьюдента. Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия для параметра а0:
(53)
для параметра a1:
(54)
где n — объём выборки;
-
среднее
квадратическое отклонение результативного
признака у от выравненных значений
;
(55)
или
(56)
Вычисленные
по формулам значения сравнивают с
критическими t,
которые определяют по таблице Стьюдента
с учетом принятого уровня значимости
а и числом степеней свободы вариации
= n-2.
В социально-экономических исследованиях
уровень значимости, а обычно принимают
равным 0,05.
Параметр признается значимым (существенным) при условии, если tрасч>tтабл. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
│►13.
Для
проверки значимости коэффициентов
регрессии исследуемого уравнения
= 4,0 + 0,6х исчислим
t-критерий Стьюдента с
=10-2
= 8 степенями свободы.
Рассмотрим вспомогательную таблицу (табл. 14).
Таблица 14
Расчетные
значения, необходимые
для
исчисления
,
|
|
|
|
|
|
-3,3 |
10,89 |
-2,7 |
7,29 |
-0,6 |
0,36 |
-2,3 |
5,29 |
-2,1 |
4,41 |
-0,2 |
0,04 |
-1,3 |
1,69 |
-1,5 |
2,25 |
0,2 |
0,04 |
-0,3 |
0,09 |
-0,9 |
0,81 |
0,6 |
0,36 |
-0,3 |
0,09 |
-0,3 |
0,09 |
0,0 |
0,0 |
0,7 |
0,49 |
0,3 |
0,09 |
0,4 |
0,16 |
0,7 |
0,49 |
0,9 |
0,81 |
-0,2 |
0,04 |
1,7 |
2,89 |
1,5 |
2,25 |
0,2 |
0,04 |
2,7 |
7,29 |
2,1 |
4,41 |
0,6 |
0,36 |
1,7 |
2,89 |
2,7 |
7,29 |
-1,0 |
1,0 |
Итого |
32,10 |
- |
29,70 |
- |
2,40 |
Средние квадратические отклонения (табл. 14):
Расчетные значения t-критерия Стьюдента:
По
таблице распределения Стьюдента для
=8
находим критическое значение t-критерия:
(tнабл=3,307
при α=0,05).
Поскольку расчетное значение tрасч>tтабл, оба параметра а0, а1 признаются значимыми по величине). ◄
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
Можно провести экономическую интерпретацию параметров уравнения регрессии
После проверки адекватности, установления точности и надежности построенной модели (уравнения регрессии) ее необходимо проанализировать. Прежде всего, нужно проверить согласуются ли знаки параметров с теоретическими представлениями и соображениями о направлении влияния признака-фактора на результативный признак (показатель).
В
,
характеризующем зависимость выработки
за смену рабочим у от стажа работы х,
параметр а1>0.
Следовательно, с возрастанием стажа
выработка увеличивается.
Из уравнения следует, что возрастание на 1 год стажа рабочего приводит к увеличению им дневной выработки в среднем на 0,6 изделия (величина параметра а1).
Для удобства интерпретации параметра а1 используют коэффициент эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле, %:
(57)
В рассматриваемом примере
.
Следовательно, с возрастанием стажа работы на 1% следует ожидать повышения производительности труда в среднем на 0,45%.
Этот вывод справедлив только для изучаемой совокупности рабочих при конкретных условиях работы.
Если данная совокупность и условия работы типичны, то коэффициент регрессии может быть использован для нормирования и планирования производительности труда рабочих этой профессии.
Имеет
смысл вычислить остатки
,
характеризующие отклонение i-х наблюдений
от значений, которые следует ожидать в
среднем.
Анализируя
остатки, можно сделать ряд практических
выводов. Значение остатков (табл. 7) имеют
как положительные, так и отрицательные
отклонения от ожидаемого уровня
анализируемого показателя. Экономический
интерес представляют выработки рабочих,
обозначенные номерами: 5; 1; 4; 8; 7, поскольку
их выработки отличаются наибольшими
отклонениями. Тем самым выявляются
передовые рабочие – номера 1; 8; 7,
обеспечивающие наибольшее повышение
средней выработки (наибольшие положительные
остатки) и отстающие, требующие особого
внимания рабочие – номера 5, 4 (наибольшие
отрицательные остатки). В итоге
положительные отклонения выработки
большинства рабочих уравновешиваются
отрицательными отклонениями небольшого
числа рабочих, т.е.
.