- •ВВЕДЕНИЕ
- •Программа курса «Экономико-математические методы и модели»
- •Тема 1. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ И РЕГРЕССИЯ
- •Тема 2. БАЛАНСОВЫЕ МОДЕЛИ
- •Тема 3. МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
- •3.1. Общая постановка задачи
- •3.2. Основная модель управления запасами
- •3.3. Точка заказа
- •Тема 4. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
- •4.1. Принцип оптимальности и рекуррентные соотношения
- •4.2. Вычислительная схема
- •ПРИЛОЖЕНИЯ
- •ЛИТЕРАТУРА
Тема 1. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ И РЕГРЕССИЯ
Любая экономическая политика заключается в регулировании определенных экономических параметров и поэтому должна основываться на знании того, как эти параметры влияют друг на друга и на составляющие экономической среды. Исследование экономических явлений и процессов содержит следующие этапы: экономическая постановка задачи, построение математической модели, решение модели и оценку результатов решения. Наибольшую сложность в решении поставленной задачи представляет отбор факторов, которые оказывают влияние на изучаемое явление и выбор формы связи.
Между экономическими явлениями и процессами могут существовать два типа зависимостей: а) функциональная, б) статистическая. В случае функциональной связи результативный показатель однозначно зависит от независимых переменных. В экономических исследованиях, как правило, встречаются стохастические зависимости, которые отличаются приблизительностью, неопределенностью. Они проявляются только в среднем по значительному количеству объектов (наблюдений).
Стохастическая связь — это неполная, вероятностная зависимость между показателями, которая проявляется только в массе наблюдений, иначе говоря, каждому фиксированному значению переменной соответствует статистическое распределение значений другой переменной. Это обусловлено тем, что зависимая переменная, кроме выделенной переменной, находится под влиянием ряда неконтролируемых и неучтенных факторов, а также тем, что наблюдения изучаемых величин неизбежно сопровождаются некоторыми случайными ошибками.
В экономических исследованиях часто приходится встречаться с математическими моделями, которые устанавливают связь между случайными и неслучайными величинами. Применение корреляционного и регрессионного анализа позволяет решить одну из важнейших экономических проблем ― комплексное, всестороннее изучение факторов.
Корреляционный анализ Корреляционной зависимостью называется зависимость, при
которой каждому значению одной случайной величины X соответствует среднее значение другой случайной величины Y .
10
Задачи корреляционного анализа:
1)Определение степени связи (тесноты, силы, интенсивности) двух и более переменных.
2)Отбор факторов, которые оказывают наиболее существенное влияние на результативный признак, на основе измерения степени связи между факторами. Существенные факторы используются далее
врегрессионном анализе.
3)Определение неизвестных причинных связей.
Исследование корреляционных зависимостей имеет огромное значение. Это проявляется в том, что устанавливаются место и роль каждого фактора в формировании уровня исследуемых показателей, углубляются знания об изучаемых явлениях, определяются закономерности их развития и как итог — точнее обосновываются планы и управленческие решения, более объективно оцениваются итоги деятельности предприятий и более полно определяются внутрихозяйственные резервы.
Корреляционные взаимосвязи экономических переменных можно описать с помощью так называемых корреляционных характеристик. Они позволяют математически обосновать предположения о характере связи между исследуемыми переменными. Рассмотрим парную и множественную корреляцию. Парная корреляция — это связь между двумя показателями, один из которых является факторным (независимым x ), а другой — результативным (зависимым y ). Множе-
ственная корреляция возникает от взаимодействия нескольких факторов с результативным показателем.
Необходимые условия применения корреляционного анализа.
1.Наличие достаточно большого количества наблюдений о величине исследуемых факторных и результативных показателей (в динамике или за текущий год по совокупности однородных объектов).
2.Исследуемые факторы должны иметь количественное измерение и отражение в тех или иных источниках информации.
Коэффициент парной корреляции используется в качестве меры, характеризующей степень линейной связи двух переменных. Он представляет собой ковариацию двух наборов данных (например,
xi1 и ym или xi1 и xi 2 , i =1, n , m =1, n ), деленную на произведение их
стандартных отклонений:
11
|
|
|
|
n |
|
n |
|
n |
|
|
|
|
|
|
|
|
|
ryx j |
= |
|
|
n∑xij yi |
−∑xij |
∑ym |
|
|
|
|
, |
|
|
||||
|
|
i=1 |
|
i=1 |
|
m=1 |
|
|
|
|
|
|
(1.1) |
||||
n |
2 |
|
n |
|
2 |
n |
2 |
− |
|
n |
2 |
|
|||||
|
|
n∑xij |
− |
∑xij |
|
n∑ym |
|
∑ym |
|
|
|
||||||
|
|
i=1 |
|
i=1 |
|
|
m=1 |
|
|
m=1 |
|
|
|
|
|||
|
|
|
|
n |
|
n |
|
n |
|
|
|
|
|
|
|
|
|
rx x |
= |
|
|
n∑xij xil |
−∑xij |
∑xml |
|
|
|
|
, |
|
|||||
|
|
i=1 |
|
i=1 |
|
m=1 |
|
|
|
|
|
|
(1.2) |
||||
n |
2 |
|
n |
2 |
n |
2 |
|
|
n |
2 |
|
||||||
j l |
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n∑xij |
− |
∑xij n∑xml |
− |
∑xml |
|
|
|
||||||||
|
|
i=1 |
|
i=1 |
|
|
m=1 |
|
|
m=1 |
|
|
|
|
|||
Коэффициент парной корреляции является безразмерной величиной и не зависит от выбора единиц обеих переменных. Значение коэффициента корреляции лежит в интервале от -1 (в случае строгой линейной отрицательной связи) до +1 (в случае строгой линейной положительной связи). Соответственно, положительное значение коэффициента корреляции свидетельствует о прямой связи между исследуемым и факторным показателем, а отрицательное — об обратной. Чем ближе значение коэффициента корреляции к ±1, тем теснее связь.
Близкий к нулю коэффициент корреляции говорит об отсутствии линейной связи переменных, но не свидетельствует об отсутствии их связи вообще. В случае равенства нулю показателя корреляции нельзя однозначно утверждать о том, что исследуемые показатели независимы. В данном случае можно попытаться найти более сложную модель их связи.
Значительный интерес представляют коэффициенты корреляции, характеризующие взаимосвязь факторов между собой: rx j xl . В
корреляционную модель надо подбирать независимые между собой факторы. Если коэффициент корреляции двух факторов выше 0,85, то один из них необходимо исключить из модели.
Коэффициент ryx j показывает тесноту связи между результативным показателем y и одним из факторных показателей x j .
Матрица коэффициентов парной корреляции имеет вид:
12
|
1 |
ryx |
rx y |
1 |
|
|
|
1 |
K = |
1 |
M |
|
M |
|
|
r |
|
r |
||
|
xk y |
xk x1 |
K |
r |
|
|
|
|
|
yxk |
|
|
L rx x |
(1.3) |
|||
M |
|
1 |
k . |
|
|
M |
|
|
|
|
|
|
|
|
K |
|
1 |
|
|
Коэффициент множественной корреляции принимает значе-
ния от 0 до 1, но несет в себе более универсальный смысл: чем ближе его значение к 1, тем в большей степени учтены факторы, влияющие на зависимую переменную, тем более точной выглядит построенная на основе отобранных факторов модель. Расчет коэффициента множественной корреляции производится на основе значений коэффициентов парной корреляции и технически является довольно сложной процедурой, трудоемкость которой возрастает по мере увеличения количества факторов, включенных в модель. Например, для двухфакторной модели значение коэффициента множественной корреляции R можно найти по следующей формуле:
R = |
r 2 + r 2 −2r |
r |
|
r |
|
(1.4) |
||
yx1 |
yx2 |
yx1 |
yx2 |
x1x2 . |
||||
|
|
1−r 2 |
|
|
|
|
|
|
|
|
x x |
2 |
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
Коэффициент множественной корреляции можно также найти |
||||||||
по формуле: |
|
|
|
|
|
|
|
|
|
R = |
1 − det K |
, |
|
|
(1.5) |
||
|
|
K11 |
|
|
|
|
||
где det K ― определитель корреляционной матрицы (1.3), а |
K11 ― |
|||||||
алгебраическое дополнение элемента первой строки и первого столбца матрицы K .
Квадрат коэффициента корреляции называют коэффициентом детерминации и обозначают: D = R2 . Коэффициент D показывает процент разброса значений случайной величины y . Чем меньше от-
личается коэффициент корреляции от 1, тем связь между результативным признаком и факторными признаками ближе к линейной. Если D < 0,7 , то считают, что линейной связи нет.
Регрессионный анализ
Регрессионный анализ является эффективным статистическим методом изучения взаимосвязей переменных, из которых одна рассматривается как зависимая, а другие как независимые. В основе лю
13
бой регрессионной модели лежит уравнение регрессии, которое показывает, каким будет в среднем изменение зависимой переменной y ,
если независимые переменные xi |
примут конкретные значения, т.е. |
|||||||||||||||
регрессией |
y на |
|
xi |
называется |
функция |
вида M (y |
|
x1 , x2 ,K, xk )= |
||||||||
|
|
|||||||||||||||
= f (x1 , x2 ,K, xk ), где |
M (y |
|
x) |
― математическое ожидание. Оценкой |
||||||||||||
|
||||||||||||||||
этой |
функции |
|
является |
выборочное |
уравнение регрессии |
|||||||||||
|
|
|
= f * (x , x |
|
,K, x |
|
). |
|
|
|
|
|
|
|
|
|
|
y |
x |
2 |
k |
|
|
|
|
|
|
|
|
||||
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|||
Задачи регрессионного анализа:
1.Установление формы зависимости, т. е. определение влияния факторов на величину результативного показателя (в абсолютном измерении). Для решения этой задачи подбирается соответствующий тип математического уравнения, которое наилучшим образом отражает характер изучаемой связи (прямолинейной, криволинейной и т.д.). Выбор уравнения связи играет важную роль в корреляционном анализе, потому что от правильного выбора уравнения регрессии зависит ход решения задачи и результаты расчетов.
2.Определение уравнения регрессии. Процесс нахождения функции регрессии называют выравниванием значений зависимой переменной.
3.Оценка неизвестных значений зависимой переменной.
Различают уравнения (модели) парной и множественной рег-
рессии. Если уравнение регрессии математически описывает поведение множества данных исследуемого показателя y во взаимосвязи с
массивом данных одной независимой переменной x , то говорят о модели парной регрессии. Модели множественной регрессии отражают вклад нескольких независимых переменных x j в результат исследуе-
мого показателя y .
Для отображения и оценки регрессионной взаимосвязи переменных могут использоваться различные функции: линейные, экспоненциальные, логарифмические, полиномиальные и др.
Обоснование уравнения связи делается с помощью сопоставления параллельных рядов, группировки данных и линейных графиков. Если форму зависимости обосновать трудно, то поиск модели связи можно провести с помощью разных уравнений и затем сравнить полученные результаты.
Математически обосновать предположения о характере связи между исследуемыми переменными позволяет аппарат корреляцион
14
ного анализа, по результатам которого судят о характере и тесноте связи между переменными.
Многофакторная регрессионная модель
Пусть y ― зависимая переменная, а x j ― независимые переменные, оказывающие существенное влияние на зависимую переменную. Таким образом, y является функцией переменных x j , j =1, k . С помощью функции y = f (x1 , x2 ,Kxk ) количественно оценивается ус-
редненная зависимость между переменными, которые исследуются. Мы будем рассматривать линейную зависимость между пере-
менными:
|
(1.6) |
|
y = b0 +b1 x1 +K+bk xk , |
||
|
где b0 , b1 ,…,bk ― коэффициенты регрессии.
Такая модель описывает явления, в которых изменение всех независимых переменных пропорционально связаны с изменением зависимой переменной.
Задача заключается в оценке параметров регрессии. Для оценки параметров регрессии используют метод наименьших квадратов.
Поскольку статистическая зависимость может быть выявлена только при многоразовом повторении, то далее будем считать, что для k +1 переменной мы имеем n совместных наблюдений, например n предприятий, или n отраслей народного хозяйства. Результаты наблюдений представим в виде табл. 1.
|
|
|
|
|
|
Таблица 1 |
Номер на- |
|
|
Переменные |
|
|
|
блюдения |
y |
x1 |
K |
x j |
K |
xk |
1 |
y1 |
x11 |
K |
x1 j |
K |
x1k |
2 |
y2 |
x21 |
K |
x2 j |
K |
x2k |
M |
M |
M |
K |
M |
K |
M |
i |
yi |
xi1 |
K |
xij |
K |
xik |
M |
M |
M |
K |
M |
K |
M |
n |
yn |
xn1 |
K |
xnj |
K |
xnk |
Индекс столбца j показывает соответствующую наблюдаемую переменную, а индекс строки i ― номер совместных наблюдений над
15
( k +1) переменной. Таким образом, |
xij ― результат i -го наблюдения |
|||||
над j -й переменной. |
|
|
|
|
||
Неизвестные коэффициенты b0 , b1 ,…,bk найдем из условия ми- |
||||||
нимизации суммы квадратов отклонений: |
|
|
|
|||
n |
2 |
n |
+K+bk xik )) |
2 |
→ min . |
(1.7) |
∑ yi − yi |
= ∑( yi −(b0 +b1 xi1 |
|
||||
i=1 |
|
i=1 |
|
|
|
|
Из необходимого условия экстремума получим систему нормальных уравнений для определения неизвестных коэффициентов b0 ,b1 ,b2 ,Kbk :
|
|
n |
|
n |
n |
|
|
|
nb0 +b1 ∑xi1 +L+bk ∑xik = ∑yi , |
|
|
||||||
|
|
i=1 |
|
i=1 |
i=1 |
|
|
|
n |
|
n |
|
n |
n |
|
|
|
b0 |
∑xi1 |
+b1 |
∑xi21 |
+L+bk ∑xi1 xik |
= ∑xi1 yi , |
, |
(1.8) |
|
|
i=1 |
|
i=1 |
|
i=1 |
i=1 |
||
|
|
|
|
|
|
|
|
|
LLL |
|
n |
|
n |
n |
|
|
|
|
n |
|
|
|
|
|||
b0 |
∑xik |
+b1 |
∑xi1 xik +L+bk ∑xik2 |
= ∑xik yi . |
|
|
||
|
i=1 |
|
i=1 |
|
i=1 |
i=1 |
|
|
Решая эту систему любым из известных методов (метод Гаусса, матричный метод решения систем линейных алгебраических уравнений), найдем неизвестные b0 ,b1 ,b2 ,Kbk .
Рассмотрим решение системы (1.8) в матричном виде. Обозна-
чим
y |
|
1 x |
|
x |
K x |
|
b |
|
||||||||
|
|
1 |
|
|
|
11 |
|
12 |
|
1k |
|
1 |
|
|||
y |
2 |
|
1 x21 |
x22 |
K x2k |
b2 |
|
|||||||||
Y = |
M |
, |
X = |
M |
M |
M |
K M |
|
, B = |
M |
. |
|||||
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
x |
|
K x |
|
|
|||||||
y |
n |
|
1 x |
n1 |
n2 |
|
|
b |
|
|||||||
|
|
|
|
|
|
|
|
nk |
|
n |
|
|||||
Тогда функцию регрессии (1.6) можно записать в матричном |
||||||||||||||||
виде: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.9) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
Y = XB , |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Тогда система (1.8) запишется в виде: |
|
|
|
|
(1.10) |
|||||||||||
|
|
|
|
X ' XB = X 'Y , |
|
|
|
|
|
|||||||
где X ' ― транспонированная матрица. При det(X ' X ) ≠ 0 , имеем: |
||||||||||||||||
|
|
|
|
B = (X ' X )−1 X 'Y , |
|
|
|
|
|
(1.11) |
||||||
где (X ' X )−1 ― матрица, обратная матрице (X ' |
X ). |
|
|
|||||||||||||
16
Коэффициент b0 — постоянная величина результативного показателя, которая не связана с изменением факторов x1 , x2 ,Kxk . Коэффициенты b1 ,b2 ,Kbk уравнения показывают количественное воз-
действие каждого фактора на результативный показатель при неизменности других.
Таким образом, используя тот или иной тип математического уравнения, можно определить степень зависимости между изучаемыми явлениями, т.е. узнать, на сколько единиц в абсолютном измерении изменяется величина результативного показателя с изменением факторного на единицу. Однако peгрессионный анализ не дает ответа на вопрос: тесная это связь или нет, решающее воздействие оказывает данный фактор на величину результативного показателя или второстепенное?
Коэффициенты регрессии в уравнении связи имеют разные единицы измерения, что делает их несопоставимыми, если возникает вопрос о сравнительной силе воздействия факторов на результативный показатель. Чтобы привести их в сопоставимый вид, все переменные уравнения регрессии выражают в долях среднеквадратического отклонения, другими словами, рассчитывают стандартизированные коэффициенты регрессии. Их еще называют бета-коэффициентами по символу, который принят для их обозначения.
Бета-коэффициенты и коэффициенты регрессии, связаны следующим отношением:
βi = bi σxi ,
σ y
|
|
|
|
|
|
|
|
|
|
|
∑(x − |
|
)2 |
|
|
|
|
|
|
где σ = |
x |
― среднеквадратическое отклонение, которое |
|||||||
n |
|||||||||
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
n |
||
служит критерием однородности информации, |
|
|
∑xi |
||||||
x |
= |
i=1 |
. |
||||||
|
|||||||||
|
|
|
|
|
|
|
n |
||
Бета-коэффициенты показывают, что если величина фактора увеличится на одно среднеквадратическое отклонение, то соответствующая зависимая переменная увеличится или уменьшится на долю своего среднеквадратического отклонения. Сопоставление бетакоэффициентов позволяет сделать вывод о сравнительной степени
17
воздействия каждого фактора на величину результативного показателя.
По аналогии можно сопоставить и коэффициенты эластичности, которые рассчитываются по формуле:
Эi = bi xyi .
Коэффициенты эластичности показывают, на сколько процентов в среднем изменяется функция с изменением аргумента на 1%.
Статистическая оценка модели и коэффициентов регрессии
Адекватность полученных моделей в целом определяется по критерию Фишера. Для того чтобы убедиться в надежности уравнения связи и правомерности его использования для практической цели, необходимо дать статистическую оценку надежности показателей связи. Для этого используются критерий Фишера, коэффициенты множественной корреляции и детерминации.
Критерий Фишера рассчитывается следующим образом:
|
|
|
|
|
|
|
∑n (yi − |
|
)2 (n −1) |
|
|
|||
F |
= |
|
σ |
2 |
= |
|
y |
, |
|
|||||
|
|
|
i=1 |
|
|
|
|
|
(1.12) |
|||||
σост2 |
|
|
2 |
|
|
|||||||||
набл. |
|
|
n |
|
(n −k −1) |
|
||||||||
|
|
|
|
|
|
∑ yi − yi |
|
|
||||||
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
где yi — фактические индивидуальные значения результативного по-
казателя; yi — индивидуальные значения результативного показате-
ля, рассчитанные по уравнению регрессии; y — среднее значение ре-
зультативного показателя; k — количество независимых переменных в уравнении связи; n — количество наблюдений (объем выборки).
Фактическая величина Fнабл. сопоставляется с табличной (по
таблицам F-распределения, см. Приложение 1) и делается заключение о надежности связи. Если Fнабл. ≥ Fтабл. , тогда линейную модель можно
считать адекватной с выбранной степенью точности.
Важной задачей является оценка надежности факторов, т. е. проверка существенности коэффициентов регрессии. Значимость коэффициентов регрессии проверяется по критерию Стьюдента. Для их проверки вычисляют
18
tb j |
= |
bj |
, σb j |
=σост |
|
, |
|
|
c jj |
(1.13) |
|||||||
|
||||||||
|
σ |
|
|
|
|
|||
|
|
b j |
|
|
|
|
||
где c jj ― диагональные элементы матрицы (X ' X )−1 . |
|
|||||||
Вычисленные |
значения |
сравнивают с табличным |
значением |
|||||
tα,n−k −1 . Если расчетное значение t b j выше табличного, то можно сде-
лать заключение о том, что величина коэффициента регрессии является значимой, т. е. x j существенно влияет на y . Табличные значения
tα,n−k −1 находят по таблице значений распределения Стьюдента. При
этом учитываются количество степеней свободы ( n − k −1) и уровень доверительной вероятности (в экономических расчетах обычно 0,05
или 0,1).
Если tb j ≤ tα,n−k −1 , для некоторого j , тогда соответствующие коэффициенты bj статистически ненадежны. В таком случае вместо
этих переменных следует в уравнение регрессии ввести другие экономически обусловленные переменные. Перед тем, как принять решение об исключении переменных в силу их несущественного влияния на зависимую переменную, проводят исследование с помощью коэффициента детерминации. Если коэффициент детерминации регрессии со всеми переменными несущественно изменяется по сравнению с коэффициентом детерминации уравнения регрессии с исключенными переменными, то это свидетельствует о том, что включение этих переменных в уравнение регрессии не улучшает его.
Для того, чтобы получить интервальные оценки следует найти доверительные интервалы по формулам:
[bj −tα,n−k −1σbj ;bj +tα,n−k −1σb j ] , |
(1.14) |
Исследуя таким образом все коэффициенты регрессии, получаем модель содержащую существенные факторы.
О полноте связи между исследуемыми величинами, как уже упоминалось, можно также судить также по величине множе-
ственных коэффициентов корреляции и детерминации. Например, ес-
ли коэффициент корреляции R=0,92, a коэффициент детерминации D=0,85, то это значит, что вариация результативного признака на 85% зависит от изменения исследуемых факторов, а на долю других факторов приходится 15% вариации результативного показателя. Значит, в корреляционную модель удалось включить наиболее существенные
19
факторы. Следовательно, данное уравнение можно использовать для практических целей:
а) оценки результатов хозяйственной деятельности; б) расчета влияния факторов на прирост результативного пока-
зателя; в) подсчета резервов повышения уровня исследуемого по-
казателя; г) планирования и прогнозирования его величины.
Решение задачи многофакторного корреляционного и регрессионного анализа удобно проводить на ПЭВМ по типовым про-
граммам. Сначала формируется матрица исходных данных в первой колонке которой записывается порядковый номер наблюдения, во второй — результативный показатель ( y ), а в следующих — фактор-
ные показатели ( x j ). Эти сведения вводятся в ПЭВМ и рассчитывают-
ся матрицы парных и частных коэффициентов корреляции, уравнение множественной регрессии, а также показатели, с помощью которых оценивается надежность коэффициентов корреляции и уравнения связи: критерий Стьюдента, критерий Фишера, множественные коэффициенты корреляции и детерминации.
Пример. Зависимость уровня рентабельности |
y от производи- |
||||||
тельности труда |
x1 , тыс. руб. и продолжительности оборота оборот- |
||||||
ных средств предприятия x2 , дни приведена в табл.2. |
|
|
|||||
|
|
|
|
|
|
Таблица 2 |
|
|
№ п.п. |
|
y |
x1 |
|
x2 |
|
|
1 |
|
21 |
8 |
|
18 |
|
|
2 |
|
23 |
10 |
|
19 |
|
|
3 |
|
20 |
7,9 |
|
17 |
|
|
4 |
|
21 |
8,5 |
|
18 |
|
|
5 |
|
23 |
9 |
|
21 |
|
|
6 |
|
21 |
7,2 |
|
17 |
|
|
7 |
|
22 |
7,6 |
|
20 |
|
|
8 |
|
20 |
8 |
|
17 |
|
|
9 |
|
22 |
8,3 |
|
18 |
|
|
10 |
|
21 |
7 |
|
17 |
|
1) Проверить однородность приведенных данных;
20
2)Найти парные коэффициенты корреляции и составить корреляционную матрицу. По полученным данным сделать вывод о тесноте связи между рассматриваемыми переменными. Вычислить коэффициент множественной корреляции и коэффициент детерминации;
3)Считая, что между результативным и факторными признаками имеет место линейная связь, найти линейное уравнение связи (регрессии). Для полученной линейной модели определить коэффициенты эластичности. Сделать выводы.
4)Проверить адекватность полученной модели по критерию Фишера, значимость коэффициентов регрессии, указать интервальные оценки коэффициентов регрессии и проанализировать полученные данные. Уровень значимости α = 0,1.
Решение. Для решения задачи нам понадобится следующая расчетная таблица:
Таблица 3
|
|
|
|
|
|
|
|
|
|
|
№ п/п |
y |
x1 |
x2 |
x2 |
x2 |
y × x |
y × x |
2 |
x × x |
2 |
|
|
|
|
1 |
2 |
1 |
|
1 |
||
1 |
21 |
8 |
18 |
64 |
324 |
168 |
378 |
|
144 |
|
2 |
23 |
10 |
19 |
100 |
361 |
230 |
437 |
|
190 |
|
3 |
20 |
7,9 |
17 |
62,41 |
289 |
158 |
340 |
|
134,3 |
|
4 |
21 |
8,5 |
18 |
72,25 |
324 |
178,5 |
378 |
|
153 |
|
5 |
23 |
9 |
21 |
81 |
441 |
207 |
483 |
|
189 |
|
6 |
21 |
7,2 |
17 |
51,84 |
289 |
151,2 |
357 |
|
122,4 |
|
7 |
22 |
7,6 |
20 |
57,76 |
400 |
167,2 |
440 |
|
152 |
|
8 |
20 |
8 |
17 |
64 |
289 |
160 |
340 |
|
136 |
|
9 |
22 |
8,3 |
18 |
68,89 |
324 |
182,6 |
396 |
|
149,4 |
|
10 |
21 |
7 |
17 |
49 |
289 |
147 |
357 |
|
119 |
|
Сумма: |
214 |
81,5 |
182 |
671,15 |
3330 |
1749,5 |
3906 |
1489,1 |
||
1) Для того чтобы определить однородность данных найдем их средние значения (пользуемся данными, полученными в расчетной таблице):
y = |
1 ∑yi |
= 21,4 , x1 |
= |
1 ∑xi1 = 8,15, x2 |
= |
1 ∑xi2 =18,2, n =10 . |
||||||
|
|
|
n |
|
|
|
|
n |
|
|
|
n |
|
|
|
|
|
|
|
i=1 |
|
|
i=1 |
||
|
|
n |
i=1 |
|
|
|
n |
|
n |
|||
Среднеквадратические отклонения:
21
|
∑n (yi − |
|
)2 |
|
|
σ y = |
y |
=1,019 , σx = 0,832 , |
σx =1,327 . Так как значения |
||
i=1 |
|||||
|
n |
1 |
2 |
||
|
|
|
|
||
среднеквадратических отклонений достаточно малы, то можно считать имеющиеся данные однородными.
2)Найдем коэффициенты корреляции по формулам (1.1) и (1.2)
исоставим корреляционную матрицу.
ryx1 = 0,636 , ryx2 = 0,828 ― эти коэффициенты показывают связь между результативным признаком y и x1 , x2 , соответственно.
rx1x2 = 0,525 ― показывает связь между факторными признаками x1 , x2 . Так как 0,525<0,85, то связь между ними достаточно слабая и
оба этих фактора можно включить в модель. |
|
|||
Корреляционная матрица имеет вид: |
|
|||
|
1 |
0,636 |
0,828 |
|
|
0,636 |
1 |
0,525 |
|
K = |
. |
|||
|
0,828 |
0,525 |
1 |
|
|
|
|||
Найдем коэффициент множественной корреляции по формуле:
R = |
r 2 |
+ r 2 −2r |
r |
r |
= 0,86. |
|
yx1 |
yx2 |
yx1 |
yx2 |
x1x2 |
||
|
|
1−r 2 |
|
|
|
|
|
|
x x |
2 |
|
|
|
|
|
1 |
|
|
|
|
Коэффициент детерминации равен |
D = R2 = 0,74 . Это значит, |
|||||
что изменение рентабельности на 74% зависит от изменения исследуемых факторов, а на долю других факторов приходится 16% изменения результативного показателя.
3) Найдем уравнение регрессии. Используя метод наименьших квадратов, получим систему уравнений (1.8), которая в матричном ви-
де имеет следующий вид: (X ' X )b = X 'Y , где
n |
∑xi1 |
∑xi2 |
|
|
∑yi |
|
|
|
∑xi1 |
∑xi21 |
|
|
|
|
, b |
X ' X = |
∑xi1 xi 2 |
, X 'Y = |
∑xi1 yi |
||||
|
∑xi2 |
∑xi 2 xi1 |
∑xi22 |
|
|
∑xi 2 yi |
|
b0
=b1 .b2
Нам нужно составить следующие матрицы: X ' X , X 'Y . Все данные возьмем из расчетной таблицы:
22
|
|
|
10 |
81,5 |
182 |
|
|
|
|
214 |
|
X ' X |
= |
|
81,5 |
671,15 |
1489,1 |
, X 'Y = |
1749,5 |
. |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
182 |
1489,1 |
3330 |
|
|
|
|
3906 |
|
|
|
|
|
|
|
|
|
||||
Тогда по формуле |
b = (X ' X )−1 (X 'Y ) найдем |
вектор коэффициентов |
|||||||||
регрессии. Сначала найдем обратную матрицу (см. Приложение 3).
|
|
19,84 |
−0,43 |
−0,89 |
|
|
|
|
|
(X ' X )−1 |
|
−0,43 |
0,2 |
−0,07 |
|
, |
а |
затем |
вектор |
= |
|
||||||||
|
|
−0,89 |
−0,07 |
0,08 |
|
|
|
|
|
|
|
|
|
|
|
|
|
19,84 |
−0,43 |
−0,89 |
|
|
214 |
|
|
9,085 |
|
|
−0,43 |
0,2 |
−0,07 |
|
|
|
|
|
|
|
b = (X ' X )−1 (X 'Y )= |
|
× 1749,5 |
|
= |
0,341 . |
|||||
|
−0,89 |
−0,07 |
0,08 |
|
|
3906 |
|
|
0,524 |
|
|
|
|
|
|
|
|||||
Запишем уравнение регрессии:
y = 9,085 +0,341x1 +0,524x2 .
Это уравнение выражает зависимость уровня рентабельности от производительности труда и продолжительности оборота оборотных средств. Коэффициенты уравнения показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. В нашем примере: рентабельность повышается на 0,341% при увеличении производительности труда на 1 тыс. руб. и рентабельность повышается на 0,524% при увеличении продолжительности оборота оборотных средств на 1 день.
Коэффициенты эластичности найдем по формуле Э |
= b |
|
xi |
|
|
. |
||||
|
|
|
||||||||
|
|
|
i |
|
i |
|
y |
|||
|
|
|
Таблица 4 |
|
|
|
|
|
||
|
Переменная |
x1 |
x2 |
|
|
|
|
|
|
|
|
Коэф. эластичности |
0,13 |
0,45 |
|
|
|
|
|
|
|
Согласно полученным данным, рентабельность возрастает на 0,13% при увеличении производительности труда на 1%; на 0,45% при увеличении продолжительности оборота оборотных средств на 1%.
4) Для того, чтобы убедиться в надежности уравнения связи и правомерности его использования для практической цели, необходимо дать статистическую оценку надежности показателей связи.
23
Критерий Фишера. Найдем фактическое значение критерия по формуле (1.11). Для этого вычислим данные:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 5 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yi − y |
|
|
|||||||
|
|
|
|
yi |
|
|
|
|
yi − yi |
|
|
|
|
|
||||||||
|
|
21,24406 |
|
|
-0,24406 |
|
-0,15594 |
|
|
|||||||||||||
|
|
22,44986 |
|
|
0,550136 |
|
1,049864 |
|
|
|||||||||||||
|
|
20,68595 |
|
|
-0,68595 |
|
-0,71405 |
|
|
|||||||||||||
|
|
21,41451 |
|
|
-0,41451 |
|
0,014506 |
|
|
|||||||||||||
|
|
23,15703 |
|
|
-0,15703 |
|
1,757026 |
|
|
|||||||||||||
|
|
20,44733 |
|
|
0,552675 |
|
-0,95267 |
|
|
|||||||||||||
|
|
22,15576 |
|
|
-0,15576 |
|
0,755757 |
|
|
|||||||||||||
|
|
20,72004 |
|
|
-0,72004 |
|
-0,67996 |
|
|
|||||||||||||
|
|
21,34633 |
|
|
0,653672 |
|
-0,05367 |
|
|
|||||||||||||
|
|
20,37915 |
|
|
0,620852 |
|
-1,02085 |
|
|
|||||||||||||
Тогда |
|
|
|
|
|
|
|
∑n (yi − |
|
)2 (n −1) |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
F |
|
|
σ |
2 |
|
|
|
y |
|
1,156 |
= 3,0069 . |
|||||||||||
= |
|
|
|
= |
|
i=1 |
|
|
|
|
|
|
= |
|||||||||
σост2 |
|
|
|
|
|
|
|
|
|
0,384 |
||||||||||||
набл. |
|
|
n |
|
|
2 |
(n −k |
−1) |
|
|
||||||||||||
|
|
|
|
|
|
|
∑ yi − yi |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Найдем табличное значение критерия: при уровне значимости α = 0,1 и учитывая, что в нашем примере количество степеней свободы равно n −1 =10 −1 = 9 и n −k −1 =10 −2 −1 = 7 , получим табличное значение критерия: t0,1; 9; 7 = 2,72 . Так как Fнабл. ≥ Fтабл. , то можно считать построенную модель адекватной при данном уровне значимости.
Проверим значимость коэффициентов регрессии по критерию
Стьюдента (см. Приложение 2). При уровне значимости α = 0,1 |
и учи- |
||||||||||||||||||
тывая, что в нашем примере количество |
|
степеней |
свободы |
равно |
|||||||||||||||
n −k −1 =10 −2 −1 = 7 , |
получим |
табличное |
значение |
критерия: |
|||||||||||||||
t0,1; 9 =1,89 . Теперь вычислим фактические значения |
t b j |
(формулы |
|||||||||||||||||
(1.13)): |
t |
|
= |
bj |
, |
где |
σ |
|
=σ |
|
|
|
|
. |
Для |
b |
|
имеем: |
|
b j |
b j |
ост |
c |
jj |
|
|
|||||||||||||
|
|
||||||||||||||||||
|
|
σ |
b j |
|
|
|
|
|
|
|
1 |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
24
σ |
b1 |
=σ |
ост |
c |
|
= |
0,384 ×0,2 = 0,277 , t |
b1 |
= |
b1 |
= |
0,341 |
|
=1,23 . |
Для b |
|||
|
|
0,277 |
|
|||||||||||||||
|
|
|
22 |
|
|
σb |
|
|
|
|
2 |
|||||||
|
|
|
|
|
|
|
|
|
1 |
|
|
b2 |
|
0,524 |
|
|||
имеем: σb |
=σост |
c33 = 0,384 ×0,08 = 0,175 , tb |
= |
= |
= 2,99 . |
|||||||||||||
|
|
|||||||||||||||||
|
|
|
2 |
|
|
|
|
|
|
|
2 |
σb |
0,175 |
|
||||
|
|
|
|
tb |
|
|
|
|
|
|
21 |
|
|
|
||||
Поскольку |
фактическое во втором случае выше табличного, то |
|||||||||||||||||
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
связь между результативным и факторными показателем x2 является
надежной, а величина коэффициента регрессии ― значимой. Про коэффициент уравнения регрессии b1 нельзя сказать, что он является
значимым, но поскольку по критерию Фишера модель в целом является адекватной, то фактор x1 можно оставить в модели.
Следовательно, данное уравнение можно использовать для практических целей:
а) оценки результатов хозяйственной деятельности; б) расчета влияния факторов на прирост результативного пока-
зателя; в) подсчета резервов повышения уровня исследуемого по-
казателя; г) планирования и прогнозирования его величины.
25
