Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Экономико-математические методы и модели Часть 1

..pdf
Скачиваний:
4
Добавлен:
15.11.2022
Размер:
21.78 Mб
Скачать

41

Получаем значения:

Из представленного комплекса данных выберем такие, которые нам потребуются для последующего анализа: расчетные значения коэффициентов регрессии, величины t-критерия, стандартную ошибку и показатели уровня значимости α.

Запишем полученное уравнение:

y = –2150.798+0.00142x1 + 1422.01125x2 + 1462.328x3.

41

Проведем статистический анализ этого уравнениярегрессии.

Интерпретация коэффициентов регрессии. Сдвиг a0

представляет собой вспомогательную величину, которая необходима для получения оптимальных прогнозов.

Коэффициенты регрессии a1, a2, …, am показывают степень влияния каждой из переменных на размер производительности при условии, что другие независимые переменные остаются неизменными.

Ошибки прогнозирования (определение качества регрес-

сионного анализа). Существует два основных приема для оценки качества выполненного нами регрессионного анализа. В статистике для этого применяют:

стандартную ошибку (Sу), которая показывает приблизительную величину ошибки прогнозирования;

коэффициент детерминации (R2), который показывает,

какой процент вариации функции у объясняется влиянием фак-

торов хk.

Рассмотрим более подробно оба подхода.

1. Результаты статистического вычисления показывают, что стандартная ошибка для функции Sy составляет 7,38. Этот результат можно описать следующим образом: фактическая величина производительности труда отличается от прогнозируемых показателей не более чем на 7,38 руб.

Стандартная ошибка Sу, равная 7,38, показывает, какое отклонение фактических данных от прогнозируемых существует на основании использования воздействующих факторов х1; х2; х3. Более того, мы также принимаем во внимание обычное стандартное отклонение Sn, равное 35,73, которое показывает разброс значений y от их средней величины. Можно увидеть, что Sу < Sn; следовательно, как правило, ошибки прогнозирования оказываются меньшими, если работать с уравнением регрессии, а не использовать только средние значения у.

42

2.В нашем случае коэффициент детерминации R2 равен 0,96, что составляет 96 %. Этот результат можно интерпретировать так: все исследуемые воздействующие факторы объясняют 96 % вариации анализируемой функции. Остальные 4 % остаются необъясненными. Это может быть связано с влиянием других, неучтенных факторов.

Внашем случае показатель R2 = 96 %, поэтому можно сделать вывод, что именно эти три фактора в данном конкретном случае оказывают наибольшее влияние на функцию y.

Таким образом, мы получили уравнение множественной

регрессии, коэффициенты которого ak указывают, как и в каком направлении действуют исследуемые факторы хk и какой процент изменения функции у можно объяснить влиянием именно данных факторов.

Далее нам необходимо определить статистическую значимость полученного нами аналитического выражения.

Для того чтобы проверить адекватность уравнения регрессии фактическим значениям производительности труда, обычно используются следующие приемы.

1.Первый критерий Фишера. Этот критерий является достаточно традиционным способом, им часто пользуются при статистических анализах, несмотря на то, что по простоте и по удобству он может уступать другим методам.

Вбольшинстве случаев F-тест осуществляется с помощью сопоставления вычисленного значения F-критерия с эталонным (табличным) показателем Fтабл для определенного уровня зна-

чимости. При условии выполнения неравенства Fрасч < Fтабл, с уверенностью 95 %, можно говорить о том, что рассматриваемая зависимость у = a0 + a1x1 + a2x2 +…+ amxm является статистически значимой. В противном случае наоборот.

2. Уровень значимости α. Уровень значимости в интерпретации Excel представляет собой показатель р. В случае, если значение р > 0,05, то полученный результат является незначимым для 95%-й вероятности. В случае, если величина р оказы-

43

вается меньше 0,05, то с вероятностью 95 % уравнение является значимым. В случае, если р < 0,01, то уровень надежности полученного результата составляет 99 %.

3. Коэффициент детерминации R2. Имеющуюся расчетную величину Rрасч2 следует сравнить с табличными значениями Rкрит2

для определенного уровня значимости (часто 0,05). Если получится, что выполняется неравенство Rрасч2 > Rкрит2 , то с вероятно-

стью 95 % следует делать вывод о том, что анализируемая регрессия является значимой.

Далее наше уравнение проанализируем с использованием рассмотренных статистических критериев.

Проведем проверку по критерию Фишера. Сравним рассчитанную величину с табличным значением (Fкрит) F- распределения. Число степеней свободы f1 m (для нашего

примера составит 3): f2 n m 1 20 3 1 16 . Тогда полу-

чим Fкрит = 3,1 (для α = 0,05), т.е. Fрасч < Fкрит, следовательно, можно утверждать о значимости анализируемого уравнения.

Далее проверим анализируемое уравнение с использованием уровня значимости α. В позиции «Значимость F» находится величина 8,16Е-12. Фактически можно признать, что α = 0. Из этого можно сделать вывод о том, что действительно существует устойчивая зависимость рассматриваемой функции у от воздействующих факторов х1; х2; х3, другими словами, производительность труда не является чисто случайной величиной. В действительности пока неизвестно, какие именно факторы влияют на функцию, но то, что влияние существует, является бесспорным.

В данном примере коэффициент детерминации Rрасч2 равен

0,96, или 96 %. Таблица для тестирования на уровне значимости 5 % в случае выборки n = 20 и числа переменных m = 3 дает кри-

тическое значение Rкрит2 , равное 0,378. Так как выполняется соотношение Rрасч2 > Rкрит2 , то с вероятностью 95 % можно утверждать о наличии значимости данного уравнения регрессии.

44

Заметим, что для наших обстоятельств (n = 20, m =3) существует возможность оценить критическое значение Rкрит2 для α = 0,01

(высокая значимость). В этом случае Rкрит2 = 0,498, при этом оставаясь меньше расчетного показателя Rрасч2 , т.е. 0,96. В связи с этим

можно сделать вывод, что обсуждаемое нами уравнение действительно характеризуетсяочень высокойстепенью значимости.

Заметим, что все три рассмотренных приема статистической проверки дают одинаковый результат. В данном примере мы использовали подобное разнообразие способов анализа с единственной целью: дать представление о существующих методах такой проверки. На практике нет потребности проводить статистическую оценку, используя все указанные варианты. Достаточно разумно и экономично ограничиться каким-то одним методом. Следует сказать, что наиболее распространенным методом считается выполнение проверки по F-критерию.

Итaк, нами проведена проверка на значимость самого уравнения, т.е. мы понимаем, что существует взаимосвязь между параметром у и переменными хk. Тем не менее остается неясным, какое влияние оказывают конкретные факторы х1; х2; х3 на исследуемую функцию у: действуют ли в данном случае оба фактора или только один из них. В связи с этим необходимо определить значимость отдельных коэффициентов регрессии a1; a2; a3. Для этого используется так называемый t-тест.

Сравнительная оценка степени влияния факторов.

В процессе анализа полученного уравнения множественной регрессии закономерно возникает вопрос, какой фактор хk из числа рассмотренных оказывает наибольшее влияние на исследуемый показатель у? К сожалению, исчерпывающего ответа на этот вопрос не существует, поскольку наличие возможной взаимосвязи между переменными х, например, парное взаимодействие типа х1х2, тройное х1х2х3 и т.д. может значительно усложнить ситуацию. В результате станет принципиально невозможным выяснить, какая именно из переменных хk в действительности отвечает за поведение параметра у.

45

Однако в статистике даются полезные рекомендации, которые позволяют получить оценочные представления по этому поводу. В качестве примера рассмотрим один из таких методов −

сравнение стандартизованных коэффициентов регрессии.

В общем случае все коэффициенты регрессии a1, a2, …, am могут быть выражены в разных единицах измерения. Тем самым непосредственное их сравнение становится фактически некорректным, так как формально меньший по величине коэффициент в действительности может оказаться важнее большего.

Стандартизованные коэффициенты регрессии позволяют ре-

шить эту проблему с помощью представления коэффициентов регрессии в некоторых кодированных единицах измерения.

Вычисление стандартизованного коэффициента регрессии осуществляется путем умножения коэффициента регрессии ai на стандартное отклонение Sn (для наших переменных х обозначим его как Sxk ) и деления полученного произведения на Sу. Это оз-

начает, что каждый стандартизованный коэффициент регрессии измеряется как величина ai Sxk /Sу. Применительно к нашему

примеру мы получим результаты, представленные в таблице.

Стандартизованные коэффициенты регрессии

Статистические

Производи-

Капиталово-

Коэффици-

Коэффициент

тельность

производи-

характеристики

труда

оруженность

ент загрузки

тельности

Стандартные

Sy = 35,727

Sx1 = 1016,937

Sx2 = 0,0073

Sx3 = 0,01643

отклонения

 

 

 

 

Коэффициенты

a1 = 0,0014

a2 = 1422,01

a3 = 1462,33

регрессии

 

 

 

 

Стандартизованные

 

a1Sx1/Sy = 0,04

 

 

коэффициенты

0,29

0,67

регрессии

 

 

 

 

После осуществленных расчетов мы можем сопоставить полученные коэффициенты: для фактора х3 стандартизованный коэффициент максимален, а для фактора х1 – минимален.

46

Таким образом, на производительность труда наибольшее влияние оказывает коэффициент производительности оборудования, а наименьшее влияние – капиталовооруженность одного работающего. Данное сравнение абсолютных величин стандартизованных коэффициентов регрессии позволяет получить хотя и довольно грубое, но тем не менее достаточно наглядное представление о важности рассматриваемых факторов. Вновь напомним, что данные результаты не являются безупречными, так как они не в полной мере отражают реальное влияние исследуемых переменных.

47

48

4. ПРИМЕР ОФОРМЛЕНИЯ РАСЧЕТА

Вариант 88

Исследовать производительность труда (y) от всех показателей (факторов) хi, i = 4, 5, …, 13. Используем статистические данные за 5 лет (с 1988 до 1992 год) и занесем их в лист Ecxel. Заготовим «шапку» таблицы в ячейках A1; B1; C1;…; М1. После этого разместим сами числовые

наборы соответственно в диапазонах ячеек А2:А21, B2:B21, C2:C21;…; М2:М21.

 

Год

 

Квар-

 

Произ-

 

Инвестиции

 

Капиталово-

 

Стоимость

 

Электровоо-

 

Уровень

 

Средний

 

Коэффи-

 

Коэффи-

 

Удельный

 

Коэффи-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

тал

 

водитель

 

на одного

 

оруженность

 

машин и

 

руженность

 

механи-

 

возраст

 

циент

 

циент

 

вес прогрес-

 

циент

 

 

 

 

 

 

тель-

 

работающего,

 

одного

 

оборудова-

 

одного рабо-

 

зации

 

оборудо-

 

сменно-

 

загрузки

 

сивного

 

производи-

 

 

 

 

 

 

ность

 

руб.

 

работающе-

 

ния на одно-

 

тающего,

 

труда, %

 

вания,

 

сти обо-

 

оборудо-

 

оборудова-

 

тельности

 

 

 

 

 

 

труда,

 

 

 

го, руб.

 

го работаю-

 

кВт-ч

 

 

 

лет

 

рудова-

 

вания

 

ния, %

 

оборудо-

 

 

 

 

 

 

руб.

 

 

 

 

 

щего, руб.

 

 

 

 

 

 

 

ния

 

 

 

 

 

вания

 

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

10

 

11

 

12

 

13

 

 

1988

 

I

 

880

 

400

 

1466

 

790

 

3773

 

0.385

 

12.94

 

1.443

 

0.744

 

17.12

 

1.354

 

 

 

 

II

 

884

 

453

 

1653

 

798

 

3813

 

0.39

 

13.02

 

1.475

 

0.743

 

12.23

 

1.346

 

 

 

 

III

 

882

 

443

 

2008

 

813

 

3904

 

0.394

 

13.06

 

1.487

 

0.738

 

17.01

 

1.355

 

 

 

 

IV

 

883

 

460

 

2039

 

829

 

4076

 

0.398

 

12.99

 

1.475

 

0.746

 

18.13

 

1.35

 

 

1989

 

I

 

907

 

463

 

2297

 

853

 

4087

 

0.397

 

12.93

 

1.468

 

0.748

 

18.97

 

1.355

 

 

 

 

II

 

910

 

460

 

2640

 

858

 

4098

 

0.399

 

12.85

 

1.482

 

0.746

 

18.67

 

1.36

 

 

 

 

III

 

911

 

470

 

2931

 

897

 

4022

 

0.407

 

12.95

 

1.474

 

0.749

 

18.91

 

1.365

 

 

 

 

IV

 

913

 

480

 

3065

 

890

 

4045

 

0.409

 

12.87

 

1.472

 

0.748

 

18.86

 

1.368

 

 

1990

 

I

 

923

 

411

 

3233

 

911

 

4061

 

0.413

 

12.75

 

1.465

 

0.754

 

18.94

 

1.361

 

 

 

 

II

 

929

 

471

 

3285

 

942

 

4082

 

0.419

 

12.81

 

1.481

 

0.751

 

19.01

 

1.369

 

 

 

 

III

 

927

 

462

 

3392

 

923

 

3958

 

0.418

 

12.85

 

1.485

 

0.749

 

18.98

 

1.374

 

 

 

 

IV

 

928

 

504

 

3521

 

945

 

3856

 

0.422

 

12.79

 

1.477

 

0.756

 

19.11

 

1.371

 

 

1991

 

I

 

932

 

510

 

3713

 

984

 

3811

 

0.424

 

12.81

 

1.489

 

0.756

 

19.06

 

1.373

 

 

 

 

II

 

940

 

520

 

3847

 

987

 

3802

 

0.428

 

12.73

 

1.503

 

0.758

 

19.13

 

1.376

 

 

 

 

III

 

941

 

580

 

4014

 

987

 

3760

 

0.429

 

12.61

 

1.5

 

0.753

 

19.24

 

1.379

 

 

 

 

IV

 

945

 

588

 

4262

 

993

 

3685

 

0.429

 

12.65

 

1.508

 

0.759

 

19.24

 

1.385

 

 

1992

 

I

 

981

 

590

 

4385

 

1011

 

3811

 

0.428

 

12.64

 

1.528

 

0.761

 

19.44

 

1.391

 

 

 

 

II

 

988

 

595

 

4512

 

1017

 

3995

 

0.429

 

12.68

 

1.544

 

0.762

 

19.44

 

1.398

 

 

 

 

III

 

990

 

597

 

4665

 

1035

 

4171

 

0.429

 

12.52

 

1.548

 

0.761

 

19.56

 

1.399

 

 

 

 

IV

 

989

 

600

 

4786

 

1039

 

4295

 

0.432

 

12.56

 

1.54

 

0.765

 

19.55

 

1.399

 

48

I. Выберем три существенных фактора, которые влияют на производительность труда.

1. Рассчитаем коэффициент парной корреляции между производительностью труда и каждым фактором. Для этого вос-

пользуемся Мастером функций.

Выберем функцию КОРРЕЛ (Массив1;Массив2). Заполним текстовые поля для Массив1 (C2:C21) и Массив2 (D2:D21). Аналогичный метод будем использовать для расчета остальных коэффициентов. После вычисления получаем:

Фактор

Коэффициент

Фактор

Коэффициент

 

парной корреляции

 

парной корреляции

Х4

0.88

Х9

0.92

Х5

0.96

Х10

0.90

Х6

0.95

Х11

0.93

Х7

0.21

Х12

0.60

Х8

0.89

Х13

0.97

2. Рассчитаем коэффициент автокорреляции между двумя факторами. Для этого используем функцию КОРРЕЛ (Массив1;Массив2). После вычисления получаем:

 

Х4

Х5

Х6

Х7

Х8

Х9

Х10

Х11

Х12

Х13

Х4

 

0.879

0.873

0.016

0.832

0.838

0.910

0.827

0.459

0.903

Х5

 

 

0.990

0.105

0.974

0.927

0.839

0.932

0.681

0.957

Х6

 

 

 

0.067

0.982

0.920

0.820

0.943

0.673

0.942

Х7

 

 

 

 

0.009

0.096

0.198

0.104

0.266

0.131

Х8

 

 

 

 

 

0.883

0.756

0.903

0.667

0.894

Х9

 

 

 

 

 

 

0.778

0.906

0.612

0.905

Х10

 

 

 

 

 

 

 

0.776

0.390

0.900

Х11

 

 

 

 

 

 

 

 

0.612

0.899

Х12

 

 

 

 

 

 

 

 

 

0.623

Х13

 

 

 

 

 

 

 

 

 

 

В случае, если один из коэффициентов частной корреляции между факторами примерно равен 0.99, то один из этих факторов исключаем. Между факторами Х5 и Х6 коэффициент частной корреляции 0.99, поэтому Х6 исключим.

Выберем три фактора, которые в наибольшей степени влияют на производительность труда. В нашемпримереэто будут:

49

Х5 – капиталовооруженность одного работающего; Х11 – коэффициент загрузки оборудования; Х13 – коэффициент производительности оборудования.

Построим таблицу. Теперь мы будем работать с ней.

 

 

Производитель-

Капиталовоору-

Коэффици-

Коэффициент

Год

Квар-

ность труда,

женность одного

ент загруз-

производитель-

 

тал

руб.

работающего, руб.

ки обору-

ности

 

 

 

 

дования

оборудования

1

2

3

5

11

13

1988

I

880

1466

0.744

1.354

 

II

884

1653

0.743

1.346

 

III

882

2008

0.738

1.355

 

IV

883

2039

0.746

1.35

1989

I

907

2297

0.748

1.355

 

II

910

2640

0.746

1.36

 

III

911

2931

0.749

1.365

 

IV

913

3065

0.748

1.368

1990

I

923

3233

0.754

1.361

 

II

929

3285

0.751

1.369

 

III

927

3392

0.749

1.374

 

IV

928

3521

0.756

1.371

1991

I

932

3713

0.756

1.373

 

II

940

3847

0.758

1.376

 

III

941

4014

0.753

1.379

 

IV

945

4262

0.759

1.385

1992

I

981

4385

0.761

1.391

 

II

988

4512

0.762

1.398

 

III

990

4665

0.761

1.399

 

IV

989

4786

0.765

1.399

II. Построим линейную модель по трем выбранным факторам. Для этого воспользуемся Мастером функций. Выберем функцию Линейн (Известные значения y; Известные значе-

ния x; Конст; Статистик). Заполним текстовые поля для Из-

вестные значения (Q2:Q21); Известные значения х (R2:T21); Конст (Истина) и Статистик (Истина).

Формулу в этом примере необходимо ввести как формулу массива. Для этого выделяем P23:S27, начиная с ячейки, содержащей формулу. Нажмем клавишу F2, а затем – клавиши CTRL+SHIFT+ЕNTЕR. Получаем следующие значения:

50