Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Rukovodstvo по Эконометрике.doc
Скачиваний:
6
Добавлен:
11.11.2018
Размер:
1.64 Mб
Скачать

Тема 2. Множественная регрессия

Расчетные формулы.

2.1. Оценки вектора коэффициентов регрессии:

.

2.2. Стандартизованные коэффициенты регрессии:

.

2.3. Средние коэффициенты эластичности:

.

2.4. Стандартная ошибка уравнения:

.

2.5. Стандартная ошибка параметра уравнения:

,

где диагональный элемент матрицы , находящийся на пересечении ()-й строки и ()-го столбца.

2.6. статистики параметров регрессии:

.

2.7. Парные коэффициенты корреляции:

.

2.8. Множественный коэффициент корреляции:

.

2.9. Множественный коэффициент детерминации:

.

2.10. Скорректированный множественный коэффициент детерминации:

.

2.11. критерий Фишера:

.

Если , где определяется по уровню значимости и числу степеней свободы и , то уравнение регрессии значимо в целом.

2.12. Частные критерии для двухфакторной модели:

.

Если наблюдаемое значение больше , определяемого по заданному уровню значимости и числу степеней свободы и , то дополнительное включение фактора в модель статистически оправдано. В противном случае – нет.

Решение типовой задачи.

Имеются следующие данные о сменной добыче угля на одного рабочего (т), мощности угольного пласта (м) и уровне механизации работ (%), характеризующие процесс добычи угля на 10 шахтах:

Табл. 2.1

5

10

10

7

5

6

6

5

6

8

8

11

12

9

8

8

9

9

8

12

5

8

8

5

7

8

6

4

5

7

Требуется:

  1. Полагая, что между переменными , и существует линейная корреляционная зависимость, найти её аналитическое выражение (уравнение регрессии). Пояснить экономический смысл коэффициентов регрессии.

  2. Установить раздельное влияние на сменную добычу угля двух факторов через стандартизованные коэффициенты регрессии и средние коэффициенты эластичности.

  3. Проверить значимость параметров множественной регрессии и при положительном ответе построить для коэффициентов уравнения регрессии 95% доверительные интервалы.

  4. Сравнить значения скорректированного и нескорректированного коэффициентов множественной детерминации и проверить значимость полученного уравнения регрессии на уровне значимости .

  5. С помощью частных критериев оценить целесообразность включения в уравнение регрессии фактора после фактора и наоборот – фактора после .

Решение выполним в среде MS Excel.

  1. Сформируем расчетную таблицу следующей структуры:

№ п/п

1

10

Сумма

Среднее

Введем исходные данные , , в таблицу по столбцам и рассчитаем колонки , , , , , ,. Вычисляем суммы и средние значения столбцов с помощью встроенных функций СУММ(…) и СРЗНАЧ(…).

Сформируем на свободном поле числовые матрицы:

, ,

где элементы матриц берутся из строки "Сумма" таблицы. Лучше задавать элементы матриц, используя знак "=" формулы Excel и щёлкая мышью по соответствующему элементу строки "Сумма", а затем - Enter.

Находим обратную матрицу с использованием встроенной функции МОБР(…). Для этого выделяем на свободном поле ячейки для элементов обратной матрицы размером . При этом все ячейки, кроме левой верхней, будут окрашены голубым цветом. В ней набираем формулу: =МОБР(.: .), где в скобках через двоеточие указываем крайние левый и правый диагональные элементы матрицы . Далее нажимается клавиша F2 клавиатуры и затем одновременно клавиши "CTRL", "SHIFT" и "ENTER". В указанных ячейках появятся элементы искомой обратной матрицы.

По формуле 2.1 находим вектор оценок с помощью встроенной функции МУМНОЖ(.;.). Выделяем на свободном поле ячейки для (это будет вектор размерности ). В строке или в первой ячейке указанного формата набираем формулу =МУМНОЖ(…;…), где вначале щелкаем по элементам обратной матрицы, а затем через ";" – по элементам вектора . Снова нажимается клавиша F2 клавиатуры и затем одновременно клавиши "CTRL", "SHIFT" и "ENTER".

В итоге в отведенном формате имеем вектор оценок:

.

Таким образом, уравнение регрессии в натуральном масштабе имеет вид:

.

Из него следует, что при увеличении угольного пласта на 1 м добыча угля на одного рабочего увеличивается в среднем на 0,854 т, а увеличение только уровня механизации на 1% приводит к увеличению в среднем на 0,367 т.

  1. Найдем дисперсии и средние квадратические отклонения переменных:

.

Вычислим стандартизованные коэффициенты регрессии по формуле 2.2:

.

Уравнение регрессии в стандартизованном масштабе записывается:

.

Оно показывает, что с ростом фактора на одно при неизменности второго фактора рост добычи угля на одного рабочего увеличивается в среднем на 0,724 , а при увеличении только на одно результат увеличивается в среднем на 0,284. Отсюда видно, что первый фактор оказывает большее воздействие на результат, чем второй фактор.

По формулам 2.3 определим средние коэффициенты эластичности:

.

Таким образом, увеличение по отдельности переменных , на 1% приводит в среднем к росту результата на 1,18% и 0,34% соответственно.

Из этого также следует, что фактор оказывает большее влияние на , нежели фактор .

3. Вычислим предсказанные моделью значения по формуле

и тем самым заполним колонку расчетной таблицы. Далее вычисляются остатки и их квадраты . В итоге в строке "Сумма" колонки таблицы определится остаточная сумма квадратов .

Находим стандартную ошибку уравнения регрессии по формуле 2.4:

.

По формуле 2.5 вычисляем стандартные ошибки параметров уравнения:

С использованием формулы 2.6 определяем статистики параметров:

.

Найдем с помощью функции СТЬЮДРАСПОБР(…) табличное значение по уровню значимости и числу степеней свободы . Сравнение модулей расчетных значений с табличным указывает на статистическую значимость параметра . Параметры же и не является значимым.

Построим интервальную оценку только для коэффициента . Для этого определим предельную ошибку, которая в 95% случаев не будет превышена:

.

Отсюда получаем искомый доверительный интервал:

.

Из него следует, что с надежностью 0,95 за счет увеличения мощности пласта на 1 м переменная будет увеличиваться по разным шахтам в пределах от 0,333 тонн до 1,375 т.

4. Вычислим парные коэффициенты корреляции по формулам 2.7:

; .

Определим множественный коэффициент корреляции по формуле 2.8:

.

Множественный коэффициент корреляции достаточно высокий, что свидетельствует о существенной линейной зависимости результата от включенных в модель факторов.

Далее по формуле 2.9 находим множественный коэффициент детерминации:

.

Таким образом, на 81% включенные в модель факторы определяют воздействие на переменную , а на все остальные факторы, не включенные в модель, приходится 19%.

Скорректируем коэффициент детерминации по формуле 2.10:

.

Рассчитаем дисперсионное отношение Фишера по формуле 2.11:

.

Табличное значение = определяем с помощью встроенной статистической функции FРАСПОБР по уровню значимости и числам свободы и . Поскольку , то можно сделать вывод о статистической значимости построенной модели.

  1. По формуле 2.12 находим частные критерии:

,

.

Табличное значение =5.59 определяем с помощью встроенной статистической функции FРАСПОБР по уровню значимости и числам свободы и . Поскольку , то включение в модель фактора после оказалось статистически оправданным. Но так как , то включение фактора в модель после оказывается бесполезным: влияние на переменную не является устойчивым, систематическим ( в этом убедились ранее, признав статистически незначимым).

Отсюда вывод: модель должна содержать только фактор .

Задания для самостоятельной работы.

Задача 2. Изучается влияние стоимости основных x1 и оборотных x2 средств на величину валового дохода y торговых предприятий. Для этого по 12 торговым предприятиям были получены данные, приведенные в таблице 2.2 (все величины измеряются в млн. руб.).

Табл. 2.2

Номер варианта

Переменные

Номер предприятия

1

2

3

4

5

6

7

8

9

10

11

12

1

x1

3,9

4,8

3,9

4,3

4,8

4,9

5,6

4,6

5,6

7

7,2

7,7

x2

10

14

16

16

17

20

19

21

21

21

22

21

y

7

8

7

7

7

8

9

8

9

11

11

11

2

x1

3,9

4,1

3,8

4,7

4,4

5,2

5,6

5,2

5,5

6,8

7,5

7,2

x2

10

14

15

16

18

19

19

20

21

21

22

21

y

8

7

7

8

7

7

9

9

8

11

11

11

3

x1

4

4,3

4

4,9

4,4

4,9

6,3

4,8

6,2

7,7

7,6

7,1

x2

11

14

16

16

18

20

20

21

21

21

22

21

y

7

7

7

7

7

8

8

8

9

11

11

11

4

x1

4,7

4,2

3,8

5

4,1

5,5

5,8

5

5,7

7,6

7,6

7,4

x2

11

14

16

17

17

20

20

21

20

20

21

22

y

8

7

7

8

8

8

8

8

9

11

10

10

5

x1

4,4

4,4

4,2

4,2

4,1

5,1

5,7

4,8

5,6

7,6

7,7

7

x2

11

14

16

16

18

19

19

20

21

21

21

21

y

7

7

8

8

8

8

9

9

8

10

10

11

6

x1

4,5

4,7

4,3

4,2

4,8

5,7

5,5

5,2

5,8

7,2

7,1

7,2

x2

10

15

16

16

18

20

19

20

21

20

21

22

y

8

8

8

8

8

8

8

8

8

10

11

10

7

x1

4,3

4,2

4,5

4,2

4

5,5

6,3

4,8

5,4

7,1

7,9

7

x2

11

15

15

16

17

19

20

21

21

20

22

22

y

7

7

7

8

8

8

8

8

9

11

10

11

8

x1

4,1

4

4,2

5

4,6

5,1

6,2

4,9

6,2

7

7,5

7,4

x2

11

15

16

16

17

20

20

21

21

20

22

21

y

7

7

7

7

7

7

8

9

8

10

10

11

9

x1

3,9

4,1

3,8

5

4,8

5,6

5,6

4,8

6

7,6

6,9

7,4

x2

11

14

15

16

18

20

20

21

21

20

22

21

y

7

7

8

7

8

7

9

9

8

10

10

11

10

x1

4,9

4,2

4,6

4,2

3,8

4,9

5,4

5,3

5,4

7,4

7,6

6,9

x2

10

14

15

16

18

20

20

21

20

21

22

21

y

7

7

8

7

8

8

8

8

8

10

10

11

Требуется:

1. Полагая, что между переменными y, x1, x2 существует линейная корреляционная зависимость, найти ее аналитическое выражение (уравнение регрессии y по x1 и x2 ) и пояснить экономический смысл параметров регрессии.

2. Установить раздельное влияние на величину валового дохода двух факторов - основных и оборотных средств через стандартизованные коэффициенты регрессии и средние коэффициенты эластичности.

3. Проверить значимость коэффициентов регрессии и построить для них 95% доверительные интервалы.

4. Сравнить значения скорректированного и не скорректированного коэффициентов множественной детерминации и проверить значимость полученного уравнения регрессии по критерию на уровне =0,05.

5. С помощью частных F-критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора x1 после x2 , и фактора x2 после x1.