Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
4
Добавлен:
19.01.2025
Размер:
2.21 Mб
Скачать

(исходные данные приводятся в таблице 43, i – порядковый номер станка, или наблюдения). НаэтапеидентификациипараметровмоделиполученотчетвExcel (рисунок 18). Вспомогательные расчеты представлены формулой (31)

Таблица 43 – Исходные данные к примеру 4.1

i

1

2

3

4

5

6

7

8

9

10

11

12

13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

6

23

29

15

14

30

27

24

9

6

2

12

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

20,5

91,7

100,9

75,8

76,3

74,5

86,4

64,1

75

26,6

26

54

54,7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А

 

0,577693

 

0,007877

 

 

 

(31)

 

 

 

 

0,007877

0,000124

 

 

 

 

 

Рис. 18. Фрагмент отчета «Регрессия» в Excel для примера 4.1.

Необходимо проверить гипотезу о значимости параметров модели, приняв уровень значимости равным 0,05 и рассчитать интервальные оценки параметров модели регрессии.

Решение

Для каждого из параметров (константы и коэффициента при X)

проверяется гипотеза:

 

 

 

H0: параметр незначим в генеральной совокупности,

 

.

H1: параметр значим в генеральной совокупности,

.

0

параметров модели по

Рассчитаем t-критерий Стъюдента для каждого из

 

0

 

формулам (32), где – стандартная ошибка модели, определяемая по формуле

(33), а

 

– диагональный

элемент матрицы

А

 

.

 

 

 

РАСЧ

 

 

 

(32)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(33)

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

61

 

 

 

 

 

Для константы модели :

Для определения стандартной ошибки модели осуществим вспомогательный расчет модельных и остаточных значений (таблица 44). Таблица 44 – Вспомогательные раcчеты для решения примера 4.1

i

 

 

 

 

 

 

 

1

6

3,9

 

2,1

 

4,3

2

23

24,6

 

-1,6

 

2,4

3

29

27,2

 

1,8

 

3,1

4

15

20,0

 

-5,0

 

24,5

5

14

20,1

 

-6,1

 

37,2

6

30

19,6

 

10,4

 

108,7

7

27

23,0

 

4,0

 

15,8

8

24

16,6

 

7,4

 

55,4

9

9

19,7

 

-10,7

 

114,9

10

6

5,7

 

0,3

 

0,1

11

2

5,5

 

-3,5

 

12,3

12

12

13,6

 

-1,6

 

2,7

13

16

13,8

 

2,2

 

4,7

Сумма

213

-

 

-

 

386,1

 

 

 

 

 

386,1

 

5,92

 

 

 

 

 

13

1

1

 

 

 

 

 

 

 

5,92

0,577693

4,50

 

 

 

 

РАСЧ

2,03

 

0,45

 

 

 

 

 

 

 

4,50

 

 

 

Табличное значение определим по таблице распределения Стъюдента с

параметрами уровень значимости

и число.

степеней свободы (n-m-1): КРИТ

 

; Так как1

КРИТ

0,05;,11

 

2,20

 

 

, следовательно, нет оснований

 

 

РАСЧ

КРИТ

 

| 0,45|

2,201

отвергнуть нулевую

 

 

 

гипотезу, константа модели не значима.

 

Для коэффициента модели :

 

 

 

 

 

 

 

 

 

 

5,92

0,000124

0,07

 

 

 

 

 

 

РАСЧ

0,29

4,14

 

 

 

 

 

 

 

0,07

62

Таким образом, РАСЧ

 

,

 

 

, следовательно, нулевая

гипотеза отклоняется в пользу конкурирующей, коэффициент при X значим.

 

КРИТ

 

|4,14|

2,201

 

Константа модели имеет особый смысл с точки зрения экономики, а также влияет на процедуру дисперсионного анализа и некоторые тесты остатков. Поэтому мы не будем исключать незначимую константу из модели.

Интервальные оценки параметров регрессии рассчитаем по формуле (34).

КРИТ КРИТ (34)

Доверительный интервал для константы (используем значение t-критерия для вероятности ошибки первого рода 0,05):

2,03 4,5 2,201

 

2,03.

4,5 2,201,

11,93

 

7,87

 

Ещёодин способ проверить гипотезу о значимости параметра– проверить, накрывает ли доверительный интервал 0. Константа модели незначима, поэтому в доверительный интервал входит ноль.

Доверительный интервал для параметра :

0,29 0,07 2,201

 

0,29.

0,07 2,201,

0,14

 

0,44

 

Следовательно, с вероятностью 0,95 или 95% (1-0,05) значение коэффициента модели для генеральной совокупности лежит в интервале

[0,14;0,44].

Задача для решения в классе (пример 4.2).

Имеется объектно-пространственная выборка по Центральному федеральному округу РФ (кроме Москвы и Московской области) за 2012 год по среднемесячной номинальной начисленной заработной плате на одного работника ( ) и уровню безработицы ( ) от Росстата (таблица 45). Построена модель парной регрессии: 8,832 0,216 .

А) Проверьте гипотезы о значимости оценок параметров и (принять уровень значимости равным 5%).

Б) Постройте доверительные границы изменения оценки параметра для различных значений уровня значимости (10%, 5%, 1%).

63

Таблица 45 – Исходные данные к примеру 4.2

i

Субъект РФ

Заработная плата2012,

Безработица 2012,%

i

Субъект РФ

Заработная плата2012,

Безработица 2012,%

 

 

 

 

 

 

 

 

 

 

 

 

1

Белгородская область

20,0

3,7

9

Липецкая область

19,4

3,6

2

Брянская область

16,5

5,1

10

Орловская область

16,9

5,3

3

Владимирская область

18,3

4,4

11

Рязанская область

19,1

4,6

4

Воронежская область

19,5

5,5

12

Смоленская область

17,9

5,7

5

Ивановская область

17,0

6,3

13

Тамбовская область

16,9

4,9

6

Калужская область

23,7

4,3

14

Тверская область

20,2

5,0

7

Костромская область

16,9

4,8

15

Тульская область

20,1

4,6

8

Курская область

18,7

5,1

16

Ярославская область

20,4

3,4

Решение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А) Для проверки гипотез о значимости параметров модели нам

понадобится стандартная ошибка модели. Рассчитаем:

 

 

 

 

 

 

 

 

остатки модели

 

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сумму квадратов отклонений

остатков

 

 

 

 

.

 

 

в оцененное

 

Значения

 

получаются

подстановкой

известных

 

 

 

 

 

 

 

 

 

 

 

 

переменныхравны:

уравнениерегрессии

 

8,832

 

0,216 . Средниезначения

 

 

 

 

 

 

 

1

 

 

 

1

76,3

4,8;

 

 

̅

1

 

 

1

301,5

18,8.

 

 

 

16

 

 

 

 

16

 

Проведем дополнительные расчеты в таблице 46.

 

 

 

 

 

 

 

 

Проверим гипотезу о значимости параметра при X (

 

 

 

 

 

 

Рассчитаем критерий Стьюдента, зная, что количество.

независимых

переменных в модели

1:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6,42

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,46;

 

 

 

 

 

 

 

 

0,46/53,03 0,093;

 

 

1

14

 

 

 

 

 

 

̅

 

 

 

 

 

 

 

 

 

 

РАСЧ

 

 

0,216

 

2,32

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,093

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

64

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Статистика

 

РАСЧ

при

справедливости

нулевой

гипотезы

имеет

распределение

Стьюдента

с

 

равно 1

степенями

свободы. Табличное

значение статистики Стьюдента

 

 

0,05; 14

 

 

 

.

Сравним

расчетное значение t-статистики, взятое поКРИТ

 

2,14

 

 

 

,

 

 

РАСЧ

КРИТ

 

 

 

 

 

 

 

 

модулю, с табличным:

2,32

2,14

 

.

Коэффициент

при независимой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

переменной

значим

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вероятностью не более 95%.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 46 – Вспомогательные расчеты для решения примера 4.2

 

 

 

 

 

 

 

 

i

 

 

 

 

̅

 

1,44

 

 

4,5

 

 

-0,8

 

 

 

0,64

 

 

 

-0,3

 

 

 

 

 

0,09

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

5,29

 

 

5,3

 

 

-0,2

 

 

 

0,04

 

 

 

0,5

 

 

 

 

 

0,25

 

 

 

 

3

 

 

 

 

 

 

0,25

 

 

4,9

 

 

-0,5

 

 

 

0,25

 

 

 

0,1

 

 

 

 

 

0,01

 

 

 

 

4

 

 

 

 

 

 

0,49

 

 

4,6

 

 

0,9

 

 

 

0,81

 

 

 

-0,2

 

 

 

 

 

0,04

 

 

 

 

5

 

 

 

 

 

 

3,24

 

 

5,2

 

 

1,1

 

 

 

1,21

 

 

 

0,4

 

 

 

 

 

0,16

 

 

 

 

6

 

 

 

 

24,01

 

 

3,7

 

 

0,6

 

 

 

0,36

 

 

 

-1,1

 

 

 

 

 

1,21

 

 

 

 

7

 

 

 

 

 

 

3,61

 

 

5,2

 

 

-0,4

 

 

 

0,16

 

 

 

0,4

 

 

 

 

 

0,16

 

 

 

 

8

 

 

 

 

 

 

0,01

 

 

4,8

 

 

0,3

 

 

 

0,09

 

 

 

0,0

 

 

 

 

 

0,00

 

 

 

 

9

 

 

 

 

 

 

0,36

 

 

4,6

 

 

-1,0

 

 

 

1,00

 

 

 

-0,2

 

 

 

 

 

0,04

 

 

 

10

 

 

 

 

 

 

3,61

 

 

5,2

 

 

0,1

 

 

 

0,01

 

 

 

0,4

 

 

 

 

 

0,16

 

 

 

11

 

 

 

 

 

 

0,09

 

 

4,7

 

 

-0,1

 

 

 

0,01

 

 

 

-0,1

 

 

 

 

 

0,01

 

 

 

12

 

 

 

 

 

 

0,81

 

 

5,0

 

 

0,7

 

 

 

0,49

 

 

 

0,2

 

 

 

 

 

0,04

 

 

 

13

 

 

 

 

 

 

3,61

 

 

5,2

 

 

-0,3

 

 

 

0,09

 

 

 

0,4

 

 

 

 

 

0,16

 

 

 

14

 

 

 

 

 

 

1,96

 

 

4,5

 

 

0,5

 

 

 

0,25

 

 

 

-0,3

 

 

 

 

 

0,09

 

 

 

15

 

 

 

 

 

 

1,69

 

 

4,5

 

 

0,1

 

 

 

0,01

 

 

 

-0,3

 

 

 

 

 

0,09

 

 

 

16

 

Σ

 

 

 

 

2,56

 

 

4,4

 

 

-1,0

 

 

 

1,00

 

 

 

-0,4

 

 

 

 

 

0,16

 

 

 

Σ

 

 

̅

53,03

 

 

 

 

Σ 2

 

6,42

 

 

 

 

Σ

2

2,67

 

Проверим значимость константы .

 

1

 

 

̅

 

 

1

 

18,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

̅

 

0,46

16

 

53,03

3,095

 

1,759.

 

 

 

 

 

 

РАСЧ

 

8,832

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,759

 

для всех параметров модели.

Табличное значение является одинаковым

5,02

 

 

 

 

КРИТ

0,05; 14

2,14

,

РАСЧ

 

КРИТ

 

. Константа значима.

Поскольку

5,02

 

 

 

 

Ответ на пункт

2,14

 

 

 

 

 

 

 

 

 

 

 

 

А: оценки параметров модели значимы при уровне значимости

0,05,. или, что то же самое, с доверительной вероятностью 1

1 0,05

0,95

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

65

 

 

 

 

 

 

 

 

 

Б) Двусторонний (

 

)*100%-й доверительный интервал (

 

– уровень

значимости) для любого

параметра регрессии рассчитывается по формуле (34).

1

 

 

 

 

 

 

 

 

 

 

 

при

Рассчитаем доверительные интервалы для коэффициента регрессии

уровне значимости 10%. Тогда КРИТ 0,10; 14

1,76.

 

 

 

 

 

 

 

 

0,216 0,093 1,76

 

 

 

0,216

0,093 1,76,

 

 

 

 

 

 

 

 

 

 

 

 

0,380

 

 

 

0,052.

 

 

 

 

 

 

 

 

Расчеты для 95% и 99% доверительных интервалов производятся путем

замены критической границы

КРИТ 0,10; 14

1,76

на

КРИТ 0,05; 14

 

2,14

и

КРИТ 0,01; 14

2,98

соответственно.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ответ на пункт Б: в генеральной совокупности коэффициент при X с

вероятностью 90% лежит в интервале

0,380

 

0,052

; с вероятностью

95% в

интервале

0,415.

 

 

 

 

 

 

интервале

 

0,017

; с

вероятностью 99% в

0,493

 

 

 

 

 

 

 

 

 

 

 

 

 

0,061

Ни один из этих интервалов не накрывает 0, поэтому

 

 

 

 

 

коэффициент значим при уровнях значимости 0,10, 0,05 и 0,01.

4.2 Проверказначимостиуравнениярегрессии. Дисперсионный анализ факторной регрессионной модели.

Задача для решения в классе (пример 4.3).

По данным обучающей выборки, представленным в таблице 47, используя результаты расчетов, представленные в таблице 48 определите, является ли модель линейного тренда значимой с вероятностью 90%? выполните решение нескольких постановок задачи, связанных с этапами идентификации и верификации трендовой модели.

Таблица 47 – исходные данные к примеру 4.3

 

1

2

3

4

5

6

7

8

9

10

12,3

13

13,7

13,5

14,0

15,0

 

 

 

 

16,2

16,4

16,0

16,8

 

 

 

 

 

 

 

 

 

 

 

Таблица 48 -Вспомогательные расчеты для решения примера 4.3

 

11,8867

 

12,4

12,91

13,42

13,93

14,44

14,94

15,45

15,96

16,47

16,98

 

0,5097

-0,10

0,09

0,28

-0,43

-0,44

0,06

0,75

0,44

-0,47

-0,18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14,69

 

 

 

 

 

 

 

 

-2,29

 

 

 

-0,25

 

 

 

 

 

 

 

-1,78

-1,27

-0,76

0,25

0,76

1,27

1,78

2,29

 

 

 

 

 

 

 

 

 

 

 

 

 

66

 

Решение

 

Выдвигаем статистические гипотезы.

 

H0: в генеральной совокупности все коэффициенты модели равны нулю,

 

H

 

: в

, т.е. модель в целом незначима.

 

0

 

 

1

 

генеральнойсовокупностихотябыодинкоэффициентнеравен нулю,

 

 

0, т.е. модель в целом значима.

Для решения поставленной задачи рассчитаем модельную и остаточную вариации. Вариация, обусловленная регрессией, определяется по формуле (35), остаточная вариация определяется по формуле (36)

, где:

Y – фактическое значение зависимой переменной;

– значение зависимой переменной, полученное по модели (модельное значение переменной);

- среднее значение зависимой переменной;–число наблюдений обучающей выборки;

– число параметров модели, без учета константы.

Расчетное значение F-критерия Фишера определяем по формуле (37).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(35)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(36)

 

 

 

 

 

 

 

 

 

 

 

 

 

РАСЧ

2

 

 

2

 

(37)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

21,43

 

 

 

 

 

 

 

 

 

 

:

 

1

 

 

 

 

 

1,48

 

 

 

1,48

 

 

 

 

 

 

 

 

 

 

 

 

РАСЧ

 

21,43

 

 

 

 

 

 

 

 

 

 

по таблице распределений

 

 

 

 

 

 

 

 

 

 

 

 

 

Определим:

табличное значение F-критерия

 

8

 

116,15

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Фишера с параметрами: - уровень значимости,

 

– число степеней свободы

числителя,

 

- число

степеней свободы знаменателя.

 

КРИТ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

КРИТ

 

 

 

 

 

 

67

 

 

 

 

 

 

;

;

 

 

 

 

0,1; 1; 8

 

 

 

 

 

 

 

 

 

 

 

3,457919

 

 

Таккакрасчетноезначениекритериябольшекритического

 

РАСЧ

 

КРИТ, то

модель регрессии является значимой с вероятностью не более

90%.

 

 

 

 

 

Ответ: регрессионная модель

 

11,8867 0,5097

является значимой с

вероятностью 90%.

 

 

 

 

 

 

4.3 Проверка остаточной компоненты на соответствие условиям Гаусса-Маркова.

Задача для решения в классе (пример 4.4).

Исследуется зависимость показателя Y «число сбоев в работе станка» от показателя X «суммарная длительность работы станка, в сутках» по 13 станкам (исходные данные приводятся в таблице 49, i – порядковый номер станка, или наблюдения).

Таблица 49 – Исходные данные к примеру 4.4

i

1

2

3

4

5

6

7

8

9

10

11

12

13

Y

6

23

29

15

14

30

27

24

9

6

2

12

16

X

20,5

91,7

100,9

75,8

76,3

74,5

86,4

64,1

75

26,6

26

54

54,7

На этапе идентификации параметров модели парной регрессии была получена следующая модель 2,03 0,29X

После построение были определены значения остаточной компоненты (таблица 50, рисунок 19)

Таблица 50 – Вспомогательные расчеты для решения примера 4.4

i

1

 

6

20,5

 

3,9

 

 

2,1

 

 

2

 

23

91,7

 

24,6

 

 

-1,6

 

3

 

29

100,9

 

27,2

 

 

1,8

 

4

 

15

75,8

 

20,0

 

 

-5,0

 

5

 

14

76,3

 

20,1

 

 

-6,1

 

6

 

30

74,5

 

19,6

 

 

10,4

 

7

 

27

86,4

 

23,0

 

 

4,0

 

8

 

24

64,1

 

16,6

 

 

7,4

 

9

 

9

75,0

 

19,7

 

 

-10,7

 

10

 

6

26,6

 

5,7

 

 

0,3

 

11

 

2

26,0

 

5,5

 

 

-3,5

 

12

 

12

54,0

 

13,6

 

 

-1,6

 

13

 

16

54,7

 

13,8

 

 

2,2

Необходимо проверить остаточную компоненту на соответствие условиям ГауссаМаркова.

4.3.1 Предварительный анализ графического материала

68

Наоснованииграфикаразбросанарисунке19, можно сделатьвыводотом, что дисперсия остатков непостоянна: большим значениям объясняющей переменной X соответствует больший разброс точек.

Рис. 19. Остатки модели для проверки на соответствие условиям ГауссаМаркова

4.3.2 Реализация проверки остаточной компоненты на соответствие условиям Гаусса-Маркова: проверка на равенство нулю математического ожидания

Сформулируем основную и конкурирующую гипотезы о равенстве среднего значения остатков нулю.

: 0, генеральное среднее остатков равно нулю.: 0, генеральное среднее остатков не равно нулю.

Критерий рассчитывается по формуле (38). Если расчетное значение критерия по модулю меньше двусторонней критической границы распределения Стьюдентасчисломстепенейсвободыν= n – 1, нулеваягипотезанеотвергается.

РАСЧ

̅ 0

(38)

 

 

Расчет среднего значения и стандартного отклонения остатков:

̅ 2,1 1,6 1,8 2,2 0,023 13

 

2,1

0,023

1,6

0,023

2,2 0,023

5,57

 

 

13

1

 

Расчетное значение t-статистики равно:

69

 

 

РАСЧ

0,023 0

 

 

 

 

Табличное (или критическое

5,57

критерия Стъюдента определяется

) значение

0,004

 

по таблицам распределения Стъюдента с параметрами :

- уровень значимости,

 

– число степеней свободы. Возьмем уровень

значимости по умолчанию,

1

 

 

 

равным 0,05.

КРИТ, 0,05; 12

2,179

 

 

 

Поскольку

 

, нулевая гипотеза не

отклоняется, среднее| РАСЧ|

КРИТ

| 0,004|

2,179

 

 

 

остатков в генеральной совокупности равно нулю.

4.3.3.Реализация проверки остаточной компоненты на соответствие условиям Гаусса-Маркова: проверка гипотезы о постоянстве дисперсий

Реализацияпроверкигипотезыопостоянстведисперсийпредставляетсобой процедуру проверки на гетеросткедастичность, которая более подробно разбирается в теме 6.

4.3.4.Реализация проверки остаточной компоненты на соответствие условиям Гаусса-Маркова: проверка на случайность

Проверку остатков на случайность осуществим с помощью критерия знакопеременных серий.

Сформулируем основную и конкурирующую гипотезы. H0: остатки модели случайны.

H1: остатки модели не случайны.

Для всех наблюдений за остатками проставим знаки по формуле 39.

 

 

, если

 

 

 

0,

 

 

(39)

 

, если

 

 

 

0.

 

 

 

Например, дляпервогонаблюдения:

 

 

 

 

 

 

0 " "

. Знак для последнего

наблюдения не ставится, т.к. для этого

 

 

 

1:

 

1,6 2,1

3,7

недостаточно информации.

Вспомогательные расчеты к решению примера 4.4 сведем в таблицу 51. Подсчитаем общее число серий, т.е. последовательностей из одинаковых

знаков:

 

. Длина самой большой серии:

 

 

2

(это длина равных

по длине

10

 

 

серий №3 и №10).

 

 

 

 

Сравним фактические значения с табличными. Если будут выполнены неравенства (40), остатки модели являются случайными. Критические значенияопределяются в зависимости от количества наблюдений n по формуле (41).

70