Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Rukovodstvo по Эконометрике.doc
Скачиваний:
7
Добавлен:
11.11.2018
Размер:
1.64 Mб
Скачать

1.2. Нелинейная парная регрессия

Расчетные формулы

Нелинейная регрессия, линейная по параметрам.

1.2.1 Линеаризация модели выполняется путем введения новых переменных, относительно которых модель будет линейной. Например, если модель имеет вид:

,

то введение новой переменной позволяет получить линейную относительно этой переменной модель:

.

1.2.2 МНК - оценки коэффициентов модели:

, ,

, , , , .

В итоге получается нелинейная парная регрессия .

1.2.3 Выборочная дисперсия и среднее квадратическое отклонение (СКО):

.

1.2.4 Остаточная сумма квадратов отклонений:

.

1.2.4 Индекс корреляции:

.

1.2.5 Индекс детерминации:

.

1.2.6 Средняя относительная ошибка аппроксимации:

.

1.2.7 Средний коэффициент эластичности:

.

1.2.8 критерий Фишера:

,

где число параметров модели.

Нелинейная регрессия, нелинейная по параметрам.

1.2.9 Для линеаризации модели её предварительно логарифмируют и вводят в рассмотрение новые переменные, относительно которых модель будет уже линейной. Рассмотрим, например, степенную модель

.

После логарифмирования она примет вид:

.

Введя новые переменные:

,

получаем линейную модель:

.

1.2.10 МНК - оценки коэффициентов этой модели:

, ,

, , , , .

1.2.11 Оценка коэффициента :

.

В результате получается степенная регрессия .

1.2.12 Факторная сумма квадратов:

1.2.12 Индекс корреляции:

.

1.2.13 Индекс детерминации:

.

Средняя относительная ошибка аппроксимации, средний коэффициент эластичности и критерий Фишера вычисляются по формулам 1.2.6, 1.2.7, и 1.2.8 соответственно.

Решение типовой задачи.

Для данных, представленных в таблице 1.1 требуется:

1. Построить гиперболическую регрессионную модель зависимости заработной платы от возраста рабочего, вычислить индекс корреляции и детерминации, а также статистическую значимость уравнения регрессии на уровне .

2. Построить степенную регрессионную модель зависимости заработной платы от возраста рабочего, оценить её точность по индексу детерминации и средней относительной ошибки аппроксимации и значимость (на уровне ).

3. Сравнить модели парной регрессии (включая линейную) по индексу детерминации и средней относительной ошибки аппроксимации и выбрать наилучшую.

Решение выполним в среде MS Excel.

1. Оценим гиперболическую модель . Она линейна по параметрам .

Введем новую переменную . Линеаризованная модель примет вид: .

Сформируем расчетную таблицу следующей структуры:

№ п/п

1

20

Сумма

Среднее

Введем исходные данные , в таблицу по столбцам и рассчитаем колонки , , , . Вычисляем суммы и средние значения столбцов с помощью функций СУММ(…) и СРЗНАЧ(…).

Выполним расчет параметров уравнения регрессии по формулам 1.2.2:

, .

В итоге получена гиперболическая модель: .

Вычислим предсказанные моделью значения з/п по формуле

и тем самым заполним колонку расчетной таблицы. Далее вычисляются остатки и их квадраты . В итоге в строке "Сумма" колонки таблицы определится остаточная сумма квадратов .

Построим график функции на поле корреляции с помощью Мастера диаграмм и убедимся, что МНК дал хорошие результаты аппроксимации.

Найдем значения выборочной дисперсии и СКО для по формулам 1.2.3:

, .

Найдем индекс корреляции по формуле 1.2.4:

.

Индекс корреляции близок к единице и это указывает на тесную гиперболическую связь между изучаемыми признаками.

Рассчитаем индекс детерминации по формуле 1.2.5:

.

Значение индекса детерминации близко к единице и по нему следует, что з/п по этой модели на 78% обусловлена таким фактором, как возраст рабочего.

Проверим качество модели по средней относительной ошибке аппроксимации, вычислив по формуле 1.2.6. Для этого в первой строке колонки набираем с использованием функции ABS(…) формулу: =ABS()*100. После протяжки по всему столбцу вычисляем среднее значение данного столбца:

=.

По видно, что в среднем расчетные значения отклоняются от фактических на 8,7%, что говорит о хорошем качестве модели по этому критерию.

Вычислим средний коэффициент эластичности по формуле 1.2.7:

Найдем производную

.

Отсюда

.

Он показывает, что при увеличении возраста рабочего на 1 % от среднего значения з/п в среднем возрастает на 0,74%.

Рассчитаем критерий Фишера по формуле 1.2.8 (в нашем случае ):

.

Табличное значение = определяем с помощью встроенной статистической функции FРАСПОБР по уровню значимости и числам свободы и . Поскольку , то можно сделать вывод о хорошей аппроксимации статистических данных построенной моделью.

2. Построим степенную модель . Эта модель является нелинейной по параметру .

Выполним преобразования по формулам 1.2.9. Линеаризованная модель примет вид: . Здесь , .

Сформируем расчетную таблицу следующей структуры:

№ п/п

(

1

2

20

Сумма

Среднее

Введем исходные данные , в таблицу по столбцам и рассчитаем колонки , , , . Вычисляем суммы и средние значения столбцов с помощью функций СУММ(…) и СРЗНАЧ(…).

Выполним расчет параметров уравнения регрессии по формулам 1.2.10:

, .

Найдем оценку коэффициента с использованием функции EXP(…):

.

В результате построена степенная модель .

Вычислим на основе модели значения з/п по формуле:

с использованием встроенной функции СТЕПЕНЬ(;). В итоге будет заполнена колонка таблицы.

Далее вычисляются остатки , их квадраты , разности , а также их квадраты . В итоге в строке "Сумма" колонки таблицы определится факторная сумма квадратов .

Построим график функции на поле корреляции с помощью Мастера диаграмм и убедимся, что кривая неплохо представляет искомую зависимость.

Найдем индекс корреляции по формуле 1.2.12 (значение определено ранее):

.

Близость индекса корреляции к единице указывает на тесную степенную связь между изучаемыми признаками.

Рассчитаем индекс детерминации по формуле 1.2.13:

.

Из значения индекса детерминации следует, что з/п по этой модели на 84% обусловлена возрастом рабочего.

Оценим качество модели по средней относительной ошибке аппроксимации, вычислив по формуле 2.6:

=.

По видно, что в среднем расчетные значения отклоняются от фактических на 9,9%, что говорит о неплохом качестве модели по этому критерию.

Вычислим средний коэффициент эластичности по формуле 1.2.7:

Найдем производную:

.

Отсюда

.

Из этого следует, что при увеличении возраста рабочего на 1 % от среднего значения з/п в среднем возрастает на 0,86%.

Рассчитаем критерий Фишера по формуле 1.2.8:

.

Табличное значение = уже ранее определено. Так как выполняется неравенство , то можно сделать вывод о надежности и статистической значимости степенной модели.

3. Для сравнения двух нелинейных моделей составим итоговую таблицу со значениями средней относительной ошибки аппроксимации и индекса детерминации:

Модель

Гиперболическая

8,73

0,778

Степенная

9,90

0,844

Линейная

10,16

0,72

Из таблицы видно, что по средней ошибке аппроксимации лучшей является гиперболическая модель, а по индексу детерминации – степенная. Но по этим показателям они обе лучше линейной модели. Для практического использования можно рекомендовать степенную модель.

Задания для самостоятельной работы.

Задача 1. В таблице 1.2 приводятся данные по различным регионам России о среднедушевом прожиточном минимуме в день одного трудоспособного x (руб) и среднедневной заработной плате y (руб).

Табл. 1.2

Номер варианта

Параметры

Номер региона

1

2

3

4

5

6

7

8

9

10

1

x

81

85

89

76

92

104

72

88

76

84

y

135

149

137

152

164

198

143

155

161

167

2

x

92

87

83

95

77

99

80

93

79

92

y

128

131

147

164

173

207

155

164

148

192

3

x

77

83

89

81

97

113

82

93

79

94

y

133

150

145

161

178

189

167

174

122

154

4

x

89

76

91

79

99

86

112

107

87

96

y

132

127

131

120

154

143

153

149

125

146

5

x

95

98

78

87

91

101

79

88

69

107

y

144

156

132

145

158

172

126

139

115

159

6

x

77

89

84

69

93

87

76

90

104

111

y

161

149

159

122

137

143

135

190

202

221

7

x

85

89

90

109

112

96

92

78

94

108

y

133

143

147

198

210

207

189

178

188

214

8

x

85

87

93

97

104

87

91

113

106

86

y

157

169

198

225

214

203

198

246

217

159

9

x

79

86

80

95

98

106

117

108

92

87

y

176

179

176

181

215

232

241

208

205

180

10

x

113

89

95

93

102

123

154

137

98

96

y

224

199

257

248

232

256

302

264

213

245

Требуется:

1. Построить поле корреляции и сформулировать гипотезу о форме связи y и x .

2. Построить уравнение линейной парной регрессии; определить для него коэффициент детерминации и среднюю относительную ошибку аппроксимации.

3. На поле корреляции построить график полученной кривой.

4. Дать с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результирующим признаком.

5. Оценить статистическую значимость параметров регрессии и модели в целом, а также построить интервальную оценку коэффициентов линейной регрессии с надежностью 0,95.

6. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющего 107% от среднего уровня, и оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

7. Построить гиперболическую регрессионную модель зависимости среднедневной заработной платы от среднедушевого прожиточного минимума, вычислить индекс корреляции и детерминации, а также статистическую значимость уравнения регрессии по критерию на уровне .

8. Построить степенную регрессионную модель, оценить её точность по индексу детерминации и средней относительной ошибки аппроксимации и установить значимость уравнения регрессии по критерию (на уровне ).

9. На поле корреляции построить графики полученных нелинейных кривых.

10. Сравнить модели парной регрессии (включая линейную) по индексу детерминации и средней относительной ошибки аппроксимации и выбрать наилучшую.