Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

9521

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
2.81 Mб
Скачать

 

 

n

 

 

 

 

 

 

 

 

 

2

 

T

 

T

 

 

 

 

ei

2 ( X

 

y X

 

X b) 0 ,

 

в ( X T

X ) 1 ( X T y) .

 

b i 1

 

 

 

 

 

 

 

 

 

 

Таким образом, оценка для коэффициентов регрессии - построена. Матрица,

входящая в выражение для

 

коэффициентов имеет вид средних перекрестных произ-

ведений:

 

 

 

 

 

 

 

 

 

1

 

 

 

x

 

 

 

x

 

 

 

 

 

x

 

 

...

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

2

 

 

 

 

 

3

 

 

 

 

 

m

 

 

 

 

 

x1

 

 

x1 x1

 

 

x1 x2

 

 

x1 x3

...

 

x1 xm

 

 

 

 

Х T X n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W

 

x

2

 

x

x

 

x

2

x

2

 

x

2

x

3

...

x

2

x

 

,

 

 

 

 

 

2 1

 

 

 

 

 

 

 

 

 

 

 

 

m

 

...

 

 

 

...

 

 

 

...

 

 

 

 

...

 

...

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xm x1

 

xm x2

 

xm x3

...

 

 

 

 

 

 

 

 

xm

 

 

 

xm xm

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yx

 

 

 

 

 

 

 

 

 

1

 

 

X

T

n

 

yx

 

 

y

 

2

 

.

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yxm

 

 

Значимость построенного уравнения линейной среднеквадратической регрессии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yˆ(x)

x

b проверяется

по значимости коэффициентов регрессии bк

или коэффи-

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

D

 

 

 

 

 

 

 

 

 

 

 

1

n

циента детерминации

R2

 

 

Y

1

e

.

Для проверки вычисляются:

De

 

ei2 -

D

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

y

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

 

 

 

 

 

 

 

 

дисперсия

ошибок регрессии,

S 2

 

 

 

 

ei2 - несмещенная стандартная ошибка

 

 

 

 

 

 

n m

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

регрессии,

Sb2

S 2

Wкк1 - несмещенные дисперсии коэффициентов регрессии.

 

 

 

 

 

 

K

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для построения критериев значимости воспользуемся известными статистика-

ми:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

bk

t

 

 

~ распределение Стьюдента с n m 1степенями свободы,

 

 

 

 

 

n m 1

 

 

 

 

Sb

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R 2

 

n m 1

F ,

 

~ F-распределение Фишера с m,

 

 

n m 1 степеня-

 

 

 

 

 

 

 

 

 

 

1 R 2

 

 

m

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

ми свободы. Задаваясь уровнем значимости проверяемой гипотезы H 0

{bk

0} , со-

ответствующей

независимости величин

Х r и Y , можно сравнить наблюдаемое зна-

чение критерия tnab с критическим значением tkr ( ) . Если

 

tnab

 

 

tkr ( ) , то гипотеза

 

 

 

принимается, что говорит о незначимости

коэффициента

bк , мало отличного от ну-

ля, то есть о незначимости переменной Х r

в уравнении регрессии, такие переменные

желательно исключить из модели регрессии. Аналогично проверяется гипотеза о значимости коэффициента детерминации H 0 {R 2 0} , соответствующей значимости

всего уравнения регрессии в целом. Сравнивая наблюдаемое значение критерия Fnab ,

с критическим значением Fkr ( ) , можно утверждать, что если

Fnab Fkr ( ) , то гипо-

теза принимается, что говорит о незначимости коэффициента

R 2 , мало отличного

от нуля, то есть о не значимости уравнения регрессии в целом.

 

Помимо значимости построенного уравнения регрессии, его качество оценивается так же отсутствием зависимости между объясняющими переменными Х r (мульти-

коллинеарности), отсутствием зависимости величины дисперсии ошибок De от переменных Х к и Y (гетероскедастичности), отсутствием зависимости ошибок ei yi yˆi между собой (например, автокорреляции).

Мультиколлинеарность приводит к неустойчивости обращения матрицы W, а ее устранение возможно путем исключения из регрессионной модели малозначимых и сильнозависимых объясняющих переменных (факторов). Для такого исключения

построим

 

 

 

корреляционную

матрицу парных

 

коэффициентов корреляции:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

xi x j

 

 

 

 

 

j

. Тогда, если

 

 

 

 

xi

x

r

1 , а коэффициент b

 

незначим или малозначим, то

 

 

 

 

 

 

 

 

к

ij

x

x

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

i

 

 

 

 

 

переменную Х к можно исключить из модели регрессии, если коэффициент детерминации при этом значимо не уменьшается.

Гетероскедастичность и автокорреляция могут быть установлены при помощи теста ранговой корреляции Спирмена и теста Дарбина-Уотсона соответственно [1]. Влияние этих нежелательных для качества регрессии факторов может быть ослаблено путем различного рода преобразования переменных регрессионной модели [9].

3. О нелинейной регрессии

Иногда линейная модель регрессии бывает недостаточной, с точки зрения ее качества и значимости, поэтому может быть использованы нелинейные модели. В простейшей форме нелинейность может быть учтена путем введения инструментальных

переменных zr r (xk ) , которые входят в модель регрессии обычным линейным образом. При этом часто используются степенная функция zr x , логарифмическая

zr ln x , показательная

zr e x

и иногда тригонометрическая zr Sin( x 0 ) для

выявления циклических факторов в зависимостях. Например, нелинейная модель 2- го порядка может быть построена следующим образом (рис. 15.3):

ˆ

b1 х b2 x

2

e

 

ˆ

b1 х b2 z2 e ,

у(x) b0

 

у(x, z2 ) b0

где z2 x 2

- инструментальная переменная. Введение новых членов в модель регрес-

сии, в том числе и инструментальных, оправдано тогда, когда значимо повышается коэффициент детерминации.

Рис.15.3 Кривая нелинейной среднеквадратической регрессии 2-го порядка.

Иногда

строится

мультипликативная

модель

регрессии

уˆ(x1 , x2 ,...xm ) b0 х1b1 x2b2

.... xmbm e , которая путем

логарифмирования может

быть сведена к обычной аддитивной линейной модели для инструментальных переменных.

 

СОДЕРЖАНИЕ

 

 

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

 

Введение

 

3

Лекция 1.

Предмет теории вероятности

4

Лекция 2.

Вычисление вероятностей

11

Лекция 3.

Вероятности сложных событий

17

Лекция 4.

Схема независимых испытаний

25

Лекция 5.

Дискретные случайные величины

31

Лекция 6.

Непрерывные случайные величины

36

Лекция 7.

Примеры непрерывных случайных величин

43

Лекция 8.

Числовые характеристики величин

50

Лекция 9.

Закон больших чисел

58

 

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

 

Лекция 10. Выборочный метод математической статистики

63

Лекция 11. Выборочные распределения

69

Лекция 12. Статистические оценки параметров распределения

72

Лекция 13. Проверка статистических гипотез

78

Лекция 14. Примеры построения критериев проверки

82

Лекция 15. Элементы корреляционного анализа

90

Приложения

98

Литература

104

Горбиков Сергей Павлович, Филатов Леонид Владимирович

ЛЕКЦИИ ПО ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ

Учебно-методическое пособие

по подготовке к лекциям и практическим занятиям

для обучающихся по дисциплине «Математика по направлению подготовки 09.03.03 Прикладная информатика

направленность (профиль) Прикладная информатика в экономике

Федеральное государственное бюджетное образовательное учреждение высшего образования «Нижегородский государственный архитектурно-строительный университет»

603950, Нижний Новгород, ул. Ильинская, 65. http://www. nngasu.ru, srec@nngasu.ru

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]