Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекции по математике. Теория вероятности

.pdf
Скачиваний:
97
Добавлен:
29.03.2016
Размер:
4.02 Mб
Скачать

 

g(x) -

называется

наилучшим

приближением, если

M Y g(x) 2 принимает наименьшее значение.

 

 

Рассмотрим

функцию

g(x) AX B которая

наилучшим

образом приближает X к Y .

 

 

 

M Y , 2 D X

 

Введем

обозначения

m M X

,

m

2

 

 

 

 

1

 

 

 

1

2

2 D Y ,

- корреляционный

момент, k- коэффициент

корреляции этих величин.

 

 

 

 

 

 

 

Будем искать Y ( X ) g(x) AX BY

 

 

Найти

такие

A и

B , что Ф( A, B) M [Y AX B]2

принимает наименьшее значение:

Ф( A, B) M [Y AX B]2

M [Y 2 ] B2 A2M [ X ]2 2BM [Y ]2 AM [ XY ] 2 AMB[ X ]

22 m22 B2 A2 ( 12 m12 ) 2Bm2

2 A( m1 m2 ) 2 ABm1

Исследуем на экстремум

 

 

 

 

Ф = 2[ A( 2

 

m2 ) ( m m

) Bm ] 0

А

 

 

1

 

1

1

2

 

1

 

 

 

 

 

 

 

 

 

Ф = 2[m

2

B Am ] 0

 

 

 

А

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент

 

A -

коэффициент

регрессии. Прямая

y m2

k

x m1

– прямая регрессии.

 

 

 

 

2

 

1

 

 

 

 

 

 

 

Воздействие неучтенных факторов и ошибок наблюдений в модели определяется с помощью остаточной дисперсии.

Минимум равен 22 (1 k 2 ) – остаточная дисперсия, которая

характеризует величину ошибки, допускаемой при использовании приближенного равенства Y g(x) AX B .

221

Пример Найти выборочное уравнение прямой линии

регрессии: а) Y на X , б)

X на Y , если известны: выборочные

 

 

 

 

 

 

средние x 3,6 ,

y 4 ,

выборочные дисперсии Dx 0,04 ,

D y 0,25, выборочный коэффициент корреляции rB 0,6 .

Решение

а) Выборочное уравнение прямой линии регрессии Y на X имеет вид

y y rB y x x ,

x

где x Dx , y Dy .

Поскольку x 0,04 0,2 , y 0,25 0,5 ,

получаем уравнение

y 4 0,6 0,20,5 x 3,6 ,

или

y 1,5x 1,4 .

б) Согласно выборочному уравнению прямой линии

регрессии X на Y :

x x rB x y y .y

Поэтому

получаем

x 3,6 0,6

0,2

y 4 ,

или

0,5

 

 

 

 

 

x 0,24 y 2,64

Многомерная нормальная регрессионная модель

Когда одна случайная переменная реагирует на изменение другой изменением своего закона распределения, речь идет о так называемой стохастической связи.

Частный случай такой связи - когда условное математическое ожидание одной случайной переменной

222

является функцией значения, принимаемого другой случайной переменной, т.е.

M (Y / x) f (x) ,

где f x - теоретическая (истинная) функция или модель

регрессии Y относительно X .

Статистические связи исследуются по выборкам ограниченного объема. На основании этих данных выполняют поиск подходящих аппроксимаций для f (x) . Чтобы выяснить,

как значение одной случайной переменной, в среднем, изменяется в зависимости от того, какие значения принимает другая случайная переменная, используют условное среднее

значение y(x) , которое является выборочной оценкой условного

математического ожидания, а соответствующее выражение - эмпирической функцией регрессии.

Практическое значение знания регрессионной зависимости между случайными переменными X и Y заключается в возможности прогнозирования значения зависимой случайной переменной Y , когда независимая случайная переменная X принимает определенное значение. Прогноз не может быть безошибочным, однако можно определить границы вероятности ошибки прогноза.

Вариация зависимой переменной и коэффициент детерминации

Рассмотрим вариацию (разброс) Tss значений yi относительно среднего значения y

Обозначим yi регрессии значения

n

Tss = ( yi y ) 2 . i 1

предсказанные с помощью функции

yi :

 

 

 

y

a

bxi .

223

n

 

y )

2

 

 

 

 

 

 

 

 

 

Rss = ( yi

 

 

означает величину разброса, которая

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

обусловлена регрессией (ненулевым значением наклона b ).

n

 

 

 

 

)

2

 

 

 

 

 

 

 

 

 

Ess = ( yi

yi

 

означает разброс за счет случайных

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отклонений от функции регрессии.

 

 

 

Оказывается,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tss Rss

Ess ,

 

- полный разброс равен сумме разбросов за счет регрессии и

за счет случайных отклонений.

 

 

 

 

 

 

 

Величина

 

Rss

 

это

доля

 

 

вариации

значений yi ,

 

Tss

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

обусловленной

регрессией

 

(т.е.

доля

закономерной

изменчивости в общей изменчивости).

 

 

 

Определение Коэффициент детерминации статистика

 

 

 

 

 

 

 

R 2

 

Rss

 

1 Ess

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tss

 

 

Tss

 

показывающая, какая доля дисперсии результативного признака объясняется влиянием объясняющих переменных.

Если R 2 0 , это означает, что регрессия ничего не дает, т.е.

знание

x не улучшает предсказания для y

по

 

сравнению

с

 

 

 

 

2

1 означает

тривиальным yi y .

Другой крайний случай

R

 

точную

подгонку:

все точки наблюдений

 

лежат

на

регрессионной прямой. Чем ближе к 1 значение R2 , тем лучше качество подгонки. Линейная регрессия имеет следующие общие свойства:

1.Чем ближе значение коэффициента детерминации к 1, тем ближе модель к эмпирическим наблюдениям.

2.С увеличением количества объясняющих переменных увеличивается R2.

224

Контрольные вопросы

1.Что показывает коэффициент регрессии?

2.Что показывает коэффициент корреляции?

3.В чем отличие корреляционной зависимости от функциональной?

4.Каким методом определяются параметры линейной регрессии?

5.При каких значениях коэффициента регрессии зависимость случайных величин является:

а) прямой; б) обратной?

6.Чем занимается регрессионный анализ?

7.Перечислите свойства линейной регрессии.

8.Запишите уравнение регрессии.

9.Отчего зависит наклон линии регрессии?

10.Что показывает коэффициент детерминации?

11.В чем отличие многомерной от линейной регрессии?

225

Лекция 15

Статистические оценки параметров распределения

Результаты измерений могут рассматриваться законченными, только когда они сопровождаются статистической оценкой полученных данных, поскольку никогда не бывает 100% уверенности в точности определенных значений.

Для статистической оценки параметров распределения используют средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называют центральными моментами распределения порядка, соответствующего степени, в которую возводятся отклонения

Получив статистические оценки параметров распределения (выборочное среднее, выборочную дисперсию и т.д.), нужно убедиться, что они в достаточной степени служат приближением соответствующих характеристик генеральной совокупности. Определим требования, которые должны при этом выполняться.

Определение Статистическая оценка неизвестного параметра теоретического распределения - функция от наблюдаемых случайных величин.

Пусть Θ* - статистическая оценка неизвестного параметра Θ теоретического распределения. Извлечем из генеральной совокупности несколько выборок одного и того же объема n и

вычислим

для

каждой

из

них

оценку

параметра

Θ:

Θ* ,Θ* , ,Θ*

 

 

 

 

 

 

 

 

 

1

2

k

 

 

 

 

 

 

 

 

 

Тогда

оценку

*

 

рассматривать

как

случайную

Θ

можно

величину,

принимающую

возможные

значения

Θ* ,Θ* , ,Θ* .

 

 

 

 

 

 

 

 

 

1

2

k

Если

математическое

 

 

*

 

 

оцениваемому

ожидание Θ не равно

параметру, мы будем получать при вычислении оценок

систематические ошибки одного

знака

(с избытком, если

M Θ* Θ, и с недостатком, если

M Θ*

Θ).

226

Следовательно, необходимым условием отсутствия систематических ошибок является требование

M Θ* Θ.

Определение Статистическая оценка Θ* называется несмещенной, если ее математическое ожидание равно оцениваемому параметру Θ при любом объеме выборки:

M Θ* Θ

Определение Статистическая оценка называется смещенной оценкой, если математическое ожидание не равно оцениваемому параметру.

Однако несмещенность не является достаточным условием хорошего приближения к истинному значению оцениваемого

параметра. Если при этом возможные значения Θ* могут значительно отклоняться от среднего значения, то есть

дисперсия Θ* велика, то значение, найденное по данным одной выборки, может значительно отличаться от оцениваемого параметра. Следовательно, требуется наложить ограничения на дисперсию.

Определение Статистическая оценка называется эффективной, если она при заданном объеме выборки n имеет наименьшую возможную дисперсию.

Эффективность оценки зависит от вида распределения. Можно доказать, что если случайная величина имеет нормальное распределение, то оценка математического ожидания X является и эффективной. При рассмотрении выборок большого объема к статистическим оценкам предъявляется еще и требование состоятельности. Естественно

потребовать от оценки * , чтобы при увеличении числа опытов

nона приближалась к искомому параметру

Определение Состоятельной называется статистическая оценка, которая при n стремится по

вероятности к оцениваемому параметру (если эта оценка несмещенная, то она будет состоятельной, если при n ее дисперсия стремится к 0).

lim P{

 

*

} 1.

n

 

 

 

 

 

227

Замечание Т.е чем больше объем выборки, тем больше вероятность того, что ошибка оценки будет очень мала.

Убедимся, что среднее арифметическое значение x B представляет собой несмещенную оценку математического ожидания M x .

Будем рассматривать xB как случайную величину, а x1 , x2 , , xn , то есть значения исследуемой случайной

величины, составляющие выборку,

– как

независимые,

одинаково распределенные случайные величины

X1 , X 2 , , X n ,

имеющие математическое ожидание a . Из свойств математического ожидания следует, что:

 

 

X1 X X n

 

 

 

 

 

 

M X B M

 

 

 

a

 

 

n

 

 

 

 

 

 

 

Но, поскольку каждая из величин

X1 , X 2 , , X n

имеет такое

же распределение, что и генеральная совокупность,

a M X ,

то есть M X B M X , что и требовалось доказать.

Выборочное среднее является не только несмещенной, но и состоятельной оценкой математического ожидания.

Если предположить, что X1 , X 2 , , X n имеют ограниченные дисперсии, то из теоремы Чебышева следует, что их среднее

арифметическое, то есть X B , при увеличении n стремится по вероятности к математическому ожиданию каждой их величин,

то есть к M X .

Следовательно, выборочное среднее есть состоятельная оценка математического ожидания.

В отличие от выборочного среднего, выборочная дисперсия является смещенной оценкой дисперсии генеральной совокупности. Можно доказать, что

M DB n 1 Dr , n

где Dr – истинное значение дисперсии генеральной совокупности.

228

Можно предложить другую оценку дисперсии – исправленную дисперсию s2 , вычисляемую по формуле:

 

 

 

 

 

 

k

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni xi

 

B

 

 

 

n

 

 

x

 

s 2

 

DB

 

i 1

 

 

 

.

 

 

 

 

 

n 1

 

n 1

 

 

 

 

 

 

Такая оценка будет являться несмещенной.

Ей соответствует исправленное среднее квадратическое отклонение

 

 

 

 

 

 

 

k

2

 

 

 

 

 

 

 

 

xi

 

B

 

 

 

s

 

 

 

ni

x

 

 

 

s

2

i 1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

Множитель

n

называется поправкой Бесселя.

 

 

n 1

Определение Оценка некоторого признака называется

асимптотически несмещенной, если для выборки x1 , x2 , , xn

lim

x1 x2

xn

X

 

 

n

n

где X – истинное значение исследуемой величины.

Пример Пусть в n испытаниях Бернулли событие

A

произошло m раз. В качестве

оценки вероятности

p

принимается частота события

m

. Т.е. p , *

m

. Будет

 

 

 

 

 

 

n

 

 

 

n

 

ли * несмещенной?

 

 

 

 

 

 

 

 

 

 

Решение

 

 

 

 

 

 

 

 

 

 

Т.к. случайная величина (w) m имеет M [ ] np , то

 

M [ * ] M [

m

]

1

M [m]

1

np p .

 

 

 

 

 

 

n

 

n

 

n

 

Частота события является несмещенной оценкой.

229

– вероятность того, что в результате
x1 , x2 , , xn .

Метод наибольшего правдоподобия

Пусть X – дискретная случайная величина, которая в результате n испытаний приняла значения

Предположим, что нам известен закон распределения этой величины, определяемый параметром , но неизвестно численное значение этого параметра. Найдем его точечную оценку.

Пусть p(xi , )

испытания величина X примет значение xi . Назовем функцией

правдоподобия дискретной случайной величины

X функцию

аргумента , определяемую по формуле:

 

L x1, x2

, xn , p(x1, ) p(x2 , )

p(xn , )

Тогда в качестве точечной оценки параметра Θ принимают

такое его значение * x1, x2

, xn , при котором функция

правдоподобия достигает максимума. Оценку

* называют

оценкой наибольшего правдоподобия.

 

Поскольку функции L и ln L достигают максимума при одном и том же значении Θ, удобнее искать максимум ln L – логарифмической функции правдоподобия. Для этого нужно:

1)

найти производную

d ln L

;

 

 

 

 

 

 

 

 

 

d

 

 

 

2)

приравнять ее нулю (получим так называемое уравнение

правдоподобия) и найти критическую точку;

 

 

3)

найти вторую производную

d

2 ln L

, если она

 

d 2

 

 

 

 

 

 

отрицательна в критической точке, то это – точка максимума. Достоинства метода наибольшего правдоподобия:

1) полученные оценки состоятельны (хотя могут быть смещенными), распределены асимптотически нормально при больших значениях n и имеют наименьшую дисперсию по сравнению с другими асимптотически нормальными оценками;

230