Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Shpora_2_1

.pdf
Скачиваний:
19
Добавлен:
10.05.2015
Размер:
1.1 Mб
Скачать

41. Методы получения точечных оценок параметров.

Метод Моментов. Выборочные

начальные

и

центральные

моменты

 

являются

состоятельными

оценками

теоретических

 

моментов

соответствующего

порядка. На

этом основан метод моментов, предложенный К. Пирсоном. Достоинством метода является его простота. Метод моментов

состоит

 

в

 

приравнивании

теоретических

 

 

моментов

распределения

соответствующим

выборочным моментам

того

же

порядка.

 

 

 

 

 

 

Для оценки

одного параметра

приравнивают

 

 

 

 

M[ X ] X

.

 

Для

 

 

 

 

 

 

 

получения

оценок

двух

неизвестных

 

параметров

необходимо

составить

два

уравнения.

 

 

Обычно

приравнивают:

 

начальный

момент

 

первого

порядка

математическое

ожидание

и

центральный

момент

второго

порядка

 

 

дисперсию

соответствующим

выборочным

характеристикам

 

 

 

M [ X ] X

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

D[ X ] S

 

 

 

 

 

 

 

 

 

 

 

Метод

 

 

 

максимального

правдоподобия

 

 

 

Метод

 

 

 

максимального

правдоподобия, предложенный Р.

Фишером,

наиболее

распространенный

метод

нахождения

точечных

оценок

параметров в силу естественности подхода, исходящего из максимальной правдоподобности имеющихся наблюдений. Оценки

метода

максимального

правдоподобия

являются

состоятельными,

асимптотически

несмещенными и асимптотически эффективными.

Функцией

 

правдоподобия

называется функция

 

 

L(x , x

 

,..., x

n

; ) P(x ; )P(x

 

; ) .

1

2

 

1

2

 

 

 

 

.. P(x

; )

 

 

 

 

n

 

 

 

 

 

когда признак Х – дискретный;

где

P(x

; )

- вероятность того,

 

 

 

i

 

 

что признак Х принял значение

x

; и функция

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

L(x , x

 

 

,..., x

n

; )

f (x ; ) f (x

 

; ) .

 

1

2

 

 

1

2

 

 

 

 

 

 

.. f (x

 

; )

 

 

 

 

 

 

n

 

 

 

 

 

 

 

когда признак Х – непрерывный;

где

f (x

; )

- значение плотности

 

 

 

 

i

 

 

 

распределения

вероятностей

непрерывного

признака в точке

x

.

i

 

42. Метод моментов. Непрерывное равномерное распред.

Найти методом

моментов по

выборке

x

, x

,..., x

 

1

2

n

 

 

точечные

оценки

 

неизвестных

параметров a и b непрерывного равномерного распределения. Решение. Математическое ожидание и дисперсия непрерывной равномерно распределенной на отрезке [a,b]

случайной

 

 

 

 

 

 

величины

равны:

 

 

 

a b

 

 

(b a)2

M[X ]

 

;

D[X ]

 

 

2

 

12

 

 

 

 

 

 

 

 

 

 

Приравниваем

 

 

теоретические

моменты

 

и

 

 

их

выборочные

аналоги:

 

 

 

 

 

 

 

 

 

 

 

a b

X

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(b a)

2

 

2

 

 

 

 

S

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решая полученную систему относительно неизвестных параметров a и b, получим, что их оценки вычисляются по формулам:

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 S

a X

~

 

 

 

 

 

 

 

 

 

b

X

 

3 S

43. Метод моментов.

Биноминальное распределение.

Найти

методом

 

моментов

по

выборке

 

x

, x ,..., x

точечную

 

 

 

 

 

 

 

 

 

1

2

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

оценку

 

 

 

параметра

 

p

биномиального распределения

 

 

 

 

 

x

 

x

 

 

m x

,

P

(x ) C

i

p

 

i

(1 p)

i

m

 

 

 

 

m

i

 

 

 

 

 

 

 

 

 

где

x

 

 

 

число появлений

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

события

 

в

i-ом

 

опыте (i=1,

2,

…,n), m – количество испытаний в одном опыте.

Решение. Требуется оценить один параметр, следовательно, для этого достаточно иметь одно

уравнение

M[X ] X . Приняв

во внимание, что математическое

ожидание

 

биномиального

распределения

 

 

 

 

 

 

1

n

 

,

M[X ] mp;

X

x

 

n

 

 

 

i 1

i

 

 

 

 

 

 

получим уравнение, из которого найдем оценку вероятности:

 

1

n

 

.

mp

 

 

x

 

n

 

 

i 1

i

 

 

 

 

 

Итак, точечной оценкой вероятности служит выборочная средняя, деленная на количество испытаний в одном опыте:

 

 

n

 

 

 

 

 

x

 

 

~

 

i 1

i

 

X

p

mn

m

 

 

 

44. МАХ. Правдоподобие.

Нормальное распред.

Найти методом максимального правдоподобия оценки параметров m и нормального распределения

 

 

 

1 x m

2

 

 

,

 

 

 

 

 

 

1

 

 

 

 

 

 

 

f (x)

e

2

 

 

2

 

 

 

 

 

 

 

 

 

 

если в результате n испытаний величина Х приняла значения x1, x2,..., xn .

Решение.

Составим функцию правдоподобия

L(m, ) L(x , x ,..., xn;m, )

 

 

 

 

 

1

2

n

1

 

 

(xi m)2/2 2

 

 

 

 

e

 

 

i 1

2

 

 

 

n (x m)2/2 2

1i

n(2 )n e i 1

ln L(m, ) nln ln

1

 

2 )n

 

 

(

 

 

(x

m)2

 

 

 

i

 

 

 

2 2

 

 

 

 

 

Найдем частные производные по m и

 

 

 

n

 

nm

 

 

 

 

x

 

 

ln L(m, )

 

 

 

 

i 1

i

 

0

 

 

m

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

(x

m)

2

 

 

 

 

 

 

 

 

 

 

 

 

 

ln L(m, )

 

 

n

 

i 1

i

 

 

 

 

 

3

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение этой системы уравнений имеет вид

~

 

 

1

 

n

 

 

 

 

 

m X

n

 

x

 

 

 

 

 

 

i 1

i

 

 

 

 

 

 

 

 

 

 

 

~2

S

2

 

1

 

n

 

X )

2

 

 

n

(x

 

 

 

 

 

 

i 1

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оценками параметров

нормального

 

 

распределения

являются

 

выборочные оценки

математического

ожидания и

дисперсии.

 

 

 

 

45. МАХ правдоподобие.

Геометрическое распред.

Найти методом

максимального

правдоподобия

по

выборке

x , x

,..., x

точечную

оценку

 

 

 

1

2

n

 

 

 

 

 

 

 

параметра p геометрического распределения

P(X x ) (1 p)

x 1

 

i

p,

 

i

 

 

где

- число

испытаний,

 

xi

 

 

произведенных до появления события; р – вероятность появления

события в одном испытании. Решение.

L( p) L(x

, x

 

,..., x

; p)

 

 

 

 

 

 

 

 

1

 

2

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

x

1

p

 

 

 

 

 

 

 

 

 

 

(1 p)

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x n

 

 

 

 

 

 

 

 

 

 

p

n

(1 p)

i 1

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ln L( p) n ln

p

 

n

 

n) ln(1 p)

( x

 

 

 

 

 

 

 

 

 

 

 

i 1

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

d ln L( p)

 

 

n

 

i 1

 

i

 

 

 

0

 

 

dp

 

p

 

1 p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

np 0

 

 

 

n np p x

 

 

 

 

 

 

 

 

 

i 1

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n;

 

 

 

 

~

 

 

n

 

 

 

 

1

 

 

 

p x

 

 

 

p

n

 

 

 

 

 

 

 

i 1

i

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем вторую производную

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

d

ln L( p)

 

n

 

i 1

i

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

(1 p)

2

 

 

dp

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

При

 

 

 

 

 

вторая производная

 

p p

 

функции ln L( p)

по переменной

p

 

отрицательна,

 

 

следовательно

~

- точка максимума.

 

 

 

 

p

 

 

 

 

Замечание. Если отыскивают оценки двух неизвестных параметров, то функция правдоподобия будет зависеть от двух переменных. Для отыскания ее максимума необходимо использовать необходимые и достаточные условия экстремума функции двух переменных.

46. Оценки метода моментов параметров нормального распредел.

Мат. Ожид.

M(x)=

X

 

 

 

 

 

 

1

n

-выборочное среднее

X

xi

 

n

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

D(x)= S 2

 

 

 

 

2

 

1

n

 

2

-выборочная

S

 

 

n

(xi

x)

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

дисперсия

47. Интервальные оценки. Доверительный интервал и доверительная вероятность. Уровень значимости.

 

 

 

 

~

 

 

Точечная

оценка

 

 

n

неизвестного

 

 

 

 

 

 

 

 

 

параметра

, полученная по выборке

малого

объема,

 

может

сильно

отличаться

от

 

,

даже

если она

является несмещенной, состоятельной и эффективной. Для получения

представления

о

 

точности

и

надежности оценки

~

параметра

 

 

 

 

n

 

 

используют

интервальную оценку

параметра.

О: Доверительным интервалом для

параметра

 

 

,

соответствующим

доверительной

 

 

вероятности

 

называется числовой интервал

 

 

 

 

 

 

 

 

~

 

 

 

~

 

 

 

,

 

 

 

 

 

 

 

(

n

 

;

n

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

границы которого

 

 

 

-

 

 

=

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нижняя доверительная граница,

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

-

 

 

верхняя

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доверительная граница,

определяются

по

 

 

 

 

 

 

выборочным

 

 

 

данным

x

, x

 

 

,..., x

n

так, чтобы

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

1

~

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

 

P(

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

n

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т.е. доверительный интервал с заданной доверительной вероятностью

(надежностью)

 

накрывает

неизвестное значение параметра .

Доверительная

 

вероятность

определяет

 

достоверность

(надежность) оценки.

Наиболее часто

используют следующие значения

доверительной вероятности: 0,90; 0,95;

0,99. Величина

 

определяет

точность оценки параметра .

Величина доверительного интервала зависит от объема выборки – уменьшается с увеличением числа наблюдений. С увеличением доверительной вероятности величина доверительного интервала увеличивается. Получение доверительного интервала меньшей величины при заданной надежности связано с увеличением объема выборки n.

Вероятность попадания параметра вне интервала - величина =1- называется уровнем значимости. Границы доверительного интервала ,

выбирают так, чтобы вероятности попадания параметра ниже нижней границы и выше верхней границы

 

были одинаковы и равны

. Если

 

2

 

функция распределения F(x) оценки

~ известна, то границы

n

доверительного интервала находятся из уравнений

F ( ) 2

F ( ) 1 2

Решения приведенных уравнений ,

являются квантилями функции

распределения

F(x)

 

уровней

соответственно:

и 1

 

которые

 

 

 

2

2

 

определяются

из

 

таблиц

распределения F(x).

 

 

 

48. Основные распредел.

Пусть дана случайная независимая выборка, полученная из нормальной генеральной совокупности с законом

распределения

N(m,

2

) .

 

 

 

Стандартное

нормальное

распределение.

 

 

 

 

Выборочное

среднее

X -

нормально

распределенная

случайная

величина,

как

линейная комбинация нормально

распределенных

 

 

случайных

величин,

x , x ,..., xn

с

 

 

 

1

2

 

 

 

параметрами

 

 

 

 

M[X ] m;

D[X ]

 

2

.

-

 

n

 

 

 

 

 

 

называется

функцией

Лапласа

и

обозначается Ф(х). Значения

случайной величины

X

при

переходе

 

к

стандартному

нормальному

 

распределению

преобразуются

 

 

 

Z

X m

 

 

 

 

n

 

 

 

 

 

 

 

и Z N(0,1).

Распределение Стьюдента.

Если случайная, независимая выборка, произведена из нормальной генеральной совокупности, дисперсия которой неизвестна, то случайная величина

T

 

X m имеет

t-

 

 

 

n

 

S /

n

 

 

 

 

распределение Стьюдента с n степенями свободы.

При малом n, t-распределение является более пологим по сравнению со стандартным нормальным распределением. С возрастанием объема выборки t- распределение приближается к нормальному.

- 2 – распределение.

Если случайная, независимая выборка, произведена из нормальной генеральной совокупности, дисперсия которой неизвестна, то случайная величина

 

 

~

X 2

(n 1)

S

2

 

 

 

n

 

2

 

 

имеет 2-распределение с (n-1) степенями свободы.

Распределение не симметрично и

изменяется по

мере

увеличения

объема выборки.

 

 

 

 

- F- распределение. Если имеется

две

случайные,

независимые

выборки объема

 

 

, отобранные

 

 

 

n1,n2

 

 

 

из

нормальных

генеральных

совокупностей

с

дисперсиями

 

, то случайная величина

2, 2

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

n S 2

 

 

n S 2

 

1 1

 

 

 

2

2

 

 

F

 

/

 

 

 

(n 1) 2

(n 1) 2

 

1

1

 

2

 

2

 

подчиняется F-распределению с числом степеней свободы

Fn1n2

n1 и n2 .

49. Доверительный интервал для мат. ож.

при известной дисперс.

Пусть выборка получена из нормальной генеральной совокупности с параметрами

M[X] = m, D[X] = 2.

Доверительный интервал для математического ожидания при

известной дисперсии

2

.

 

Доверительный

интервал для параметра m с заданным уровнем значимости согласно статистике имеет вид:

 

 

 

 

 

 

 

 

,

X z

 

m X z

 

 

n

n

1

2

 

 

 

1

2

 

 

 

 

 

 

 

где

 

z

 

 

-

квантиль

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

стандартного

 

 

нормального

распределения уровня 1

.

 

 

 

 

 

 

 

 

2

50. Доверительный интервал для мат. ож.

при неизвестной дисперс.

Пусть выборка получена из нормальной генеральной совокупности с параметрами

M[X] = m, D[X] = 2.

Доверительный

интервал

 

для

математического

ожидания

при

неизвестной дисперсии

2

.

 

 

 

В

этом

случае

 

для

построения

доверительного

интервала

используется

t-

распределение

Стьюдента,

а

вместо неизвестной дисперсии ее

 

 

~

 

несмещенная

оценка

S

2

.

 

Обозначим

 

квантиль

t

(n 1)

 

 

 

1

2

 

 

 

t-распределения Стьюдента с (n- 1) степенью свободы уровня

1

.

2

 

Доверительный интервал для неизвестного параметра m с заданным уровнем значимости согласно статистике имеет вид:

 

 

 

~

 

 

 

~

X t

 

(n 1)

S

m X t

 

(n 1)

S

 

 

1

2

 

n

1

2

 

n

 

 

 

 

 

 

51. Доверительный интервал для дисперсии

Пусть выборка

получена

из

нормальной

 

 

генеральной

совокупности с

параметрами

M[X] = m, D[X] = 2.

 

 

 

 

Доверительный

 

интервал

 

для

дисперсии.

 

 

 

 

 

 

 

Обозначим

 

 

 

и

 

 

 

 

2

 

 

 

2

(n 1)

 

 

(n 1)

 

 

1

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

квантили 2- распределения с (n-

1) степенью

свободы

уровней

соответственно

1

 

и .

 

 

2

 

2

 

 

 

Доверительный интервал для неизвестного параметра 2 с заданным уровнем значимости согласно статистике имеет вид:

(n

~2

 

2

 

 

~2

1)S

 

 

(n 1)S

 

2

 

(n 1)

 

2

(n 1)

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

2

 

 

 

 

 

 

 

 

Доверительный интервал для среднего квадратического отклонения

(n

~2

 

 

~2

1)S

 

(n 1)S

 

2

 

(n 1)

2

(n 1)

 

 

 

 

 

1

2

 

 

2

 

 

 

 

 

 

52. Статистическая гипотеза.

Статистической гипотезой наз. любое предположение о законе распределения или параметрах закона распределения одной или нескольких случайных величин.

1)М(х)=10

2)Д(х)=Д(у)

3)х~N(m, )

Исходное предположение наз. 0-

ой гипотезой и обозначается H

0

.

 

 

 

 

 

H

: М(х)=10

 

 

 

 

 

0

 

 

 

H

 

: Д(х)=Д(у)

 

 

 

 

0

 

 

 

H

: х~N(m, )

 

 

 

 

 

0

 

 

 

Любое

предположение

исключающее 0-ю гипотезу наз.

альтернативной

или

конкурирующей гипотезой

 

H

0

: М(х) 10

 

 

 

 

 

H

0

: М(х)< 10

 

H

0

: М(х)> 10

 

 

 

 

 

Задача состоит в том, что бы на основании выборочных данных дать ответ на вопрос: согласуются ли данные эксперимента с выдвигаемыми гипотезами или они ей противоречат.

Проверка:

1)Формируется нулевая и альтернативная гипотезы.

2)Задается уровень значимости

и выбирается Ткр.

3)Определяется критическая область

Р(Т К|Н0)=

 

4) Х1,…,Хn, Т-темп

Если Т К, то Н0 – отверг.

Если Т Д, то Н0 – прин.

53. Ошибка 1-го и 2-го рода. Статистический критерий. Ур. значимости и мощность.

Ошибка 1-го рода:

Отклонить Н0 когда она верна.

 

H

 

 

P

 

1

 

 

H

 

 

 

0

 

-уровень значимости.

Ошибка 2-го рода:

Принять Н0 когда она не верна.

 

H

 

 

P

 

0

 

 

H1

 

 

 

Возможные решения при проверке:

Решение

 

.вер-0Н

 

.Верн Не

 

 

 

 

 

Принять

-(1 .Вер

.Реш.Прав

 

го-2Ошибка

)

 

 

 

 

 

 

 

 

 

 

Отклонить

Ошибка

)В-(1.вер

реш.прав

1-го

 

 

 

 

 

 

рода

 

 

 

Верна

 

 

 

 

 

 

 

 

 

 

 

 

Статистический критерий:

Правило по которому решают принять \отклонить наз. критерием. Все выборочное пространство делится на: S- область отклонения (критическая)

и

S

-область принятия. В случае

когда будет принята Н1, тогда как и на самом деле в генеральной совокупности верна Н1, то вероятность такого решения

 

H1

наз. мощностью

1 P

 

 

 

 

H1

 

 

 

критерия.

54. Критическая и допустимые области. Общая схема проверки Н

Все

выборочное

пространство

делится

на:

S-

область

отклонения (критическая) и

S -

область

принятия.

Если

выборочная точка х

попала в S,

то

основная

гипотеза

Н0

отклоняется

и

принимается

альтернативная гипотеза Н1 и наоборот.

Проверка:

1)Формируется нулевая и альтернативная гипотезы.

2)Задается уровень значимости

и выбирается Ткр.

3)Определяется критическая область

Р(Т К|Н0)=

4) Х1,…,Хn, Т-т импирич Если Т К, то Н0 – отверг.

Если Т Д, то Н0 – прин.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]