Математика. Часть 1
.pdf
81
Неравенство Чебышева. Для каждой случайной величины X , имеющей дисперсию 2 , при любом 0 ,справедливо неравенство:
P X a 2 2 .
Неравенство Чебышева имеет огромное теоретическое значение для доказательства теорем закона больших чисел.
Теорема Чебышева. Если X1, X 2 ,...X n – попарно независимые случайные величины, причем дисперсии их равномерно ограничены (не превышают постоянного числа C ), то, как бы мало ни было положительное число ,
вероятность неравенства
X1 X 2 ... X n |
|
M X1 M X 2 ... M X n |
|
|
|
||||
|
|
|
||
n |
n |
|
||
будет как угодно близка к единице, если число случайных величин достаточно велико.
Если X1, X 2 ,...X n – попарно независимые случайные величины, имеющие одно и то же математическое ожидание a , и если дисперсии этих величин равномерно ограничены, то, как бы мало ни было число , вероятность неравенства
X1 X 2 ... X n a n
будет как угодно близка к единице, если число случайных величин достаточно велико.
Итак, среднее арифметическое достаточно большого числа независимых случайных величин (дисперсии которых равномерно ограничены) утрачивает характер случайной величины.
Если проводится серия измерений какой-либо физической величины,
причем
1) результат каждого измерения не зависит от результатов остальных
(измерения попарно независимы);
82
2)измерения производятся без систематических ошибок, (имеют одно и то же математическое ожидание);
3)обеспечена определенная точность измерений, (дисперсии их ограничены)
то при достаточно большом числе измерений их среднее арифметическое окажется сколь угодно близким к истинному значению измеряемой величины.
Теорема Бернулли. Если в каждом из независимых опытов вероятность
появления события A постоянна, то при достаточно большом числе
испытаний вероятность того, что модуль отклонения относительной частоты
появлений A в n опытах от |
p будет сколь угодно малым, как угодно |
|||||||||||||
близка к 1: |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
m |
|
|
|
||
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
lim P |
|
|
|
p |
|
1. |
||
|
|
|
|
|
|
n |
||||||||
|
|
|
|
|
|
n |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Замечание. Из |
|
теоремы |
Бернулли не следует, что неравенство |
|||||||||
|
m |
p |
|
выполняется всегда, |
начиная с некоторого момента изменения |
|||||||||
|
|
|||||||||||||
|
|
|||||||||||||
|
n |
|
|
|
|
|
|
|
|
|
|
|
||
случайной величины |
m |
. Могут найтись такие значения n , при которых это |
||||||||||||
n |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
неравенство неверно. Этот вид сходимости называют сходимостью по вероятности. Другими словами, при достаточно больших n выполнение данного неравенства является практически достоверным событием.
Закон больших чисел не исследует вид предельного закона распределения суммы случайных величин. Этот вопрос рассмотрен в группе теорем, называемых центральной предельной теоремой. Они утверждают,
что закон распределения суммы случайных величин, каждая из которых может иметь различные распределения, приближается к нормальному при достаточно большом числе слагаемых. Этим объясняется важность нормального закона для практических приложений.
83
Центральная предельная теорема. Если X1, X 2 ,...X n – независимые случайные величины с одинаковым законом распределения, математическим
ожиданием a и дисперсией 2 , |
то при неограниченном увеличении n закон |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
распределения |
суммы |
|
|
|
Yn |
X k |
|
|
неограниченно приближается |
к |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k 1 |
|
|
|
|
|
|
|
|
|
|
|
|
нормальному. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Теорема |
Ляпунова. |
|
|
Если |
X1, X 2 ,...X n |
– |
независимые |
случайные |
|||||||||||||||||||
величины, у каждой из которых |
существует |
математическое ожидание |
|||||||||||||||||||||||||||
M X |
a , |
дисперсия |
|
D X |
i |
|
|
2 , |
|
абсолютный центральный |
момент |
||||||||||||||||||
|
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
||
третьего порядка M |
|
X |
i |
a |
|
|
3 m и |
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
mi |
|
|
0 , |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
lim |
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
n |
|
|
n |
|
|
2 |
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 |
i |
|
|
|
|
|
|
|
|
|
|
||||
то |
закон |
распределения |
|
суммы |
|
|
Yn X1 X 2 ... X n |
при |
n |
||||||||||||||||||||
неограниченно приближается к нормальному |
с математическим ожиданием |
||||||||||||||||||||||||||||
n |
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
a |
и дисперсией |
2 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
i |
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Смысл условия теоремы состоит в том, что удельный вес каждого |
|||||||||||||||||||||||||||
отдельного |
слагаемого |
в |
|
|
сумме |
|
|
Yn |
|
должен |
стремиться |
к |
нулю |
при |
|||||||||||||||
увеличении числа слагаемых. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
Частным случаем центральной предельной теоремы для дискретных |
|||||||||||||||||||||||||||
случайных величин является теорема МуавраЛапласа. |
|
|
|
|
|||||||||||||||||||||||||
|
|
Пусть |
X m – |
случайная величина, имеющая биномиальный закон |
|||||||||||||||||||||||||
распределения |
с математическим |
|
|
ожиданием |
M (X ) np |
и |
дисперсией |
||||||||||||||||||||||
D(X ) npq . |
|
Тогда на основании центральной предельной теоремы |
|||||||||||||||||||||||||||
случайная |
величина |
|
|
Z |
m np |
|
|
|
имеет |
распределение, |
|
близкое |
к |
||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
npq |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
84 |
нормальному закону с параметрами a 0, |
2 |
1, т. е. асимптотически |
нормальна. |
|
|
Встатистических исследованиях при применении центральной
предельной теоремы необходимо соблюдать осторожность. Если сумма
n |
|
X k |
при n всегда имеет нормальный закон распределения, то скорость |
k 1 |
|
сходимости к нему существенно зависит от типа распределения ее слагаемых.
4.13. Элементы теории случайных процессов
Случайной функцией называется функция X (t) , значение которой при любом значении аргумента t является случайной величиной. Конкретный вид,
принимаемый случайной функцией в результате опыта, называется реализацией
случайной функции. Параметр t часто интерпретируется как время, поэтому случайную функцию иначе называют случайным процессом.
Последовательность испытаний в некотором эксперименте называется
марковским процессом или марковской цепью, если исход любого k –го испытания зависит только от исхода (k 1) –го испытания и не зависит от
исходов предыдущих испытаний. Множество всех возможных состояний,
которые может принимать процесс, называется пространством состояний.
Марковская цепь характеризуется вероятностями того, что при последующих испытаниях рассматриваемая система переходит из одного состояния в другое.
Переходной матрицей марковской цепи называется n n матрица
P Pij , где Pij – вероятность того, что при отдельном испытании за один шаг система переходит из состояния wi в состояние w j .
Строка переходной матрицы P учитывает все возможные состояния системы и, следовательно, определяет вероятности полной группы событий.
Сумма вероятностей, записанных в строке, равна единице. Матрица такого вида называется стохастической.
85
Пусть P Pij – переходная матрица, где Pij – условная вероятность того,
что из состояния wi , в котором система оказалась в результате некоторого испытания, она перейдет при следующем испытании в состояние w j . Такая условная вероятность называется одношаговой вероятностью перехода из
состояния wi в состояние w j . Двухшаговая вероятность Pij(2) определяется как вероятность того, что система, находясь в состоянии wi , переходит в состояние w j в результате двух испытаний.
Такой переход система может пройти через некоторое промежуточное состояние wk, k 1,2,... . Вероятность такого перехода соответствует Pik Pkj , т.к.
последовательные испытания независимы. Двухшаговая вероятность перехода определяется по формуле полной вероятности:
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
P2 |
p |
i1 |
p |
p |
p |
2 j |
... p |
p |
nj |
p |
ik |
p |
kj |
. |
ij |
|
1 j |
i2 |
|
in |
|
k 1 |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Это выражение представляет собой ij –й элемент матрицы P2 , которая
называется двухшаговой переходной матрицей марковской цепи. Она равна P2 ,
где P – одношаговая переходная матрица этой марковской цепи. Аналогично
определяется m –шаговая переходная матрица Pm , которая определяется как
m – я степень одношаговой переходной матрицы P .
Начальным распределением вероятностей марковской цепи называется
n –мерный вектор-строка P(0) P(0) |
, P(0) |
,..., P(0) |
, где состояние w , i 1,2,...,n . |
||||
|
|
|
1 |
2 |
n |
|
i |
Вектор-строка |
P(m) |
P(m) , P(m) ,..., P(m) |
называется |
m –шаговым |
|||
|
|
1 |
2 |
|
n |
|
|
распределением вероятностей марковской цепи, |
если P(m) представляет собой |
||||||
|
|
|
|
|
|
i |
|
вероятность того, что при |
m –м испытании система оказывается в состоянии |
||||||
wi , i 1,2,...,n .
Теорема 1. Если P(0) – начальное распределение вероятностей марковской цепи с матрицей перехода P , то распределение вероятностей после одного
86
испытания P(1) P(0) P , а m –шаговое распределение вероятностей
P(m) P(0) Pm .
Марковская цепь называется регулярной, если все элементы некоторой степени Pm ее матрицы перехода P строго положительны.
Для регулярных марковских цепей справедлива теорема о предельных вероятностях.
Теорема 2. Пусть марковская цепь регулярна. Тогда: 1) матрица перехода
P имеет единственный неподвижный стохастический вектор t , все координаты
которого строго положительны; 2) существует предельная матрица T lim Pm ,
m
каждая строка которой совпадает с неподвижным стохастическим вектором t ;
3) если p – любой стохастический вектор, то
lim p Pm t .
m
4.14. Выборочные характеристики. Точечные и интервальные оценки параметров законов распределения
Для изучения генеральной совокупности – множества объектов произвольной природы, обладающих признаками, доступными для наблюдения и количественного измерения применяется выборочное наблюдение. Случайным образом из генеральной совокупности выбирают часть её объектов (выборку,
выборочную совокупность), подвергают их исследованию и делают заключение о всей генеральной совокупности.
Выборка – это последовательность x1 , x2 ,..., xn независимых одинаково распределенных случайных величин, распределение каждой из которых совпадает с распределением генеральной случайной величины.
Число объектов (наблюдений) в совокупности, генеральной или выборочной, называется её объемом.
Статистический материал, получающийся в результате наблюдений
(измерений) помещается в таблице (статистический ряд):
87
xi |
x1 |
x2 |
x3 |
… |
xk |
ni |
n1 |
n2 |
n3 |
… |
nk |
|
|
|
|
|
|
Здесь xi – выборочные значения случайной величины x , ni –
соответствующие частоты наблюдения xi .
Эмпирической функцией распределения или функцией распределения
выборки называется функция F x , определяющая для каждого |
x R |
||
относительную частоту события X x , т.е. |
|
||
F x |
nx |
, |
|
|
|
||
|
n |
|
|
где nx – число наблюдений, меньших x , n – объем выборки, n ni .
Функция F x обладает свойствами функции распределения.
Для выборки можно определить ряд числовых характеристик,
аналогичных тем, что в теории вероятностей определяются для случайных величин. Выборочные характеристики приближенно оценивают соответствующие числовые характеристики случайной величины, служат их точечными оценками.
Выборочным средним xв называется среднее арифметическое всех значений выборки
xв 1n xi ni .
Выборочной дисперсией Dв называется среднее арифметическое квадратов отклонений значений выборки от выборочной средней xв
Dв 1n xi xв 2 ni xв 2 xв 2 .
Исправленная выборочная дисперсия
S 2 |
n |
|
D . |
|
n 1 |
||||
|
в |
|||
|
|
|
||
Исправленное выборочное среднее квадратическое отклонение
S
S 2
88
измеряется в тех же единицах, что и изучаемая случайная величина (признак).
Чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным
требованиям: оценка должна быть состоятельной, несмещенной, эффективной.
Точечная оценка неизвестного параметра, найденная по выборке объёма n
(особенно, при малых объёмах выборки) не указывает, какую ошибку допускают,
принимая вместо точного значения параметра распределения его приближенное значение, и может значительно отличаться от оцениваемого параметра.
Поэтому вводят интервальную оценку, которая определяется двумя числами концами интервала, внутри которого с определенной вероятностью
находится значение оцениваемого параметра, причем границы интервала не должны зависеть от искомого параметра.
Доверительным интервалом или интервальной оценкой называется
интервал |
|
1 , |
|
2 |
,который покрывает неизвестный параметр |
с заданной |
|
|
|||||
доверительной |
вероятностью 0 1 (надежностью |
доверительного |
||||
интервала). Часто доверительный интервал может быть представлен в виде
~ |
~ |
|
, , где – точность оценки, – точечная оценка. Чем меньше длина |
доверительного интервала, тем точнее оценка.
Пусть наблюдается случайная величина, имеющая нормальное распределение. Для параметров нормального распределения строятся следующие
доверительные интервалы.
Для неизвестного математического ожидания M x a при известном
среднеквадратичном отключении x |
|
|
|
|
|
|
|||||
x |
|
t |
|
M x x |
|
t |
|
, |
|||
в |
|
в |
|
||||||||
|
|
n |
|
|
|
n |
|||||
|
|
|
|
|
|
|
|||||
где t – определяется из соотношения Ф t |
|
, |
Ф t – функция Лапласа. |
||||||||
2 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
||
Для неизвестного математического ожидания при неизвестном x
89
xв t |
s |
M x xв t |
s |
, |
|
n |
n |
||||
|
|
|
где t – критическая точка распределения Стьюдента (для двухсторонней области) с k степенями свободы и уровнем значимости 1 .
Для неизвестного среднего квадратического отклонения
s 1 q x s 1 q ,
где q определяется из таблицы значений q q , n .
4.15. Статистическая проверка гипотез
Статистической гипотезой H называется утверждение относительно параметров или вида распределения случайной величины X . Статистическая гипотеза H называется простой, если она однозначно определяет распределение случайной величины (СВ) X ; в противном случае гипотеза H называется сложной. Гипотеза, подлежащая проверке, называется нулевой или основной и обозначается H 0 . Если нулевая гипотеза отвергается, то принимается альтернативная, которая обозначается H1 . Правило, по которому принимается решение принять или отклонить гипотезу H 0 , называется статистическим критерием. Он устанавливает, при каких результатах случайной выборки проверяемая гипотеза принимается, а при каких – отвергается. Так как решение принимается на основе выборки наблюдений СВ X , то необходимо выбрать подходящую оценку, называемую статистикой Z критерия K . Перед анализом выборки фиксируется уровень значимости , который имеет смысл вероятности ошибочного отклонения нулевой гипотезы. Обычно при проверке гипотезы уровень значимости берут равным: 0,001; 0,01; 0,05. Критерий, основанный на использовании заранее заданного уровня значимости, называется критерием значимости.
Важнейшим среди законов распределения является нормальный закон распределения, который выступает предельным для ряда законов распределения.
Поэтому основные методы математической статистики разработаны для
90
нормального закона.
Схема статистической проверки гипотезы о нормальном
|
|
|
|
|
|
|
|
распределении СВ |
|
|
|
|
|
Пусть F(x) – |
функция распределения изучаемой СВ. Обозначим через |
||||||||||
H 0 |
гипотезу |
|
о |
нормальном |
распределении |
СВ с |
функцией |
|||||
|
|
1 |
x a |
|
|
|
|
|
||||
F0 (x) |
|
Ф |
|
|
|
, где a и – значения параметров распределения. |
||||||
|
|
|
|
|||||||||
|
|
2 |
|
|
|
|
|
|
|
|
||
|
Для проверки гипотезы проводят серию из |
n испытаний. |
В результате |
|||||||||
получают выборочную совокупность |
x1, x2 ,..., xn , |
по которой делают вывод о |
||||||||||
правильности |
гипотезы H 0 . Случайная величина |
может |
принимать |
|||||||||
бесчисленное множество значений, поэтому выборочная совокупность содержит неполную информацию о законе распределения генеральной совокупности, а это может привести к ошибкам при проверке гипотезы H 0 . Используется понятие уровня значимости , который показывает вероятность ошибочного отклонения правильной гипотезы H 0 .
Для статистической проверки гипотезы о законе распределения можно воспользоваться критерием согласия Пирсона 2 . Согласно этому критерию,
наблюдаемое эмпирическое распределение выборки, выраженное абсолютными,
относительными или относительно накопленными частотами сгруппированного ряда, сравнивается с гипотетическим теоретическим распределением
соответствующей генеральной совокупности.
Пусть статистическое распределение выборки задано в виде последовательности интервалов xi , xi 1 и соответствующих частот mi – сумма частот, которые попадают в i –ый интервал.
xi ; xi 1 |
x1; x2 |
x2 ; x3 |
x3; x4 |
… |
xk ; xk 1 |
mi |
m1 |
m2 |
m3 |
… |
mk |
По результатам выборки вычисляют выборочное среднее xв и выборочное
