Шамышева2 / ОСНОВЫ ТЕОРИИ СТОХАСТИЧЕСКИХ СИСТЕМ (Конспект лекций)
.pdfM(Y/x)=mY/x . (5)
σ |
X/y |
=σ |
2((1-ρ |
2) |
(7) |
|
|
X |
XY |
|
Величина (6) представляет теоретическое среднее квадратическое от-
клонение погрешностей оценки ожидаемого значения Y по х. Отсюда следу-
ет, что оценка Y по х с помощью линии регрессии одинакова при всех значе-
ниях х.
Функция плотности вероятности двумерного распределния может быть наглядно отображена в трехмерной плоскости.
Y- mY= ρXY(x-mX)
mY
mX
Рисунок 1. Сечение плотности двумерного нормального распределения.
Рассекая поверхность нормального распределения плоскостью, парал-
лельной поверхности х-у, в сечении получаем эллипс, за исключением выро-
61
жденного случая ρXY=±1. Сечения в разных плоскостях будут давать эллипсы различных размеров с одинаковой ориентацией их главных осей, составляю-
щих некоторый угол с осями координат. Главные оси не могут быть парал-
лельными линии регрессии.
Если значения X, Y не коррелированны, ρXY=0, то в сечении будем иметь эллипс с центром mX, my и с главными осями, параллельными осям ко-
ординат х и у.
Таким образом, с уменьшением силы корреляционной связи между ве-
личинами X и Y происходит все больший поворот главных осей эллипсов от-
носительно координатных осей.
5.3. Закон больших чисел
1. Неравенство Чебышева
Мы видели, что характеристика σХ=√DX представляет некоторую сред-
нюю меру, стандарт, отклонения от центра распределения. Следует ожидать,
что отклонения, значительно превышающие по абсолютной величине σХ,
должны быть маловероятны.
В случае нормального распределения эта вероятность равна:
Q(t) = P(|X-mX|>t σХ).
где t>0 изображается площадью под нормальной кривой вне интервала
(-t, +t). Для t=3 эта вероятность составляет 0,0027; при t=4 вероятность уменьшается до 0, 000063, при t=6 вероятность уменьшается до 2*10-9 и т.д.
Заслугой Чебышева является доказательство неравенства, показываю-
щего, что убывание вероятности Q(t) при возрастании t хотя и не всегда со-
вершается столь быстро, как в нормальном случае, но оно происходит всегда не медленнее, чем по закону 1/t2.
При любом законе распределения, обладающем моментом двух первых порядков (математическое ожидание и дисперсия) верхняя граница вероятно-
сти равна:
Q(t) = P(|X-mX|>t σХ)<=1/t2. |
(8) |
62
Простота и универсальность позволяет использовать неравенство Че-
бышева для важных теоретических заключений, хотя для практических рас-
четов оно оказывается слишком грубым [*].
5.4. Основные предельные законы теории вероятностей
Рассмотрим две фундаментальные теоремы теории вероятностей,
имеющие обширный круг приложений. Эти теоре5мы представляют обобще-
ние теорем Я. Бернулли и Лапласа, относящиеся к закону распределения час-
тот (или числа появлений) случайного события в данной серии независимых испытаний.
Число появлений событий в n независимых испытаниях можно рас-
сматривать как сумму n независимых величин. После каждого испытания наблюдатель записывает результат, ставя 1 или 0, в зависимости от того,
появилось или не появилось событие в этом испытании. С испытанием свя-
зана случайная двузначная величина Xs, s=1, 2, .. Все величины независимы между собой и одинаково распределены согласно таблице распределений:
|
0 |
1 |
X |
q=1-p |
p |
Мы можем представить величины Xs как разные экземпляры одной и той же величины Х (без номера). Сумма Sn = X1+X2+…Xn равна числу m по-
явлению событий в серии испытаний.
Частота событий m/n представляется средним арифметическим величины Xs:
Sn/n = (X1+X2+…Xn)/n. |
(9) |
Для этого представления частости можно рассчитать основные харак-
теристики ее распределения, которые совпадают с биноминальным распреде-
лением:
- математическое ожидание М(Sn/n)=p; |
|
- дисперсия D(Sn/n)=pq/n, |
(10) |
63
Дисперсия частости согласно (10) стремиться к нулю при неограничен-
ном возрастании n. Опираясь на неравенство Чебышева (8) получаем теорему
Якова Бернулли:
P{|Sn/n – p| ≥ ξ} = P{|(X1+X2+..+Xn)/n – M(X1+X2+..+Xn)/n| >ξ}→ 0 при n→ ∞
(11)
Теорема Бернулли (11) утверждает, что среднее арифметическое боль-
шого числа независимых величин (частного вида – двухзначных) почти на-
верное будет как угодно близко к своему математическому ожиданию – по-
стоянной величине р.
То обстоятельство, что дисперсия величины Sn/n стремиться к нулю при n→ ∞, имеет следствием устойчивость среднего арифметического. Рас-
пределение среднего (частости) концентрируется в сколь угодно малом ин-
тервале (р-ξ, р+ξ), а вероятность, приходящаяся на значения вне этого интер-
вала, как угодно мала при достаточно большом n.
В этом случае говорят, что последовательность средних арифметиче-
ских при при n→ ∞ «сходится по вероятности» к постоянной величине:
P = M(Sn/n). |
(12) |
Факт устойчивости средних арифметических большого числа одинако-
во распределенных независимых величин имеет место при произвольном распределении каждого слагаемого, если только при этом распределении ве-
личины обладают конечной дисперсией.
В этом случае: |
|
Xncp = (X1+X2+…+Xn)/n имеет место D(Xncp) = D(X)/n, |
(13) |
и поэтому D(Xncp)→0 при n→∞.
На основании неравенства Чебышева получим при сколь угодно малом
(но постоянном) ξ>0:
P(|Xncp – mX|>ξ)< D(Xn )/ξ2 → 0, |
(14) |
P(|Xncp – mX|≤ξ) ξ2 → 1, |
|
64
что доказывает сходимость последовательности Xncp по вероятности к пределу mX при n→∞.
Осредняя достаточно большое число независимых и одинаково рас-
пределенных случайных величин, мы получаем с вероятностью, как угодно близкой к единице, значение, сколь угодно мало отличающееся от общего математического ожидания величин. Это положение, называемое «законом больших чисел», было установлено П.Л. Чебышевым (1821 – 1894).
Этот закон выражает основную и общую закономерность, имеющую первостепенное значение, как для обоснования статистических методов, так и для теоретического объяснения большого круга явлений (в области моле-
кулярных процессов).
Контрольные вопросы
1. Понятия случайный вектор, случайные одномерные величины,
к-мерная случайная величина.
2.Функция распределения случайного вектора, его свойства.
3.Плотность и функция распределения непрерывной к-мерной случай-
ной величины, их свойства.
4.Вероятность попадания дискретной к-мерной случайной величины в любую точку счетного множества допустимых точек.
5.Функция распределения дискретной к-мерной случайной величины.
6.Плотность вероятностей двумерного нормального распределения за-
висимых и независимых случайных величин.
7. Условное нормальное распределение. Центр распределения и дис-
персия, линия нормальной регрессии.
8.Неравенство Чебышева.
9.Теорема Бернулли.
10.Закон больших чисел.
65
Лекция 6
ОЦЕНИВАНИЕ ПАРАМЕТРОВ. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
6.1. Описательная статистика
66
67
68
69
6.2. Оценивание параметров
70