Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Шамышева2 / ОСНОВЫ ТЕОРИИ СТОХАСТИЧЕСКИХ СИСТЕМ (Конспект лекций)

.pdf
Скачиваний:
105
Добавлен:
22.03.2015
Размер:
5.33 Mб
Скачать
(6)
Уравнение (4) представляет вместе с тем уравнение линии нормальной регрессии Y по X, которая является прямой линией.
Аналогично регрессия Х по Y будет также линией, а условная диспер-
сия равна:
σY/xY√(1-ρ
XY2)
Точно также условное стандартное отклонение будет:

M(Y/x)=mY/x . (5)

σ

X/y

2((1-ρ

2)

(7)

 

 

X

XY

 

Величина (6) представляет теоретическое среднее квадратическое от-

клонение погрешностей оценки ожидаемого значения Y по х. Отсюда следу-

ет, что оценка Y по х с помощью линии регрессии одинакова при всех значе-

ниях х.

Функция плотности вероятности двумерного распределния может быть наглядно отображена в трехмерной плоскости.

Y- mY= ρXY(x-mX)

mY

mX

Рисунок 1. Сечение плотности двумерного нормального распределения.

Рассекая поверхность нормального распределения плоскостью, парал-

лельной поверхности х-у, в сечении получаем эллипс, за исключением выро-

61

жденного случая ρXY=±1. Сечения в разных плоскостях будут давать эллипсы различных размеров с одинаковой ориентацией их главных осей, составляю-

щих некоторый угол с осями координат. Главные оси не могут быть парал-

лельными линии регрессии.

Если значения X, Y не коррелированны, ρXY=0, то в сечении будем иметь эллипс с центром mX, my и с главными осями, параллельными осям ко-

ординат х и у.

Таким образом, с уменьшением силы корреляционной связи между ве-

личинами X и Y происходит все больший поворот главных осей эллипсов от-

носительно координатных осей.

5.3. Закон больших чисел

1. Неравенство Чебышева

Мы видели, что характеристика σХ=√DX представляет некоторую сред-

нюю меру, стандарт, отклонения от центра распределения. Следует ожидать,

что отклонения, значительно превышающие по абсолютной величине σХ,

должны быть маловероятны.

В случае нормального распределения эта вероятность равна:

Q(t) = P(|X-mX|>t σХ).

где t>0 изображается площадью под нормальной кривой вне интервала

(-t, +t). Для t=3 эта вероятность составляет 0,0027; при t=4 вероятность уменьшается до 0, 000063, при t=6 вероятность уменьшается до 2*10-9 и т.д.

Заслугой Чебышева является доказательство неравенства, показываю-

щего, что убывание вероятности Q(t) при возрастании t хотя и не всегда со-

вершается столь быстро, как в нормальном случае, но оно происходит всегда не медленнее, чем по закону 1/t2.

При любом законе распределения, обладающем моментом двух первых порядков (математическое ожидание и дисперсия) верхняя граница вероятно-

сти равна:

Q(t) = P(|X-mX|>t σХ)<=1/t2.

(8)

62

Простота и универсальность позволяет использовать неравенство Че-

бышева для важных теоретических заключений, хотя для практических рас-

четов оно оказывается слишком грубым [*].

5.4. Основные предельные законы теории вероятностей

Рассмотрим две фундаментальные теоремы теории вероятностей,

имеющие обширный круг приложений. Эти теоре5мы представляют обобще-

ние теорем Я. Бернулли и Лапласа, относящиеся к закону распределения час-

тот (или числа появлений) случайного события в данной серии независимых испытаний.

Число появлений событий в n независимых испытаниях можно рас-

сматривать как сумму n независимых величин. После каждого испытания наблюдатель записывает результат, ставя 1 или 0, в зависимости от того,

появилось или не появилось событие в этом испытании. С испытанием свя-

зана случайная двузначная величина Xs, s=1, 2, .. Все величины независимы между собой и одинаково распределены согласно таблице распределений:

 

0

1

X

q=1-p

p

Мы можем представить величины Xs как разные экземпляры одной и той же величины Х (без номера). Сумма Sn = X1+X2+…Xn равна числу m по-

явлению событий в серии испытаний.

Частота событий m/n представляется средним арифметическим величины Xs:

Sn/n = (X1+X2+…Xn)/n.

(9)

Для этого представления частости можно рассчитать основные харак-

теристики ее распределения, которые совпадают с биноминальным распреде-

лением:

- математическое ожидание М(Sn/n)=p;

 

- дисперсия D(Sn/n)=pq/n,

(10)

63

Дисперсия частости согласно (10) стремиться к нулю при неограничен-

ном возрастании n. Опираясь на неравенство Чебышева (8) получаем теорему

Якова Бернулли:

P{|Sn/n – p| ≥ ξ} = P{|(X1+X2+..+Xn)/n – M(X1+X2+..+Xn)/n| >ξ}0 при n

(11)

Теорема Бернулли (11) утверждает, что среднее арифметическое боль-

шого числа независимых величин (частного вида – двухзначных) почти на-

верное будет как угодно близко к своему математическому ожиданию – по-

стоянной величине р.

То обстоятельство, что дисперсия величины Sn/n стремиться к нулю при n∞, имеет следствием устойчивость среднего арифметического. Рас-

пределение среднего (частости) концентрируется в сколь угодно малом ин-

тервале (р-ξ, р+ξ), а вероятность, приходящаяся на значения вне этого интер-

вала, как угодно мала при достаточно большом n.

В этом случае говорят, что последовательность средних арифметиче-

ских при при n∞ «сходится по вероятности» к постоянной величине:

P = M(Sn/n).

(12)

Факт устойчивости средних арифметических большого числа одинако-

во распределенных независимых величин имеет место при произвольном распределении каждого слагаемого, если только при этом распределении ве-

личины обладают конечной дисперсией.

В этом случае:

 

Xncp = (X1+X2+…+Xn)/n имеет место D(Xncp) = D(X)/n,

(13)

и поэтому D(Xncp)0 при n∞.

На основании неравенства Чебышева получим при сколь угодно малом

(но постоянном) ξ>0:

P(|Xncp – mX|>ξ)< D(Xn )/ξ2 0,

(14)

P(|Xncp – mX|≤ξ) ξ2 1,

 

64

что доказывает сходимость последовательности Xncp по вероятности к пределу mX при n∞.

Осредняя достаточно большое число независимых и одинаково рас-

пределенных случайных величин, мы получаем с вероятностью, как угодно близкой к единице, значение, сколь угодно мало отличающееся от общего математического ожидания величин. Это положение, называемое «законом больших чисел», было установлено П.Л. Чебышевым (1821 – 1894).

Этот закон выражает основную и общую закономерность, имеющую первостепенное значение, как для обоснования статистических методов, так и для теоретического объяснения большого круга явлений (в области моле-

кулярных процессов).

Контрольные вопросы

1. Понятия случайный вектор, случайные одномерные величины,

к-мерная случайная величина.

2.Функция распределения случайного вектора, его свойства.

3.Плотность и функция распределения непрерывной к-мерной случай-

ной величины, их свойства.

4.Вероятность попадания дискретной к-мерной случайной величины в любую точку счетного множества допустимых точек.

5.Функция распределения дискретной к-мерной случайной величины.

6.Плотность вероятностей двумерного нормального распределения за-

висимых и независимых случайных величин.

7. Условное нормальное распределение. Центр распределения и дис-

персия, линия нормальной регрессии.

8.Неравенство Чебышева.

9.Теорема Бернулли.

10.Закон больших чисел.

65

Лекция 6

ОЦЕНИВАНИЕ ПАРАМЕТРОВ. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

6.1. Описательная статистика

66

67

68

69

6.2. Оценивание параметров

70

Соседние файлы в папке Шамышева2