Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Твимс.doc
Скачиваний:
135
Добавлен:
03.10.2013
Размер:
565.76 Кб
Скачать

6.3. Теорема Бернулли.

Теорема Бернулли является первой и наиболее простой формой больших чисел. Она теоретически обосновывает свойства устойчивости относительной частоты.

Теорема Бернулли (1713г.)

Если вероятность появления события А в 1-ом испытании равна p, то число наступления этого события в n независимых испытаниях равно nA (число успешных), то для любого С>0 имеет место неравенство:

lim p (│nA/n - p│< ε) = 1 (6.10)

n→∞

Т.е. относительная частота события А сходится по вероятности

P

P*(A)→ P(A)

n → ∞

Док-во.

Введем систему СВ (x1;x2;….,xn), так что xi = 1, если в i-ом испытании событие А появилось и, если не появилось, то xi = 0. n

Тогда nA = ∑ xi

i = 1

MXi и DXi будут равны MXi = p, DXi = pq (q = 1-p)

Закон распределения случайных величин:

xi

0

1

pi

1-p

p

Таким образом. СВ Xi независимы и их DXi = pq = p(1-p) = ¼ - (p – ½)2 ≤ ¼ (ограничена ¼ ) Поэтому к НСВ может быть применена теорема Чебышева в форме (6.7.)

n n

lim p (│1/n ∑xi - 1/n ∑ MXi │< ε) = 1

x→∞ n=1

n

1/n ∑xi = nA/n

n=1

1/n ∑ MXi = 1/n np = p

След. lim p (│nA/n - p│< ε) = 1 , то есть (6.10)

n→∞

Теорема Бернулли обосновывает приближенные вычисления вероятности событий с помощью относительных частот.

Пример.

За вер-ть рождения девочки можно принять относительную частоту появления (по стат. данным 6,485)

Нер-во Чебышева (6.2.) для СВ вида nA = 1/n ∑xi принимает вид:

P( │nA/n - p│< ε ) ≥ 1 – pq/ nε2 (6.11)

Обобщение теоремы Бернулли на случай, когда pi появления события А в каждый из n испытаний различны, является теорема Пуассона, т.е. относительные частоты А сходятся по вероятности:

p n

P*(A) → 1/npi (6.12) pi - вер-ть появления события А в i-ом испытании.

n→∞ i=1

и величине суммы вероятностей.

Пример:

Вер-ть наличия опечатки на 2-х страницах рукописи = 0,2. Оценить вероятность того, что рукописи содержат 400 стр., частость появления опечатки отличается от соответствующей вер-ти меньше чем на 0,05 (по модулю)

Формула (6.11)

n = 400 P (│nA / 400 – 0,2│< 0,05) ≥ 1 – 0,2* 0,8/ 400* 0,05 =

= P (│nA / 400 – 0,2│< 0,05) ≥ 0,84

ε =0,05

p = 0,2

q = 0,8

6.4. Центральная предельная теорема (цпт).

ЦПТ представляет собой 2-ую группу предельных теорем, устанавливающих связь между законом распределения суммы случайных величин и его предельной формой (нормальн. закон распределения).

Сформулируем ЦПТ для случая, когда члены суммы имеют одинаковое распределение.

Теорема.

Пусть СВ (x1;x2;….,xn) независимы, одинаково распределены и имеют конечное MXi = a и DXi = σ2 ( i = 1,2,3,…n), тогда функция распределения центрированная и нормированная суммой этих величин стремится при n → ∞ к функции распределения стандартной, нормальной СВ.

Zn = (∑xi - M(∑xi ))/ √D (∑xi ) (6.13)

Fz (x) = P (Zn < x ) → Ф(x)

n→ ∞

Ф(х) – функция Лапласа

x

Ф(x) = 1/ √2π ∫ e t/2 dt

-∞

Из соотношения (6.13) следует, что при достаточно больших и сумма Zn приближенно распределена по стандартному нормальному закону распределения с параметром 0,1

Zn ≈ N (0;1)

В этом случае говорят, что при n → ∞, xi - ассиметрична, но нормальна.

*Замечания:

1) СВ называется центрированной и нормальной если MX = 0, DX = 1.

2) Если Xi независимы и MXi = a, DXi = σ2 , то соответствующ. M(∑xi ) = na,

D (∑xi ) = nσ2 x

3) Ф(x) = 1/ √2π ∫ e t/2 dt = ½ + Ф0(x) – нормированная функция Лапласа

x -∞

Ф0(x) = 1/ √2π ∫ e t/2 dt

-∞

Математическая статистика.

§7 Выборки и их характеристики.

7.1 Предмет математической статистики.

Мат. статистика – раздел математики, в котором изучают метод набора, систематику и обработки результатов наблюдений. Обе дисциплины изучают массовые явления и связующим звеном между ними является предельная теория теории вероятностей. При этом тер. вер. выводит из мат. модели св-ва реального процесса, а мат. стат. устанавливает св-ва мат. модели, исходя из данных наблюдений.

Предмет мат. стат. изучает СВ по данным наблюдений.

Задачи:

  1. Полученные в результате наблюдений данные. Сначала надо упорядочить, представить в удобном для обозрения и анализа виде.

  2. Оценить хотя бы приблизительно интересующие нас характеристики.

Пример.

Дать оценку неизвестн. вер-ти событий, оценить неизвестн. функции распределения, MX,DX, и т.д.

  1. Проверка стат. гипотез, т.е. решения вопроса о том, насколько согласованы 1 и 2.

  2. Одной из важнейших значений является разработка методов, позволяющая по результатам выборки делать обоснованные выводы о распределении признака по всей генеральной совокупности.

Результаты исследования стандартных методами МС используют для принятия решения в задачах планирования, управления, прогнозирования и организации производства при контроле нач. продукции и т.д.

7.2. Генеральная и выборочная совокупности.

Пусть требуется изучить данную совокупность объектов относительно данных признаков.

Пример:

Рассматр. работу авиадиспетчера, можно исследовать его загруженность и скорость обслуживания.

Каждый признак и их комбинации равны СВ, над которым производится наблюдения.

Совокупность всех, подлежащих изучению и возможных результатов, наблюдений объектов, производимых в неизменных условиях называется Генеральной совокупностью (ГС).

ГС – это СВ, заданных на пространстве элементарных событий с выделением в нем S подмножеств событий, для которых указаны вероятности.

часто проводят сплошное обследование, когда изучаются все объекты, что экономически нецелесообразно, а иногда и невозможно.

В этих случаях наилучшим способом является выборочное наблюдение, когда из ГС выбирают ее часть и подвергают изучению.

Выборка - это последовательность (x1;x2;….,xn) независимых, одинаково распределенных, случайных величин, распределение каждой из которых совпадает с распределением ГС СВ.

Число объектов – объем выборки.

Конкретные значения выборки, полученные в результате наблюдения – реализации выборки (x1;x2;….,xn).

Метод стат. исследования, состоящий в том, что на основе изучаемой выборки делается вывод о ГС называется выборочным.

Для получения хороших оценок ГС выборка должна быть представительной или репрезентативной.

Условием репрезентативности (согласно закону больших чисел) является соблюдение случайного отбора, т.е. все объекты статистики должны иметь равные вер-ти и попасть в выборку.

Выборки

повторные бесповторные

√ в << √Ге , но различия между ПВ и БВ мало и им можно пренебречь.

В зависимости от конкретных условий обеспеч. репрезентатив. применяют различные способы отбора:

1) Простой (из ГС извлекают по 1-му объекту)

2) Типический (ГС делят на типические части и отбор осуществ. из каждой части)

3) Механический (отбор через определенный интервал)

4) Серийный (объекты выбирают сериями)

Пример.

Каждый из абитуриентов может набрать от 0 до 5 баллов Xk – количество баллов, набранное каждым абитуриентом.

0,…,5 – возможн. количество баллов, набранное одним абитуриентом и они образуют ген. совокупность.

x1,x2,….x10 – результат тестирования 10 абитуриентов.

реализациями этой выборки может служить набор чисел {5,4,0,11,2,2,3,2,1}

Пусть изуч. некоторые СВ Х, т.е. над ней проводится ряд наблюдений. В кажд. из этих опытов СВ Х приняла значения: n1-x1, n2-x2, …. nk-xk, причем сумма – это объем выборки, а знач. x1,x2…xk варианты СВ.

Операцией расположения значений СВ в порядке неубывания называется ранжированием.

Полученное таким образом последовательность СВ называется вариационным рядом. Числа Xi показывающие сколько раз встречаются варианты Xi называются частотами.

Отношение их к объему выборки называется частостями (относительными частотами).

pi* = ni/n (7.1)

где n = ∑ ni – объем

Перечень вариантов и соответствующих им частостей называется стат. распределением выборки или стат. рядом. Записывается в виде таблицы.

Пример.

В результате тестирования группа абитуриентов набрала такие баллы: 5,3,0,1,4,2,5,4,1,5.

Записать полученную выборку

а) в виде вариационного ряда

б) стат. ряда

Решение:

а) Проранжируем стат. данные и получим вариационный ряд 0,1,1,2,3,4,4,5,5,5

б) Подсчитаем частоту и частость ряда

Xi

0

1

2

3

4

5

ni

1

2

1

1

2

3

pi*

1/10

2/10

1/10

1/10

2/10

3/10

Сумма частостей равна 1.

Стат. распределение выборки является оценкой неизвестного распределения. В соответствии с теоремой Бернулли при n → ∞, относительные частоты сходятся по вероятности к соответствующим вероятностям.

p

pi* → pi

n → ∞

Поэтому при больш. знач. n стат. распределение мало отличается от истинного. В случае, когда число значений признака велико или признак является непрерывным (т.е. СВ Х принимают значения в некотором интервале), то составляется интервальный стат. ряд. В 1-ю строку записывают интервалы стат. распределения, которые берут одинаковые по длине.

[x1;x2);[x2;x3); …[xk;xk+1)

h = x2 - x1 = x3 - x2

За начало 1-го интервала обычно берт величину = Xmin – h/2

Пример.

измерим рост студентов на удачу взятых

178

160

154

183

155

153

167

186

163

155

157

175

170

166

159

173

182

167

171

169

179

165

156

179

158

171

175

173

164

172

Построим ряд 153,….186

СВ х – рост студента, непрерывн. СВ.

Xmin = 153 Xmax =186

n = 30

h = 186 – 153/ 1- log230 = 5,59

h = 6, тогда Xнач = 153 – 6/2 = 150

Рост

[150;156)

[156;162)

[162;168)

[168;174)

[174;180)

[180;186)

частота

4

5

6

7

5

3

Частость

Одним из способов обработки вариационного ряда является построение эмпирической функции.

Опред.

Эмпирической функцией распределения называется функция, определяющая частость события, что СВ Х имеет значение < чем х.

F*n (x) = p* (X<x) (7.2)

для нахождения эмпирической функции удобно записать ее в виде

F*n (x) ≈ nx/n, где n – объем выборки

nxчисло наблюдений < x

Эмпирическая функция распределения удовлетворяет тем же свойствам, что и истинная функция распределения. При увеличения числа наблюдений n, относительная частота события приближается к вероятности этого события, а эмпирическая функция распределения является оценкой теоретической ф-ции распределения СВ. И имеет место следующая теорема:

Теорема.

Пусть F*(x) – теоретическая функция распределения, F*n (x) – эмпирическая функция распределения. Тогда для любого ε выполняется след.:

lim (│F*n (x) - F*(x)│> ε ) = 0

Соседние файлы в предмете Теория вероятностей и математическая статистика