Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПЭ_лекции_2012.doc
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
1.79 Mб
Скачать

2.2.4 Вероятность попадания в заданный интервал нормальной случайной величины. Правило трёх сигм

Вероятность попадания случайной величины в заданный интервал [,  можно вычислить по формуле: . Если случайная величина имеет нормальный закон распределения, то

Путём замены переменной t=(х-а)/ и вычисления интеграла эта формула сводится к виду .

Ф(t)= – функция Лапласа. Её значения приводятся во всех учебниках по математической статистике. В Exel имеется команда НормРаспред.

Пример: случайная величина Х распределена по нормальному закону. Математическое ожидание равно 30, среднее квадратичное отклонение – 10. Найти вероятность того, что Х примет значение в интервале от 10 до 50. По приведённой выше формуле получим .

По таблице значений функции Ф(х) находим, что Ф(2)=0,4772, следовательно Р(10≤Х≤50)=2·0,4772=0,9544.

Часто требуется вычислить вероятность того, что отклонение нармально распределённой случайной величины Х по абсолютной величине меньше некоторого заданного положительного числа , т.е. вычислить вероятность осуществления неравенства |X-a|<. На основе рассмотренной выше формулы может быть получено выражение: P(|X-a|<)=2Ф(/).

Пример: случайная величина Х распределена по нормальному закону. Математическое ожидание равно 20, среднее квадратичное отклонение – 10. Найти вероятность того, что отклонение по абсолютной величине будет не больше 3. По приведённой формуле будем иметь: P(|X-20|<3)=2Ф(3/10), Ф(0,3)=0,1179. Следовательно, P(|X-20|<3)=2·0,1179=0,2358.

Выполним в последней расчётной формуле замену =t. Она примет вид P(|X-a|<t)=2Ф(t).

Зададим t=3, тогда P(|X-a|<3)=2Ф(3)=2·0,49865=0,9973. Это соотношение означает, что событие, состоящее в осуществлении неравенства |X-a|<3, имеет вероятность близкую к 1, значит оно почти достоверно.

Формула P(|X-a|<3)=2Ф(3)=2·0,49865=0,9973 выражает так называемое правило трёх сигм.

Правило трёх сигм: если случайная величина распределена по нормальному закону, то модуль её отклонения от математического ожидания не превосходит утроенного среднеквадратичного отклонения.

2.2.5 Выборочный метод

Фундаментальные понятия статистической теории – генеральная и выборочная совокупности.

Генеральная совокупность – это множество всех однородных объектов, подлежащих изучению.

Выборочной совокупностью, или выборкой, называется некоторое множество объектов случайно отобранных из генеральной совокупности.

Объёмом совокупности называется число её объектов.

Например, если из 10000 изготовленных деталей для обследования отобрано 100, то объём генеральной совокупности N=10000, а выборки – n=100.

Выборка должна быть репрезентативной (представительной), т.е. такой, по которой можно уверенно судить об интересующем признаке всей генеральной совокупности. Выборка будет репрезентативной, если её осуществить случайным образом.

Пусть для изучения некоторого признака проводятся независимые испытания (наблюдения) в одинаковых условиях, в результате которых получены определённые числовые значения х1, х2, …, хп (п – объём выборки). Если эти значения разместить в порядке возрастания, то полученная возрастающая последовательность наблюдаемых значений будет называться дискретным вариационным рядом, а сами отдельные значения – вариантами.

Если имеются равные варианты, то дискретный ряд будет состоять из х1, х2, …, хk вариант, каждая из которых будет характеризоваться своей частотой появления п1, п2, …, пk, причём в сумма всех частот появления вариант будет равна объёму выборки:

п1+ п2+ …+пk=п.

Относительная частота варианты – отношение её частоты к объёму выборки: i=ni/n.

Сумма относительных частот всех вариант равна единице: .

Статистическое распределение выборки представляет собой соответствие между вариантами и их относительными частотами, которое для наглядности может быть построено на графике.

Если изучаемый признак является непрерывной величиной, то вариационный ряд будет интервальным. Например, имеются результаты измерений непрерывной случайной величины Х, для которой а – наименьшее значение, а b – наибольшее. В процессе обработки результатов отрезок разбивается на k элементарных отрезков, подсчитываются ni – число значений величины Х на каждом из этих интервалов (хi-xi-1).

Разности между двумя значениями случайной величины, образующих элементарный отрезок (хi-xi-1), называются интервальными промежутками.

Формируется интервальный вариационный ряд, подсчитываются относительные частоты случайной величины на каждом интервале ni/(хi-xi-1).

Разность между наибольшим (b) и наименьшим значениями случайной величины (а) называется размахом вариации.

Вариационный ряд является наиболее простым при равенстве интервальных промежутков.

Для наглядности может строиться гистограмма частот (см. рис.3). Это – ступенчатая фигура, состоящая из прямоугольников с основаниями равными интервальным промежуткам и высотами равными плотностям относительных частот на каждом промежутке (отношение относительной частоты случайной величины на каждом интервале к интервальному промежутку – i/(хi-xi-1)).

Площадь такой гистограммы равна сумме относительных частот случайной величины, т.е. единице.

Для выборной совокупности по формуле Fn(х)=nx/n рассчитывается эмпирическая функция распределения или функция распределения выборки. Здесь n – объём выборки, а nxчисло вариант, для которых Х<x.

Функция распределения выборки Fn(х) отличается от теоретической функции распределения (функции распределения генеральной совокупности) F(х) тем, что первая определяет относительную частоту события, для которых Х<х, а вторая – вероятность того же события.

Например: требуется найти функцию распределения следующей выборки

варианты хi

6

8

12

15

частоты ni

2

3

10

5

Объём выборки: п=2+3+10+5=20.

Наименьшая варианта х1=6, поэтому для Х<6 функция распределения выборки Fn(х)=0/20=0.Для Х8, Fn(х)=2/20=0,1; Х12 – Fn(х)=5/20=0,25; Х15 – Fn(х)=15/20=0,75. Наибольшая варианта х4=15, поэтому для Х>15 функция распределения выборки Fn(х)=20/20=1. График эмпирической функции распределения для этой выборки будет иметь следующий вид.

Рис.7 График функции распределения выборки дискретной случайной величины

По выборке можно судить о значении какого-либо параметра генеральной совокупности. Оценка исследуемого параметра будет качественной при условии, что она удовлетворяет требованиям несмещённости, состоятельности и эффективности.

Например, требуется оценить некоторый параметр генеральной совокупности по выборке х1, х2, …, хп. Оценка этого параметра будет зависеть от значений х1, х2, …, хп и обозначаться: . Величина является случайной величиной, поэтому она характеризуется распределением и числовыми характеристиками распределения.

Оценка параметра считается несмещённой, если её математическое ожидание, определённое по выборочной совокупности, равно истинному значению этого параметра: М( )= и – смещённой при М( ).

Оценка параметра является состоятельной, если по мере увеличения объёма выборки оценка будет приближаться к оцениваемому параметру с вероятностью, стремящейся к единице. Это означает, что при любом 0 . Это равенство выполняется при условии, что .

Оценка параметра является эффективной, если при заданном п она имеет наименьшую дисперсию D( )=Dmin, т.е. средний квадрат ошибки данной оценки не превышает среднего квадрата ошибки при любой другой оценке: .