302_p306_B10_2010
.pdf2. Если все значения вариант умножить на одно и то же число К, то в К раз увеличится их среднее арифметическое x , отклонения от среднего арифметического x - x и среднее квадратичное отклонение S (дисперсия) увеличится в К2 раз.
3. Запишем формулу (9) в виде
∑(xi − a)2 = S2 +(a − x )2 .
N −1
Средняя величина квадратов отклонений вариант от любой величины а, больше дисперсии D. на квадрат отклонения этой величины а от среднего арифметического вариант.
4. Если совокупность разбита на несколько частей, то общая дисперсия является суммой средней величины дисперсии внутри отдельных частей совокупности Di и среднего квадрата отклонения частных средних от общей средней S 2
.
Докажем это равенство. Пусть совокупность разбита на L частей численностью в n1,n2 ,...ni и ∑ni = n . Пусть частные дисперсии составляют
S12 , S22 ,...Si2 .
Si2 = Di = ni 1−1∑i x 2 − xi2 ,
где ∑i означает суммирование в пределах данной части совокупности, а x
.
Складывая эти суммы вместе по всем частям совокупности, получаем:
∑x2 = ∑(ni −1)Si2 + ∑(ni −1)xi2 .
Разделим все члены равенства на (n – 1)
1 |
2 |
|
∑ni Si2 |
∑ni xi2 |
|
∑x |
= |
n −1 + |
n −1 . |
n −1 |
Первое слагаемое здесь есть средняя из частных дисперсий Si2 , второе
- средний квадрат частных средних. Если вычтем из него квадрат таким же образом взвешенной их средней, то получим их средний квадрат отклонения
от этой средней, который обозначим S2 . Следовательно,
11
1 |
|
∑ |
|
+ |
|
+ ∑ni xi 2 |
|
|
x2 = |
S 2 |
|||||
|
S 2 |
||||||
|
|
||||||
n −1 |
|
i |
|
|
n −1 . |
Слагаемое в скобках есть общее среднее x по всей совокупности. Следовательно,
|
1 |
|
∑x2 − x 2 = |
|
|
|
|
|
|
|
|
S 2 = |
|
|
− x 2 = Si |
2 |
+ |
|
|
||||
|
x2 |
S2 |
|||||||||
n −1 |
|||||||||||
|
|
|
|
|
. |
Мода
Важным показателем характеристики распределения является мода. Мода - это наиболее часто встречающееся значение варианты. Мода - это значение варианты, которой соответствует наибольшая относительная частота.
Асимметрия и эксцесс
Гистограммы распределений изучаемых статистических совокупностей довольно часто бывают асимметричными (рис.3, 4), Если среднее арифметическое лежит правее моды, то асимметрия положительная, если левее моды - отрицательная. Для статистической оценки распределения необходимо вычислять меру асимметрии, называемую коэффициентом
∆N i |
∆Ni |
N |
N |
Рис.3 . Положительная асимметрия |
Рис.4. Отрицательная асимметрия |
асимметрии A = |
∑(xi − x )3 |
вычисления. В основу коэффициента |
|
N S3 |
|||
|
|
асимметрии положено среднеквадратичное отклонение, которое даёт возможность более полно учесть крайние значения вариант. При наличии асимметрии одна сторона кривой дает большее кубическое отклонение, чем другая, и так как знак при кубическом отклонении сохраняется, то разница
12
между суммами кубических отклонений показывает положительную либо отрицательную асимметрии.
|
dN |
|
|
|
Наряду |
с |
асимметрией |
|
при |
|||
|
|
в |
статистическом |
|
анализе |
рядов |
||||||
|
Ndx |
|
|
|||||||||
|
|
|
распределения, важное значение имеет |
|||||||||
|
|
|
|
a |
||||||||
|
|
|
|
мера |
эксцесса. |
Мера эксцесса |
- |
это |
||||
|
|
|
|
|
показатель |
|
отличия |
данного |
||||
|
|
|
|
б |
распределения |
от |
нормального |
по |
||||
|
|
|
|
концентрации вариант около центра |
||||||||
|
|
|
|
|
||||||||
|
|
|
|
x |
распределения. |
Вычисление |
этого |
|||||
|
|
|
|
|||||||||
|
|
|
|
показателя |
делается для |
того, |
чтобы |
|||||
Рис.5. Распределения с разными |
определить, |
|
насколько |
кривая, |
||||||||
полученная |
из |
опыта, |
оказывается |
|||||||||
показателями эксцесса |
более |
плоской |
и |
растянутой, |
|
или, |
||||||
|
|
|
|
|
|
наоборот, более сжатой и выпуклой в центре по сравнению с кривой нормального распределения. Показатель эксцесса выражается следующей формулой:
E = |
∑(xi − x )4 |
|
N S4 . |
||
|
Если Е ;> О , то эксцесс положительный и вершина кривой будет выше нормальной, и наоборот, если Е <, О , то эксцесс отрицательный, вершина кривой ниже нормальной (рис.5).
Статистические моменты
При вычислении среднего арифметического, дисперсии, коэффициента асимметрии и эксцесса можно пользоваться формулами:
|
|
ξ = 1 |
∑ |
ν x |
(12) |
|||
|
|
|
|
N |
i i |
, |
||
ξ2 |
= |
1 |
∑ |
ν |
(x − x)2 |
(13) |
||
|
|
N |
i |
|
i |
|
, |
|
ξ3 |
= |
1 |
∑ |
ν |
(x − x)3 |
(14) |
||
|
|
N |
i |
|
i |
|
, |
|
ξ4 |
= |
1 |
∑ |
ν |
(x − x)4 |
(15) |
||
|
|
N |
i |
|
i |
|
. |
13
Сопоставляя эти формулы, замечаем, что все они могут рассматриваться как частные случаи одной более общей формулы
|
|
Mh = |
1 |
∑νi (xi − x)h |
(16) |
||
|
|
|
|||||
|
|
|
N |
|
|
. |
|
При h = 1 |
и |
x = 0 получим x . |
|
|
|||
При h = 2 |
и |
x = х получим |
ξ2 |
= D . |
|
||
При h = 3 |
и |
x = х получим |
ξ3 |
и т. д. |
|
Величина (16) называется моментом h-го порядка распределения относительно значения x .
Если в качестве X выбрано начало отсчетов, т.е. положено x =0, то момент называется начальным и обозначается mh . Если же в качестве х выбран центр распределения x , то момент называется центральным и обозначается µh . В соответствии с этой терминологией среднее значение есть начальный момент первого порядка: x = µ1 , дисперсия, или средний
квадрат отклонения S2 , есть центральный момент второго |
порядка |
S 2 |
= µ2 |
средний куб отклонения есть центральный момент третьего порядка |
ξ3 |
= µ3 |
и т.д. Очевидно, центральный момент первого порядка всегда равен нулю:
µ1 = О. |
|
|
Центральные моменты могут быть выражены через начальные |
|
|
µ2 = m2 −m12 |
, |
(17) |
µ3 = m3 −3m2m1 + 2m12 |
, |
(18) |
µ4 = m4 −4m3m1 +6m2m12 −3m14 |
, |
(19) |
где |
|
|
1 |
|
∑ni xi |
|
m2 = |
1 |
∑ni xi2 , |
||
m1 |
= |
|
|
|
|||||||
|
|
|
N |
||||||||
N |
, |
||||||||||
m3 = |
1 |
∑ni xi3 , |
|
m4 = |
1 |
∑ni xi4 . |
|||||
N |
|
||||||||||
|
N |
В терминах статистических моментов коэффициент асимметрии запишется
14
|
A = |
µ3 |
= |
µ3 |
|
|
µ23/ 2 . |
||||
так: |
|
S3 |
|
ТЕОРЕТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ
Теоретическое распределение - это математическая модель распределения вероятности по значениям дискретной случайной величины или по интервалам непрерывной случайной величины.
Вероятность
В эмпирическом распределении относительное число попаданий в
заданный интервал дается частостью vi , в теоретическом распределении
подобная величина называется вероятностью. Вероятность есть мера объективной возможности данного события. Вероятность связана с частостью появления переменной величины:
p = lim v = lim |
ni |
|
(21) |
|
|
||||
N →∞ i |
N →∞ N . |
|
Вероятность выражает вполне определенную, хотя и своеобразную, связь между постоянным комплексом условий и случайный событием в поле испытаний, количественно характеризуя единство необходимого и случайного. Конкретный смысл вероятности заключается в том, что она определяет среднюю частость, с которой можно ожидать появления события в длинных сериях испытаний. Значение вероятности изменяется в пределах от нуля до единицы.
Теоретическое распределение дискретной и непрерывной случайной величины
Дискретное распределение считается теоретически заданным, если известны все возможные значения x1, x2 ,..., xN , принимаемые величиной, и
вероятности p(xi ) для |
каждого события в поле испытаний. Так |
как эти |
|
события должны образовывать полную группу, то полная вероятность |
|
||
|
P = ∑p(xi ) =1 |
(22) |
|
|
|
||
|
i |
. |
|
При дискретном |
распределении |
общая масса вероятности, |
равная |
единице, сосредоточена в счетной или конечной системе точек хi . Другими
15
словами, точечное распределение массы вероятности, подобно, например, точечному распределению электрических зарядов. К теоретическим распределениям дискретных величин относятся биномиальное, гипергеометрическое, распределение Пуассона. Каждое из этих распределений описывается аналитической функцией, выражающей зависимость вероятности от дискретной переменной величины и параметров распределения.
Функция биноминального распределения:
P (x) = |
n! |
pxqn−x |
(23) |
|
|
|
|||
n |
x!(n − x)! |
|
||
|
|
, |
||
|
|
|
|
где q = 1 – p, n, p - параметры распределения. Функция распределения Пуассона
P (x) = |
e−λλx |
(24) |
n |
x! |
, |
|
где λ - параметр распределения.
Для теоретического изучения распределения непрерывных величин вводится понятие плотности вероятности ρ(x)
ρ(x) = |
P(x < X < x + ∆x) |
|
|
|
|
||
|
∆x |
|
, |
где ∆x длина малого интервала, начинающегося в точке x |
|||
Для бесконечно малого интервала ∆x вероятность |
|||
p(x < X < x + ∆x) = ρ(x) ∆x |
, |
(25) |
|
|
|
|
|
для конечного интервала (x1 , x2 ) , где x1 < x2 , |
|||
|
x2 |
|
|
P(x1 < X < x2 ) = ∫ρ(x)dx |
|||
|
x1 |
|
. |
Интеграл от плотности вероятности распределения по любому |
|||
промежутку оси дает вероятность попадания величины X в этот промежуток |
∆x.
Плотностью распределения может служить любая интегрируемая
функция ρ(x) , удовлетворяющая двум условиям: |
|
1. ρ(x) ≥ 0 , |
(26) |
16
2. |
+∞∫ ρ(x)dx =1. |
|
(27) |
|
−∞ |
|
|
Вероятность |
|
|
|
|
P( X < x) = ∫x |
ρ(x)dx = P(x) |
(28) |
|
−∞ |
|
|
называется интегральной функцией распределения в отличие от плотности вероятности , которую называют дифференциальной функцией распределения.
Графическое представление дифференциальной функции распределения
ρ(x) |
На |
графике (рис.6) плотность вероятности |
|
ρ(x) является ординатой кривой распределения, а |
|||
|
|||
ρ(x) |
вероятность Р(х) равна площади под этой кривой oт −∞ |
||
до x . По определению Р(Х) обладает следующими |
|||
|
|||
P(x) |
свойствами: |
|
|
x |
I. P(x)- непрерывная возрастающая функция: её |
||
приращение в промежутке (x1 , x2 ) равно вероятности |
|||
Рис.6. Плотность |
для величины X попасть в этот промежуток. В самом |
||
деле, по правилу сложения вероятностей: |
|||
вероятности |
|||
|
|
||
|
P(X < x2 ) = P(X < x1 ) + P(x1 ≤ X < x2 ) , |
т.е. P(x2 ) = P(x1 ) + P(x1 ≤ X ≤ x2 ) ,
и следовательно
x2
P(x1 < X < x2 ) = P(x2 ) − p(x1 ) = ∫ρ(x)dx .
x1
2. xlim→−∞ P(x) = 0 , |
(29) |
lim P(x) =1. |
(30) |
x→+∞ |
|
17
3. Производная от интегральной функции распределенная P(x) равна плотности ρ(x) , т.е
′ |
dP(x) |
= ρ(x) |
(31) |
P (x) = |
dx |
||
|
|
. |
ПАРАМЕТРЫ ТЕОРЕТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ
Математическое ожидание
Среднее арифметическое, являющееся центром эмпирического
распределения, переходит в математическое ожидание Mx при N → ∞. В теоретическом распределении дискретных величин математическое ожидание
|
∞ |
|
Mx = Nlim→∞ |
∑xi p(xi ) |
(32) |
|
i=1 |
. |
Математическое ожидание непрерывно распределенной величины
Mx = +∞∫ xρ(x)dx |
(33) |
−∞ |
. |
При многократных экспериментальных определениях некоторой величины в одних и тех же условиях (при отсутствии систематических погрешностей) математическое ожидание можно рассматривать как "истинное" значение этой величины.
Дисперсия
В теоретическом распределении дисперсия σ 2 есть математическое ожидание квадрата отклонений случайной величины от её математического ожидания
σ 2 = M (x − Mx)2 |
. |
(34) |
|
|
Если обозначить Mx = a , то дисперсия распределения дискретной величины может быть записана:
σ 2 = ∑(xi − a)2 pi . |
(35) |
в случае непрерывной величины: |
|
18
σ 2 = +∞∫(x − a)2 ρ(x)∂x |
(36) |
−∞ |
. |
Нормальное распределение
Происхождение каждого эмпирического распределения обусловлено какими-то определенными естественными причинами. Совокупность причин, приводящих к тому или иному распределению, может быть в каждом случае иной.
Теоретическое распределение случайной величины, которому чаще всего соответствуют эмпирические распределения случайных величин в природе, является нормальным распределением или распределением Гаусса (закон Гаусса). Плотность вероятности нормального распределения определяется равенством:
|
|
|
|
(xi |
x) |
2 |
|
|
f (x)= ρ (x)= |
1 |
e |
− |
|
− ˆ |
|
|
|
|
|
, |
(37) |
|||||
|
|
2σ2 |
|
|
||||
|
|
|
|
|
2πσ
для любого значения
ρ(x)
− ∞ x +∞ , где xˆ - математическое ожидание, σ 2 - дисперсия, xˆ и σ 2 -параметры распределения.
Соответствующая этой плотности дифференциальная кривая распределения показана на рис.7.
Интегральная функция нормального распределения записывается в виде:
|
x |
|
F(x)= ∫x |
f (x)∂x |
|
(38) |
||
Рис.7. Дифференциальная кривая |
|
|
−∞ |
. |
|
|||
распределения |
|
|
|
|
|
|
||
График |
интегральной |
функции |
||||||
|
||||||||
|
распределения изображен на рис.8. |
|||||||
Полная площадь под всей кривой выразится интегралом |
|
|
||||||
|
F(− ∞;+∞)= |
1 |
+∞ |
(x−x )2 |
|
|
|
|
|
∫e− |
2σ 2 |
∂x |
|
(39) |
|||
|
|
2πσ |
−∞ |
|
. |
|
|
|
|
|
|
|
|
|
|
Значение интеграла (39) равно единице.
19
F(x) |
|
|
|
|
|
|
Свойства нормального |
|
||||||||
|
|
|
|
|
|
|
|
|
|
распределения |
|
|
||||
|
|
|
|
|
|
|
|
|
1. Из рис.9 видно, что |
|||||||
|
|
|
|
|
|
|
нормальное |
|
|
|
распределение |
|||||
|
|
|
|
|
|
|
симметрично |
относительно |
ординаты, |
|||||||
|
|
|
|
|
|
|
соответствующей |
|
|
значению |
ˆ |
|||||
|
|
|
|
|
|
|
|
|
x . |
|||||||
|
|
|
|
|
|
|
Значение |
|
ˆ |
является |
центром |
|||||
|
|
|
|
|
x |
|
|
x |
||||||||
|
|
x−σ x x+σ |
|
группирования |
- |
|
математическим |
|||||||||
Рис. 8. Интегральная функция |
|
ожиданием распределения. |
|
|
||||||||||||
|
Наибольшая ордината, отвечающая |
|
||||||||||||||
распределения |
|
|
|
|
значению |
x |
= ˆ |
|
|
|
|
|
||||
|
|
|
|
|
|
|
x , имеет величину: |
|
||||||||
|
|
|
|
|
ˆ |
= |
1 |
|
|
|
|
|
|
(40) |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
f (x) |
|
2πσ . |
|
|
|
|
|
||||
|
|
|
|
|
|
|
ˆ |
но различных |
σ |
получим семейство |
||||||
|
2. При одном и том же значении x , |
|
||||||||||||||
ρ(x) |
σ1 |
|
|
кривых (рис. 9). |
|
|
|
|
|
|
σ |
|||||
|
|
|
|
Из |
рис. |
9 |
видно, |
что |
когда |
|||||||
|
|
|
σ2>σ1 |
уменьшается, |
ордината |
|
растет. |
Подъем |
||||||||
|
|
|
|
|
кривой в центральной части компенсируется |
|||||||||||
|
|
|
|
σ3>σ2 |
более резким спадом её к |
оси x , так |
что |
|||||||||
|
|
|
|
общая |
площадь |
остается |
неизменной |
и |
||||||||
|
|
|
|
|
равной I. |
|
|
|
|
|
|
|
||||
|
|
|
|
x |
|
|
Нормальная |
кривая имеет |
две точки |
|||||||
|
|
xˆ |
|
|
|
|||||||||||
|
|
|
|
перегиба, абсциссами которых являются σ . |
Следовательно, чем больше σ , тем шире кривая.
3. Интеграл от плотности вероятности нормального распределения в пределах от σ до +σ равен 0,683; в пределах от −2σ до +2σ - 0,955; от −3σ
до +3σ - 0,997.
4.Коэффициент асимметрии Α нормального распределения равен нулю.
5.Эксцесс нормального распределения равен нулю.
Выборки
Статистическая совокупность, свойства которой необходимо изучать, называется генеральной совокупностью. Статистической экспериментальной
20