Теория вероятностей и элементы математической статистики
.pdf
Свойства нормальной случайной величины: |
|
|
|
|
|
|
|
|
|||||||||
1) |
p(x) 0, x ( , ) , график функции расположен выше оси Ох. |
||||||||||||||||
2) |
Ось Ох служит асимптотой графика функции p(x) , т.к. Lim p(x) 0 . |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|||
3) |
Функция p(x) имеет один максимум при x a , равный p(a) |
|
|
|
. |
||||||||||||
|
|
|
|||||||||||||||
2 |
|||||||||||||||||
4) График функции p(x) симметричен относительно прямой x a . |
|||||||||||||||||
5) |
Точки M (a , |
|
1 |
|
e 1/2 ), M |
|
(a , |
|
1 |
|
e 1/2 ) являются точками пере- |
||||||
|
|
|
|
2 |
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
||||||||||
|
1 |
|
|
2 |
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
гиба графика функции p(x) . |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Вероятность попадания случайной величины |
X ~ N(a, ) на заданный уча- |
||||||||||||||||
сток (a, b):
b
P(a X b) p(x)dx .
a
Случайная величина X ~ N(a, ) принимает свое значения в промежутке (a 3 ,a 3 ) с вероятностью 0,9973.
Вероятность отклонения нормально распределенной случайной величины от ее математического ожидания по абсолютной величине определяется по формуле:
|
|
|
|
|
|
|
|||
|
|
|
|
|
|||||
P( |
X a |
|
) 2 |
|
. |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
m |
|
||
|
|
|
|||||||
Вероятность отклонения относительной частоты |
от вероятности |
||||||||
n |
|||||||||
|
|
|
|
|
|
|
|
||
наступления события р в серии из n независимых испытаний выражается формулой:
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
||
P( |
p |
|
|
|
|
||
|
|
||||||
|
) 2 |
|
|
. |
|||
|
|
|
|
|
|
||
|
|
|
|||||
|
|
|
|
pq |
|||
Примеры
1. Суточное потребление электроэнергии исправной печью является случайной величиной, распределенной по нормальному закону со средним 1000 кВт и среднеквадратичным отклонением 50. Если суточное потребление превысит 1100 кВт, то по инструкции печь отключают и ремонтируют. Найти вероятность ремонта печи.
Решение. Случайная величина X есть суточное потребление электроэнергии печью. M(X) = 1000, X 50. Найдем вероятность попадания случайной величины X в интервал (0; 1100). Для этого воспользуемся формулой:
51
|
a |
|
a |
||
P( X ) Ф |
|
|
Ф |
|
. |
|
|
|
|
||
P |
|
0 X 1100 |
|
|
1100 0 |
|
|
0 1000 |
|
2Ф 2 2 0,4772 0,9544 . |
|
|
|||||||||
|
|
Ф |
|
|
Ф |
|
|
|||
|
|
|
|
|
50 |
|
|
50 |
|
|
Тогда вероятность ремонта печи равна 1-0,9544 = 0,0456.
2. Рост мальчиков возрастной группы 15 лет есть нормально распределённая случайная величина X с параметрами α = 161 см и σ = 4 см.
Какую долю костюмов для мальчиков, имеющих рост от 152 до 158 см, нужно предусмотреть в объёме производства для данной возрастной группы.
Решение.
M(X) = 161, X 4. Найдем вероятность попадания случайной величины X в интервал (152; 158). Для этого воспользуемся формулой:
|
|
a |
|
a |
|
|
|
P( X ) Ф |
|
|
Ф |
. |
|
|
|
|
|
|
|
|
|
|
|
|
158 161 |
|
152 161 |
|
0,214. |
||
P 152 X 158 Ф |
|
|
Ф |
|
|
||
|
4 |
|
|
|
4 |
|
|
3. Текущая оценка ценной бумаги представляет собой нормально распределенную случайную величину со средним значением 100 у. е. и дисперсией 9. Найти вероятность того, что цена актива (ценной бумаги) будет находиться в пределах от
91 до 109 у. е.
Решение. Так как a 100, 
D 3 , тогда
|
9 |
|
|
|
|
P(91 X 109) P | X 100| 9 2 |
|
|
|
2 (3) |
0,9973. |
|
|
||||
|
3 |
|
|
|
|
Задачи для самостоятельного решения
|
1.Пусть случайная величина Х подчиняется нормальному закону распределе- |
||||||||||
ния |
вероятностей |
|
с |
параметрами |
a 0, 2. |
Определить |
|||||
1) P( 2 X 3), 2) P( |
|
X |
|
0,1). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
2.Известно, что |
|
случайная величина Х ~ N 3,2 . Найти P( 3 X 5). |
||||||||
|
3.Нормальное распределение случайной величины Х задана плотностью рас- |
||||||||||
пределения вероятностей |
|
p x |
1 |
|
e x2 . Найти вероятность попадания в интер- |
||||||
|
|
|
|
||||||||
|
|
2 |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
вал (1,3).
4. Ошибка взвешивания – случайная величина, распределенная по нормальному закону с математическим ожиданием, равным 0, и среднеквадратическим отклонением, равным 2 грамма. Найти вероятность того, что взвешивание проведено с ошибкой, не превышающей по модулю 4 грамма.
52
5. Уровень воды в реке – случайная величина со средним значением 2,5 м
и стандартным |
отклонением 0,2 м. |
Оценить вероятность того, что в наудачу |
||||
выбранный день уровень воды окажется в пределах от 2м 20см до 2м 80см. |
||||||
|
|
|
Ответы |
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
3 |
4 |
5 |
|
0,775; 0,04 |
0,84 |
|
0,157 |
0,954 |
0,866 |
|
2.21 Неравенство Чебышева
Необходимо рассмотреть условия, при выполнении которых совокупное действие очень многих случайных причин приводит к результату, почти не зависящему от случая, так как позволяет предвидеть ход явлений. Эти условия и указываются в теоремах, носящих общее название закона больших чисел. К ним относятся теоремы Чебышева и Бернулли. Теорема Чебышева является наиболее общим законом больших чисел, теорема Бернулли – простейшим.
Теорема (Неравенство Чебышева). Вероятность того, что отклонение случайной величины Х от ее математического ожидания по абсолютной величине
меньше положительного числа , не меньше чем 1 D(X ) :2
P( X MX ) 1 D(X ) .2
Теорема Чебышева. Если последовательность попарно независимых случайных величин X1, X2,..., Xn,... имеет конечное математическое ожидание и диспер-
сии этих величин равномерно ограничены (не превышают постоянного числа С), то среднее арифметическое случайной величины сходится по вероятности к среднему арифметическому их математического ожидания, т.е. если – любое положительное число, то
|
1 |
n |
1 |
n |
|
LimP( |
Xi |
M(Xi ) |
) 1. |
||
n |
n i 1 |
n i 1 |
|
||
|
|
||||
В этом случае среднее арифметическое достаточно большого числа независимых случайных величин (дисперсии которых равномерно ограничены) утрачивает характер случайной величины.
Если проводится серия измерений какой-либо физической величины, причем:
1)результат каждого измерения не зависит от результатов остальных (измерения попарно независимы);
2)измерения производятся без систематических ошибок, (имеют одно и то же математическое ожидание);
3)обеспечена определенная точность измерений, (дисперсии их ограничены) то при достаточно большом числе измерений их среднее арифметическое ока-
жется сколь угодно близким к истинному значению измеряемой величины.
53
Теорема Бернулли. Если в каждом из независимых опытов вероятность появления события А постоянна, то при достаточно большом числе испытаний вероятность того, что модуль отклонения относительной частоты появлений А в n опытах от p будет сколь угодно малым, как угодно близка к 1.
Закон больших чисел не исследует вид предельного закона распределения суммы случайных величин. Этот вопрос рассмотрен в группе теорем, называемых центральной предельной теоремой. Они утверждают, что закон распределения суммы случайных величин, каждая из которых может иметь различные распределения, приближается к нормальному при достаточно большом числе слагаемых. Этим объясняется важность нормального закона для практических приложений.
Центральная предельная теорема. Если X1, X2,..., Xn – независимые слу-
чайные величины с одинаковым законом распределения, математическим ожиданием a и дисперсией 2 , то при неограниченном увеличении n закон распределе-
n
ния суммы Yn Xk неограниченно приближается к нормальному.
|
|
|
|
k 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
Примеры |
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
X MX |
|
|
2для случайной величины Х: |
|||||||||||
1. |
Найти вероятность того, что |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Х |
|
|
|
-2 |
|
-1 |
|
0 |
|
1 |
|
|
2 |
|
||||||||
Р |
|
|
|
0,1 |
|
0,2 |
|
0,4 |
|
0,2 |
|
|
0,1 |
|
||||||||
Решение. По неравенству Чебышева: P( |
|
X MX |
|
2) 1 |
D(X ) |
. Найдем |
||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
математическое ожидание случайной величины Х. |
|
|
||||||||||||||||||||
MX =0,2-0,2+0,2+0,2 = 0, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
DX = 0,4+0,2+0,2+0,4 = 1,2, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
P( |
|
X MX |
|
2) 1 1,2 |
0,7 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
2. |
Найти вероятность того, что 1,5 X MX |
1,5для случайной величины Х: |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||
Х |
|
-2 |
|
-1 |
|
0 |
|
1 |
|
|
2 |
|
||||||||||
Р |
|
1/7 |
|
1/7 |
|
3/7 |
|
1/7 |
|
|
1/7 |
|
||||||||||
Решение.
Математическое ожидание случайной величины принимает значение:
MX =0,
Дисперсия равна
DX = 10/7,
P( X MX 1,5) 1 10 / 7 0,63. 2,25
54
Задачи для самостоятельного решения
1. Найти вероятность того, что |
|
X MX |
|
|
1,7для случайной величины Х: |
|||||||
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|||
Х |
-1 |
-0,5 |
|
0 |
1 |
2 |
|
|||||
Р |
0,2 |
0,1 |
|
0,3 |
0,2 |
0,2 |
|
|||||
|
|
X MX |
|
1,2для случайной величины Х: |
||||||||
2. Найти вероятность того, что |
|
|
||||||||||
|
|
|
|
|
|
|
||||||
Х |
0 |
1 |
|
2 |
3 |
4 |
|
|||||
Р |
0,1 |
0,2 |
|
0,1 |
0,1 |
0,5 |
|
|||||
3. Найти |
вероятность того, что 2 X MX 2 |
для случайной величины Х: |
||||||||||
Х |
-2 |
1 |
|
3 |
7 |
10 |
|
|||||
Р |
0,2 |
0,1 |
|
0,1 |
0,1 |
0,5 |
|
|||||
4. Найти |
вероятность того, что 5 X MX 5 |
для случайной величины Х |
: |
|||||||||
Х |
0 |
1 |
|
2 |
7 |
17 |
|
|||||
Р |
0,1 |
0,1 |
|
0,05 |
0,05 |
0,7 |
|
|||||
5. Найти |
вероятность того, что 1,9 X MX |
1,9для случайной величины |
||||||||||
Х: |
|
|
|
|
|
|
|
|
|
|
|
|
Х |
5 |
6 |
|
7 |
8 |
9 |
|
|||||
Р |
0,15 |
0,05 |
|
0,1 |
0,1 |
0,6 |
|
|||||
55
3. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ РАЗДЕЛА «ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ»
3.1 Статистический материал и его обработка
Результаты наблюдений массовых явлений, случайных величин составляют статистические данные или статистический материал. Выборкой объёма n называется совокупность n случайно отобранных объектов. Множество всех объектов, из которых производится выборка, называется генеральной совокупностью (ГС).
Выборочный метод состоит в том, что на основании изучения некоторого количественного признака у некоторой части статистической совокупности (выборки), полученной в результате статистического отбора, можно сделать вывод о характере распределения этого признака по всей статистической совокупности (генеральной совокупности).
Результаты наблюдений выборки объёма записываются, в частности, в виде статистической совокупности:
|
1 |
2 |
|
|
|
номера наблюдений, измерений |
|
|
|
|
… |
|
|
значение наблюдаемой величины |
|
|
1 |
2 |
|
|
|
|
|
При больших значениях |
и различных значениях статистическую сово- |
||||||
|
|
|
|
|
|
|
|
купность подвергают специальным видам статистической обработки.
Расположим значения xi , которые назовём вариантами, в порядке возраста-
ния и обозначим = min ; = max . Величина = − называется размахом статистической совокупности. Среди значений могут быть одинаковые. Пусть значение 1 наблюдалось 1 раз, 2 – 2 раз, …, наблюдалось раз. Тогда общий объём выборки равен = ∑=1 . Число , показывающее, сколько раз встречается варианта (значение) , называется частотой , а число = –
относительной частотой варианты .
Последовательность , записанная в порядке возрастания с указанием частот и (или) относительных частот, называется вариационным рядом. Статистическим
рядом называется последовательность пар ( , ). Обычно статистический ряд за- |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
писывается в виде следующей таблицы: |
|
|
|
|
||||||
|
Варианта |
|
|
|
|
|
… |
|
Сумма |
|
|
|
|
|
|
||||||
|
|
|
1 |
2 |
|
|
|
|
|
|
|
Частота |
|
|
|
|
… |
|
|
|
|
|
|
|
2 |
|
|
|||||
|
|
|
1 |
|
|
|
|
|
|
|
|
Относительная |
|
|
|
|
|
|
|
||
|
частота |
|
|
… |
1 |
|
||||
|
|
1 |
2 |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Геометрическим изображением вариационного ряда является эмпирический полигон распределения, являющийся аналогом плотности распределения случайной величины – ломаная с вершинами ( , ) – см. рисунок 1.
56
Вариационный ряд обозрим при небольших значениях ( ≤ 20). В противном случае его (или первоначальную статистическую совокупность) подвергают интервальной обработке.
Все варианты принадлежат отрезку [ , ]. Пусть некоторое (не больше 20) натуральное число. Отрезок [ , ] разобьём на k равных частей длины = − .
Обозначим эти промежутки следующим образом: [ 0, 1[; [ 1, 2[; … , [ −1, ]. Через обозначим число вариант, попавших в интервал [ −1, [, при этом бу-
дем считать, что каждый промежуток содержит свой левый конец, но лишь по-
следний промежуток содержит и свой правый конец. Пусть = (числа и
можно также отнести к середине ai* интервала ( −1, )). Полученные данные
занесём в таблицу, называемую интервальной обработкой ряда, или статистической совокупности.
|
Интервал |
|
[ |
, |
[ |
|
[ , |
2 |
[ |
|
[ |
−1 |
, |
] |
Сумма |
|
||||
|
|
0 |
1 |
|
1 |
|
|
|
|
|
|
|
|
|
||||||
|
Середины |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
– |
|
|||
|
|
|
|
1 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Частоты |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
1 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Относительные |
|
|
|
|
|
|
|
|
… |
|
|
|
|
1 |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
частоты |
|
|
1 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Количество интервалов можно рассчитать по формуле Стерджеса = 1 + |
||||||||||||||||||||
3,332 ∙ либо с помощью таблицы: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Объём выборки |
|
25-40 |
|
40-60 |
|
|
60-100 |
|
|
100-200 |
|
> 200 |
||||||||
Число интервалов |
|
5-6 |
|
|
6-8 |
|
|
7-10 |
|
|
8-12 |
|
|
10-15 |
||||||
Геометрическим изображением интервальной обработки служит гистограмма (см. рисунок 1). Гистограммой частот называется множество прямоугольников с
основаниями ( −1, ) и высотами . Площадь гистограммы равна объёму выбор-
ки .
Нормированная гистограмма (гистограмма относительных частот) пред-
ставляет собой ступенчатую фигуру из прямоугольников с основаниями равными интервалам значений признака ( −1, ) и высотами, равными плотности частоты ∙ . Если соединить прямолинейными отрезками середины верхних оснований пря-
моугольников, получим полигон распределения. Суммарная площадь всех прямоугольников гистограммы равна 1:
|
|
|
|
|
|
1 |
|
|
|
∑ |
|
∙ = ∑ |
|
= |
|
∑ = |
|
= 1 |
|
|
|
|
|
|
|||||
=1 ∙ |
|
|
|
|
|
|
|||
=1 |
=1 |
|
|||||||
57
Рисунок 1
Эмпирической функцией распределения (функцией распределения выборки)
называется функция ( ), определяющая для каждого значения относительную частоту события < (см. рисунок 2):
|
|
( ) = |
|
, |
(1) |
|
|
|
|
||||
где |
– число вариант |
, меньших чем , |
|
|
|
|
– объем выборки. |
|
|||||
|
|
|
|
|
|
|
Рисунок 2
Функция ( ) обладает следующими свойствами (здесь = min ; =
1) ( ) [0; 1]; 2) ( ) = 0 при < , ( ) = 1 при > ; 3) ( ) –
монотонно неубывающая, непрерывная слева функция.
Функция ( ) является статистическим аналогом функции распределения( ) генеральной совокупности. Функцию распределения ( ) в математической статистике называют теоретической функцией распределения. Различие между теоретической и эмпирической функциями распределения состоит в том, что ( ) определяет вероятность события < , а ( ) – относительную частоту этого события.
58
Т. е. эмпирическая функция распределения служит для оценки вида теоретической функции распределения случайного признака, полигон и гистограмма – для оценки вида теоретической кривой распределения.
3.2 Числовые характеристики законов распределения эмпирических величин
Одна из задач математической статистики состоит в установлении закона распределения случайной величины Х (генеральной совокупности) и оценке параметров этого закона.
Вид закона выбирается из каких-либо теоретических или практических соображений, а параметры следует вычислять, исходя из параметров этого закона.
Важнейшим этапом обработки статистических данных является вычисление оценок числовых характеристик исследуемой случайной величины.
Полученные оценки позволяют в числовой форме описать характерные черты статистического распределения и являются базой для построения математической модели изучаемого случайного явления.
Любая величина ̃, определяемая как функция выборочных значений ̃ =( 1, 2, … ), называется выборочной статистикой или просто статистикой.
Статистика ̃, используемая в качестве приближённого значения неизвестного параметра , называется статистической оценкой параметра .
Существует два вида оценок параметров: точечные и интервальные.
Точечной называется статистическая оценка, которая определяется одним числом.
К точечным статистическим оценкам предъявляется ряд требований.
Если ̃ – статистическая оценка параметра , то она должна удовлетворять следующим условиям:
1)быть несмещенной, что означает, что ( ̃) = .
2)быть состоятельной, т.е. предел по вероятности при → +∞ последовательности таких оценок должен быть равен искомому параметру, т.е. вероятность
того, что | − ̃| > > 0 , стремится к нулю при → +∞.
3) быть эффективной, т.е. дисперсия ( ̃) – наименьшая или быть
асимптотически эффективной, что означает, что lim ( ̃) = 0.
→∞
Число > 0 называется точностью оценки, если имеет место равенство | − ̃| < . Если это неравенство имеет место с некоторой вероятностью , то число называется надёжностью оценки или уровнем надёжности. Наиболее употребительными уровнями надёжности являются = 0,95; = 0,99; = 0,999.
Выборочной средней ̅называют среднее арифметическое значение случайной
величины Χ по выборочной совокупности объёма : |
|
|||
̅= |
1 |
∑ |
. |
(2) |
|
||||
|
|
=1 |
|
|
|
|
|
|
|
59
Выборочная средняя служит несмещённой оценкой математического ожида-
ния признака Χ или генеральной совокупности.
Кроме выборочной средней в статистическом анализе применяются структурные средние: медиана и мода.
Модой называют варианту, которая имеет наибольшую частоту. Если рас-
пределение интервальное, то определяется модальный интервал [ , |
[, которо- |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
+1 |
|
му соответствует наибольшая частота , мода вычисляется по формуле: |
|
|||||||||||
|
|
|
|
|
−−1 |
|
|
|
|
|||
|
|
|
= + ∙ |
|
, |
|
|
(3) |
||||
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
( −−1)+( −+1) |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|||||
где – величина модального интервала; |
и |
|
– частоты предмодального и по- |
|||||||||
|
|
|
|
|
|
+1 |
|
|
|
|
||
слемодального интервала. |
|
|
|
|
|
|
|
|
|
|||
Медианой называют варианту, которая делит вариационный ряд на две ча- |
||||||||||||
сти, равные по числу вариант. Если = 2 + 1, то = |
, а если = 2, то |
|||||||||||
+ |
|
|
|
|
|
|
|
+1 |
|
|
|
|
+1 |
|
|
|
|
|
|
|
|
|
|
||
= |
|
. При вычислении медианы интервального ряда распределения ис- |
||||||||||
|
|
|||||||||||
2 |
|
|
|
|
|
|
|
|
|
|
|
|
пользуется формула: |
|
|
|
|
|
|
|
|
|
|||
|
|
|
= + ∙ |
0,5 −−1 |
, |
|
|
|
(4) |
|||
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
где −1 - накопленная частота интервала, предшествующего медианному, включая
интервал, предшествующий медианному; – начальное значение интервала, который содержит медиану. Номер медианного интервала определяется из неравенства
∑ =1 ≤ 2 < ∑ =1+1 . В случае выполнения равенства номер медианного интер-
вала равен , в противном случае – + 1.
Средние величины не отражают изменчивости (вариации) значений признака. Чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения ̅вводят свободную характеристи-
ку – выборочную дисперсию.
Выборочной дисперсией называют среднее арифметическое квадратов от- |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
клонения наблюдаемых значений признака от их среднего значения ̅: |
|
||||||||||||||||||||||||||
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
2 |
|
|
1 |
|
|
|
2 |
|
2 |
|
|||
|
|
|
= |
|
|
∑ |
|
( |
− ̅) ∙ = |
|
∑ |
=1 |
|
|
− ̅. |
(5) |
|||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Выборочным средним квадратическим отклонением (стандартом) называют |
|||||||||||||||||||||||||||
квадратный корень из выборочной дисперсии: |
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
= |
√ . |
|
|
|
|
|
|
|
|
(6) |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Выборочная дисперсия является смещённой оценкой генеральной дисперсии, |
|||||||||||||||||||||||||||
так как ( ) = |
|
|
. В качестве несмещенной оценки генеральной дисперсии |
||||||||||||||||||||||||
−1 |
|||||||||||||||||||||||||||
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
служит «исправленная» выборочная дисперсия: |
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
2 |
= |
|
|
|
|
= |
1 |
|
∑ |
( − ̅)2 . |
|
(7) |
|||||||||||
|
|
|
|
−1 |
−1 |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
=1 |
|
|
|
|
|
|
|
|||||||
При достаточно больших |
|
выборочная и исправленная дисперсии мало от- |
|||||||||||||||||||||||||
личаются, поэтому на практике исправленной дисперсией пользуются, если < 50.
60
