Вариационная статистика
.pdfВ столбцы 4-7 вписывают произведения найденных отклоне ний в первой, второй, третьей и четвертой степенях на частоты.
Эти произведения рекомендуется находить последовательно по
строкам, умножая в каждой из них число предыдущего столбца
на одно и то же число- т. е., на отклонение х~~.. Благодаря этому
создаются условия для проверки чисел, помещенных в столбцах
4-7.
Проверка состоит в сравнении помещенных в графе 7 произ ведений (nx1) со значениями их, указанными в табл. 2 прил.
10. Вычисление начальных моментов по способу прои3ведеинй
для ряда распределения диаметров стволов сосны
хn
|
16 |
4 |
-4 |
-16 |
64 |
256 |
1024 |
-3 |
324 |
|
20 |
7 |
-3 |
-21 |
63 |
-189 |
567 |
-2 |
112 |
|
24 |
8 |
-2 |
-16 |
32 |
-64 |
128 |
-1 |
8 |
|
28 |
28 |
-1 |
-28 |
28 |
-28 |
28 |
о |
о |
М'=32 |
20 |
о |
о |
о |
о |
о |
+1 |
20 |
|
|
36 |
18 |
+1 |
18 |
18 |
18 |
18 |
+2 |
+88 |
|
40 |
9 |
+2 |
18 |
36 |
72 |
144 |
+3 |
729 |
|
|
94 |
|
1 -81 1 241 |
1 -5371 |
1909 |
1 |
1481 |
|
|
|
|
|
+36 |
|
+90 |
|
|
|
|
|
|
|
-45 |
|
-447 |
|
|
|
т1 == - |
45/94 = - |
0,479 |
|
|
т~= 1481/94 = |
15,755 |
|
||
т2=241j94 = 2,564 |
|
|
|
то= 1,000 |
|
||||
тз = |
- |
447/94 = |
-4,755 |
|
|
|
4m 1 =-1,916 |
|
|
т4 = |
1909/94 = 20,309 |
|
|
|
am~ = |
15,384 |
|
||
|
|
|
|
|
|
|
4m3 =-19,020 |
|
|
|
|
|
|
|
|
|
т,= 20,309 |
|
|
|
|
|
|
|
|
|
|
15,757 |
|
Примечание. т:-см. формулу V.10.
После сделанной проверки вычислений находят алгебраические
суммы чисел каждого столбца, по которым находят затем на
чальные моменты по формулам:
m1 = (~nxk)/N |
(V.5) |
||
m2 = (~nx~)jN, |
(V.6) |
тз= (~nx~)/N, |
(V.7) |
m4 = |
(~ nxk)/N. |
(V.8) |
42
Вычисление моментов рекомендуется производить с точностью до
0,001. Проверку правильиости вычисления начальных моментов
производят по формуле:
т:= то+ 4т1 +6m2+ 4тз + т4, |
(V.9)* |
т:- четвертый начальный момент относительно нового начала
отсчета отклонений, сдвинутого на один разряд ниже.
т:= [1: n (xk + 1)4]/N, (V.lO)
где (xh + 1) -условные отклонения классовых вариант относи
тельно нового начала (условной средней). В табл. 10 эта новая условная средняя равна 28 см.
Отклонения от нового начала практически получают, увели
чивая на единицу отклонения (xh), выписанные в столбце 3. Зна чения произведений этих отклонений, взятых в четвер~ой степени (столбец 8), на частоты (взятые из столбца 2) выписывают из
табл. 2 прил.
Данные проверки начальных моментов рекомендуется при
вести в НИЖ!iей части расчетной таблицы, справа (см. табл. 10).
Вычисление центральных моментов. Центральные моменты
вычисляют по формулам:
|
|
. |
|
2 |
(V.11) |
|
Р·о = 1; [11 =0; [12 =т2 -т,; |
||||
|
(Jоз = тз - |
Зт2т1 |
3 |
|
(V.12) |
|
+ 2т1; |
||||
|
[14 = т44тзт1 + 6m2тi3тi. |
(V.13) |
|||
Для |
проверки центральных моментов |
ряда |
распределения |
||
применяют формулы: |
|
|
|
|
|
|
|
|
з |
|
(V.14)** |
|
[Jоз =тз- З[Jo2m1т1, |
|
|||
|
|
|
2 |
4 |
(V.15) |
|
(14 = т4 - 4[Jозт1 - 6[12m1 - |
ntj. |
|||
Центральные моменты для ряда диаметров сосны следующие:. |
|||||
р.о = |
1; fJ-1 =О; fJ-2 = т2 - |
тi = 2,564- (-0,479)2= 2,335 |
|||
~fJ-з =тзЗт2m1 + 2тi = |
-4,755- 3·2,564 (-0,479) + |
||||
|
+ 2 (-0,479) 3 = |
-1 ,290; |
|
||
|
1·"4 = т'('- 4тзт1 + |
6т2mi - |
Зтi = 20,309 - |
- 4 (-4,755) (-0,479) + 6·2,564 (-0,479) 2 -3( -0,479) 4 = 14,565.
* Равенство (V.9) |
nолучается из (V.IO) nутем |
разложения |
бинома |
||
(xk+1) 4 по формуле Ньютона |
и умножения |
каждого |
из nолученных |
членов |
|
на 'l:.n/N. |
|
|
|
|
|
** Формулы (V.I4) |
и (V.15) |
nолучены нз |
(V.12) и (V.IЗ) путем nостановки |
в nоследние вместо начальных моментов m2 и m3 их значений, nолученных на
<JCHOBe (V.ll) и (V:12).
43
Проверка:
r-з =тз- 3tJ.zmi- т~= -4,755- 3·2,335 ( -0,479)-
- (-0 479) 3 |
= -1 290· |
' |
' ' |
!..1.4 = m4- 4tJ.зmi- 6t..Lzm1mi = 20,309- 4 (-1,290) (-0,479) - - 6. 2,335 ( -0,479) 2 - ( -0,479) 4 = 14,571.
Вычисление выборочных статистических характеристик рас
пределения. Выборочные статистические характеристики распре
деления вычисляют на основе моментов или средних ве.1ичин
отклонений вариант, как и в способе условного нача!Iа. Ввиду того, что моменты выражены в единицах интервала k, так как хт,= (X-M')/k, для получения отклонений в единицах нзмерения моменты приходится умножать на величину~ Кроме уже ранее
вычисленных статистических ·характеристик х, s, v для бо.1ьших
выборок, таких как наша и больших, вычисляют показатели
асимметрии и эксцесса.
Форму.~ы для расчета следующие:
Средняя арифметическая . |
|
|
\V.lб) |
||||
Среднее квадратическое отк.rюнение: |
. ' ,; |
|
|
||||
а) |
в |
единицах |
интервала |
|
(V.I7) |
||
.s=rfL2 |
|||||||
б) |
в |
единицах |
измерения |
. s = ks' |
= k У fL~· |
(V.I8) |
|
Коэффициент вариации . |
s |
' |
(о1 IV.21) |
||||
.v=-=-10096. |
|||||||
|
|
|
|
|
х |
|
|
Показатель |
асимметрии |
.А= fLз/(s')3 |
(V.I9) |
||||
Показатель |
эксцесса ·. . |
.Е= (f'-4/(s')<) - 3 |
(V.20) |
||||
|
Формулы (V.16), (V.18), (V.19) и (V.20) аналогичны фор |
||||||
мулам, соответственно (V.2), |
(IV.1l), (.IV.23), |
(IV.24). Однако |
в формулах (V.l6)- (V.20) участвуют коды отклонений вариант.
Для ряда диаметров сосны получим следующие выборочные
статистические характеристики: |
|
|
||
х = |
32 + 4 (-0,479) = |
30,084 см::::::: 30,1 |
см, |
|
s' = |
V2,335 |
= 1,528, |
s = 4·1,528 = 6,11 |
см, |
|
v = |
(6, 11/30,1) 100% = 20,3% |
|
А=, -1,290/1,5283 = -0,362; Е= 14,665/1,5284 - 3 = -0,328.
§ 4. СПОСОБ СУММ
Вычисление начальных моментов. При вычислении начальных. моментов по способу сумм вычислительная работа упрощается.
Вписав в качестве исходных данных классовые варианты и соот ветствующие им частоты, следующие нумерованные столбцы
предназначают для суммирования и последние два ненумерован
ных столбца, для вышеописанной проверки начальных моментов.
44
Вычисление моментов, а по ним и статистических характери
стик по способу сумм произведем для ряда распределения высот сосны, приведеиного в табл. 5. Технику расчетов и результаты
приводим в табл. 11.
Против частоты, соответствующей условной средней М', про
водят черту через все нумерованные столбцы таблицы, разделяя
последнюю на две частиверхнюю и нижнюю. В столбцах 2, 3, 4, 5 добавляют сверху и снизу от проведеиной общей черты
дополнительные черточки в возрастающем количестве 1, 2, 3, 4
и т. д. Таким образом получается фигура из черточек в виде
треугольника.
J]. Вычисление начальных моментов по способу сумм
для ряда распределения высот сосны
|
|
|
|
|
|
|
|
|
|
1 (xk + J) |
tl (х~ +J)' |
|
х |
|
11 |
|
(!) |
(2). |
1 |
(3) |
(4) |
1 (о) |
l (11'~ табл. |
||
|
|
|
|
|
|
|
|
|
|
|
nрил. 2) |
|
20 |
|
1 |
|
1 |
1 |
|
1 |
1 |
1 |
-6 |
1296 |
|
21 |
|
2 |
|
3 |
4 |
|
Б |
6 |
7 |
-5 |
1250 |
|
22 |
|
2 |
|
5 |
9 |
|
14 |
"20 |
27 |
-4 |
512 |
|
23 |
|
3 |
|
8 |
17 |
|
31 |
51 |
|
-3 |
243 |
|
24 |
|
4 |
|
12 |
29 |
|
60 |
- |
- |
-2 |
64 |
|
25 |
|
2 |
|
14 |
43 |
|
- |
- |
-- |
-1 |
2 |
|
26 |
|
13 |
|
27 |
- |
|
-- |
- |
-- |
о |
о |
|
М'=27 |
|
14 |
|
|
|
|
|
|
|
+1 |
14 |
|
28 |
|
25 |
|
53 |
-- |
|
- |
- |
- |
+2 |
400 |
|
29 |
|
18 |
|
28 |
38 |
|
- |
- |
- |
+3 |
1458 |
|
;30 |
|
10 |
|
10 |
10 |
|
10 |
- |
- |
+4 |
2560 |
|
,. |
94 |
a9l |
48 |
|
10 |
- |
- |
- |
1 7789 |
|||
|
|
|||||||||||
|
|
|
|
ыо |
103 |
|
111 |
78 |
35 |
|
|
|
|
|
|
Sl61 |
151 |
|
121 |
78 |
35 |
т:=7799:94 =;82,968 |
|||
|
|
|
d21 |
-55 |
-101 |
-78 |
-35 |
|
|
|||
Проверка сrммирования (сумм а и |
h) |
|
то= 1,000 |
|||||||||
27 + 14 +5 |
= |
94 |
|
|
|
|
|
4т1 = 0,892 |
||||
а1 = 38 + 53 =- 91; |
h1 = 43 + 27 с·~ |
70; |
h2=60+43= 103; |
6т2=29,550 |
||||||||
4т3=-38,936 |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|||
а2=10+38=48, |
|
Ь3=51+60=1 11; h4 =27+51=78 |
т,= 90,457 |
|||||||||
Начальные моменты: т1=21 : 94 = 0,223 |
|
82,963 |
||||||||||
|
|
|
||||||||||
т2 = (161 + |
2·151)/94 = |
463/94 = |
4,925 |
|
|
|
|
|||||
тз= [21 + 6(~55) + 6] (-101)/94 = |
-915/94 = -9,734 |
|
|
|||||||||
т, 0 "' 161 + |
|
14·151 + 36-121 + 24· 78)/94 = 8503/94 =90,457 |
|
|
Примечание. т: см. V.IO.
45
Составление таблицы состоит в следующем. Численности пер вого и последнего классов (в нашем ряду 1 и 11-го) вписывают в те же строки, т. е. первого и последнего классов, во все столб цы, не занятые чертой. Каждое последующее число столбца (1),
..., (5) получают как сумму двух чисел, одно из которых стоит
рядом с образуемым числом слева, а другойнад ним (в верх ней части таблицы) или под ним (в нижней части таблицы). Строки, занятые черточками, не заполняют. Внизу каждого столбца выписывают суммы верхней и нижней частей таблицы.
Одну из этих вспомогательных сумм, находящуюся в стороне _
вариант, значения которых больше условной средней М' обозна
чают буквой а, .а другую суммубуквой Ь. Алгебраические суммы этих вспомогательных сумм обозначают буквой s, а раз
Iюсти их буквой d (в столбцах 1, 2, 3, 4, 5 будем иметь соответ
ственно SJ, s2, sз, s4, ss и d1, d2, dз, d4, ds).
Правильиость суммирования в 1-м столбце проверяют, сло жив наибольшие числа верхней и нижней частей этого столбца с частотой, стоящей против начального значения. Сумма этих трех чисел должна равняться объему ряда. В примере расчета, приведеином в табл. 11, имеем 27 + 14+ 53=94.
Проверка суммирования во 2-м и следующих столбцах состо ит в сложении последнего наибольшего числа верхней или ниж
ней части провернемого столбца с последним числом предыду
щего столбца, расположенным строкой выше (при проверке ниж ней суммы) или строкой ниже (при проверке верхней суммы).
Проверка сумм а и Ь приведена в табл. 11. Начальные моменты вычисляют по формулам:
m1 = |
d1/N, |
(V.21) |
m2 = (s1 +2s2 )/N, |
(V.22) . |
|
|
3 |
|
(V.23) |
|
m = (d1 +6d2 + 6d3 )/N, |
|
||
|
m4 = |
(s1 + 14s2 + 36s3 + 24s4 )/N. |
(V.24) |
|
Вычисление начальных моментов приведено в табл. 11. |
||||
Вычисление |
центральных |
моментов. Формулы |
те же, |
|
см. (V.11)-(V.15) |
|
|
|
|
l'-2 = 4,925 - |
0,2232 = |
4,925 - 0,049 = 4,876. |
|
Р·з = -9,734- 3-4,925·0,223 + 2·0,2233 =
= -9,734-3,295 + 0,022 = -13,007.
l'-4 = 90,457-38,936-0,223 + 29,550-0,050-3·0,002 = = 90,457 + 8,683 + 1,477-0,006 = 100,611.
Проверка:
1-'-з = -9,734- 3 · 4,876 ·0,223-0,2233 = = -9,734-3,262-0,011 = -13,007.
46
р.4 = 90,457 -- 0,892 (--13,007) - 6 · 4,876 ·0,2232 - 0,2234 = = 90,457 + 11,602- 1,454- 0,002 = 100,603.
Вычисление выборочных статистических характеристик рас
пределения для ряда высот формулы (V.16)- (V.20).
х= 27 + 1·0,223 = 27,22~27,2 м; s=V4,876 =2,21, s=1·2,21=2,21 м v = (2,21/27,2) ·100% = 8,1%
А= -13,07/2,2!3 = 1,307
Е= 100,603/2,21 4 - 3 = 1,233.
Г л а в а VI
СТАТИСТИЧЕСКИй АНАЛИЗ ВЫБОРОЧНЫХ НАБЛЮДЕНИЯ
§ 1. ЗАДАЧИ СТАТИСТИЧЕСКОГО АНАЛИЗА НАБЛЮДЕНИй
Цель большей части исследований не ограничивается вычис
лением статистических характеристик выборки. Чаще всего инте
ресуют исследователя статистические характеристики для гене
ральной совокупности, которые называют параметрами. В дру
гих случаях необходимо сравнить статистические показатели двух выборок с целью проверки векоторого теоретического пред положения об эффективности испытываемого средства или нескольких средств (препаратов) на свойства живых организ мов*. Провернемое теоретическое предположение называют гипотезой. Проверку гипотез проводят на основе сравнения ста тистических показателей выборочных совокупностей, получив ших, например, различный состав или дозы препарата. Стати стический анализ должен дать ответ на вопрос: подтверждают
или не подтверждают результаты опыта гипотезу?
В случаях, когда теоретические представления могут быть
с достаточной определенностью выражены математическими
соотношениями или функциями, задача статистического анализа сводится к сопоставлению фактических результатов опыта с тео
ретически полученными на основе расчета, а также к оценке сте
пени согласия между ними. Так, теоретическое представление о случайном характере распределения деревьев однородного дре востоя по их толщине (диаметру) может быть проверено на
основе сопоставления экспериментального распределения
* В настоящей главе рассматриваются методы анализа показателей двух
некоторых выборок.
47
с теоретической моделью нормального распределения (см. функ
цию II.lЗ). Для дискретных случайных величин фактические
распределения могут быть оценены на основе модели биноми
ального распределения или распределения Пуассона.
Наконец, в качестве теоретических часто рассматриваются
результаты, полученные по тому или иному уравнению регрес
сии, представляющемуся наиболее подходящей моделью аппрок
симации опытных данных в отношении взаимосвязанного изме
нения одного признака от одного или от нескодьких других.
Во всех перечисленных случаях статистический анализ про
изводят, пользуясь определенными методами и критериями.
Статистические методы и критерии, применяемые для оценки результатов наблюдений, бывают двух, видов: параметрические,
когда оценка совокупностей производится на основе сопоставле
ния параметров распредедения (средней f.t, дисперсии а2 и др.),
и непараметрические, когда оценки свойств совокупностей про изводят на основе непосредственного сопоставления значений
варьирующих приЗнаков.
Параметрические методы, как опирающиеся на средние вели
чины, наиболее эффективны. Однако, они применимы-для сово
купностей, имеющих нормальное или умеренно отклоняющееся от него распределение. Непараметрические критерии применимы при любой форме распределений.
Методы и критерии оценки разработаны теорией вероятно
стей и математической статистикой. Однако суть главнейших
критериев, методов их получения и применения проще раскры
вается на экспериментальной основе.
В настоящей главе рассматривается решение двух первых из
перечисленных в начале параграфа задач статистического ана
лиза, а именно, оценка параметров на основе одной выборки и сравнение двух выборочных совокупностей.
Методы решения других задач статистического анализа изло
жены в последующих главах.
§ 2. ВЬIБОРОЧНЬIЕ СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ОЦЕНКИ ПАРАМЕТРОВ*
Оценка параметров, т. е. статистических характеристик гене ральной совокупности, является центральной задачей статис
тики.
В§ l гл. II отмечалось, что характеристикой (оценкой) сред
ней величины генеральной совокупности f.t может служить
любая, случайно взятая варианта. Однако получение точного
значения f.t по одной варианте имеет небольшую вероятность.
Если мы в качестве оценки для f.t используем выборочную сред-
* Термин «оценка:. употребляется в двух значениях: 1 -как статистиче ский показатель, оценивающий (характеризующий) параметр; 2 - как назва
ние самого процесса оценивания параметра.
48
нюю, то точность нашего заключения возрастает с увеличением
числа наблюдений, на которых основана выборочная средняя. Таким образом, статистические характеристики (показатели)
выборки можно рассматривать как лучшие из возможных оце нок соответствующих параметров. Насколько, однако, надежны
эти оценки, можно понять из нижеследующего рассмотрения рас
преде.lения выборочных показателей, полученных из одной и той
же генеральной совокупности.
Наибольший интерес представляют распределения выбороч
ных средних. П е р в а я особенность такого распределения
зак.'!ючается в следующем. Если бы совокупность значений
высот. приведеиных в табл. 2, была большой, например, в не
сколько тысяч единиц (фактически мы имеем здесь выборку большого размера), из нее можно было бы построить много
выборок малого размера, например по 10 единиц в каждой.
Если д~1я каждой такой выборки найти средние: х1, х;, х3, ... ,·Xn,
получим их распределение. Средние будут варьировать относи
тельно генеральной средней ~. аналогично вариантам, группи
рующимся около средней х. Однако характер варьирования вы
борочных средних имеет важные особенности. Распределение
средних оказывается нормальным даже в том случае, когда
исходная совокупность не является нормальной. Это позволяет
применять излагаемые ниже методы и критерии оценки пара
метров без выяснения точной формы распределения, которая
обычно не бывает известной.
В т о р а я особенность состоит в том, что размах средних
в УN раза меньше размаха в ис~одной совокупности, где N- объем выборки. Следовательно, любая выборочная средняя явля
ется более надежной оценкой средней в совокупности, чем от дельная с.'lучайная варианта.
Т р е т ь я особенность относится к самой средней величине этого распределения. Она может быть получена путем сумми
рования выборочных средних и деления результата на число их,
Полученная средняя является наиболее надежной оценкой сред
ней величины генеральной совокупности. Для 9 выборочных
средних в табл. 12 средняя х 27,22. Для 5 выборокснечетными
номерами (1, 3, 5, 7, 9) х 27,20, а для 4 выборок с четными
номерамих=27,25 см.
В табл. 12 приведены значения средних и стандартных откло
нений для 9 выборок высот сосны. Выборки взяты из табл. 2.
1-н выборка включает деревья под номерами 1-1 О; 2-я- де
ревья с 11-го номера по 20-й и т. д. Такой выбор считали возмож
ным, исходя из представления о случайном составе совокупности
94 значений высот, приведеиных в табл. 2.
Каждая из 9 выборочных средних является оценкой средней
величины в совокупности, из которой взяты выборки. В нашем
случае |
имеем |
выборочную совокупность из 94 значений высот |
4 Н. Н. |
Свалов |
49 |
сосны, для которой средняя х 27,22 м, среднее квадратическое отклонение s=2,21 м. Эту выборочную совокупность будем назы вать большой в ы бор к ой. При данном рассмотрении
вопроса об оценках параметров она имитирует генеральную
совокупность. Все средние малых выборок табл. 12 отличаются
от х 27,22. Однако отклонения выборочных средних, являю
щихся проявлением случайных факторов, обнаруживают опреде
ленные закономерности.
12. Оценки среднего значения и стандартного отклонения по результатам 9 выборок иэ табл. 2
Статистический
nоказа-
тель вы-
борки
-
х
s
Среднее значение и стандартное отклонение для выборки .N!
1 |
2 |
3 |
4 |
5 |
|
б |
7 |
8 |
9 |
1 |
|
1 |
|
1 |
1 |
1 |
|
1 |
1 |
|
|
'1 |
27,2 |
|
|
|
27,0 |
27,6 |
|
26,9 |
26,9 |
27,1 |
27,6 |
|
27,5 |
27,2 |
|||
1,94 |
2,55 |
2,90 |
1,54 |
2,38 |
|
1,62 |
1,53 |
2,85 |
1,58 |
В сред-
нем для
9 выбо-
рок
27,22
2,17
Часть из этих средних, а именно Х1, i;, ·хз и Хв меньше общей
средней, равной 27,22 м, другая часть их· больше этой средней. Средняя из 9 средних равна 27,22 м, т. е. точно совпадает со
средней для выборки из 94 измерений высот.
Та же статистическая закономерность наблюдается в рас пределении 9 значений средних квадратических отклонений, каждое из которых является оценкой среднего квадратического отклонения большой выборки, раБиого 2,21 м. Наиболее пра вильно было брi сказать, что они являются оценками неизвест
ного нам среднего квадратического отклонения генеральной
совокупности о·. Пять значений оценок среднеквадратического отклонения (для 1, 4, 6, 7, 9-й выборок) оказались меньше оцениваемого в данном примере s=2,21 м, остальные боль
ше его.
Среднее арифметическое из 9 отклонений равно 2,10. Оно
является более надежной оценкой s=2,21 м, чем одно, случайно
взятое из 9 отклонений. Однако средняя арифметическая оценка
для среднего квадратического отклонения является смещенной
(неточной), вследствие того, что определяющим свойством здесь
является сумма квадратов отклонений ~х2. Для получения более точной оценки s нужно вычислить ее как среднюю квадратиче
скую величину, т. е. сложить все наши средние квадраты, раз
делить полученную сумму на 9 и из найденного среднего квадра
та извлечь квадратный корень. Произведя такие арифметиче
ские действия, получили s=2,17 м, которая является цаиболее
надежной оценкой среднего квадратического отклонения для
большой выборки (N=94), равного 2,21 м.
50
§ 3. ОШИБКИ ВЬIБОРОЧНЬIХ СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЯ
При рассмотрении среднего квадратического отклонения отмечалось, что его можно рассматривать как меру ошибки выборочной средней, получаемую по одной, случайно взятой
варианте_ря_2.I.а. Аналогично этому в распределении выборочных
средних х1, х2, .•. , Xn среднее отклонение их от средней величины
'в генеральной совокупности 1-t можно рассматривать как ошибку
выборочной средней величины, установленную на основе N
наблюдений.
Ошибку выборочной средней величины называют также
ошибкой репрезентативности. В дальнейшем она обозначается
буквой s:r.
Так как средняя величина вычисляется из некоторого числа вариант, средний квадрат ошибки ее меньше среднего квадрата отклонения отдельных вариант от средней в N раз, т. е.
s~=s2jN (VI.l) или s:;:= s'VN |
(VI.2) |
Выражается s:r в тех же единицах измерения, что и отдельные
варианты. Приведеиные в табл. 12 девять выборочных средних
имеют следующие отклонения в м от средней величины в иссле
дуемой большой выборке с N=94, равной 27,22 м: -0,32; -0,32;
-Р,12; +0,38; -0,02; +0,28; -0,02; -0,22; +0,38.
Так как средняя из 94 измерений высот является наиболее
совершенной оценкой генеральной средней величины f..t, кото-
рая нам неизвестна, примем условно, что X=f..t=27,22 м. Тогда
отклонения 9 выборочных средних от 1-t можно рассматривать как ошибки репрезентативности или ошибки выборочных
средних.
Средняя квадратическая величина из 9 отклонений равна
0,25 м. Она найдена по формулсs= V-~xз;N (см. IV.ll),
где ~х2 - сумма квадратов отклонений девяти выборочных сред них от f..t, N- чис.1о выборок (наблюдений).
Обычно в опытах средняя совокупности 1-t неизвестна. Ошиб
ку выборочной средней приходится вычислять через выборочное
среднее квадратическое отклонение. Когда объем генеральной
совокупности неизвестен или когда выборка составляет неболь
шую часть (менее 5%) генеральной совокупности, пользуются формулой (V1.2). При ограниченных генеральных совокупно стях ошибку средней бесповторной случайной выборки * опре
деляют по формуле:
s.к=(s!VN)VI--N/Nг, (VI.З)
где N- объем выборки, Nгобъем генеральной совокупности.
* На практике обычно имеют дело с бесповторной выборкой. Б е сп о в -
г о р rи ой q{азывают выборку, когда nри отборе возвращение наблюденных
вариант в генеральную совокупность не производят. В отличие от нее повтор ная выборка образуется по схеме возвращаемых шаров в урну.
51