Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика _Овсянникова (исправленный)

.pdf
Скачиваний:
200
Добавлен:
08.04.2015
Размер:
1.05 Mб
Скачать

Оценка генеральной средней по выборочной средней

Пусть из генеральной совокупности (в результате независимых наблюдений над количественным признаком X) извлечена повторная выборка объема п со значениями признака x1,x2 ,K, xn . Не уменьшая общности рассуждений, будем считать эти значения признака различными. Пусть генеральная средняя неизвестна и требуется оценить ее по данным выборки. В качестве оценки генеральной средней принимают выборочную среднюю

xВ = (x1 + x2 +K+ xn )/ n .

xВ – есть несмещенная оценка, т.к. математическое ожидание этой оценки равно xГ . Выборочная средняя является и состоятельной оценкой генеральной средней. При увеличении объема выборки выборочная средняя стремится по вероятности к генеральной средней, а это и означает, что выборочная средняя есть состоятельная оценка генеральной средней.

Из сказанного следует также, что если по нескольким выборкам достаточно большого объема из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближенно равны между собой. В этом и состоит свойство ус-

тойчивости выборочных средних.

Групповая и общая средние

Допустим, что все значения количественного признака X совокупности, безразлично-генеральной или выборочной, разбиты на несколько групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти ее среднюю арифметическую.

Групповой средней xГР называют среднее арифметическое значений признака, принадлежащих группе.

Общей средней x называют среднее арифметическое значений признака, принадлежащих всей совокупности.

20

Зная групповые средние и объемы групп, можно найти общую среднюю: общая средняя равна средней арифметической групповых средних, взвешенной по объемам групп.

Исследование вариации в статистике и социально-экономиче- ских исследованиях имеет важное значение, так как величина вариации признака в статистической совокупности характеризует ее однородность. Вариация колебание, многообразие, изменяемость величины признака у отдельных единиц совокупности.

Генеральная дисперсия

Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику – генеральную дисперсию.

Генеральной дисперсией DГ называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения xГ

Если все значения

x1.x2 ,K, xN

признака генеральной совокуп-

ности объема N различны, то

 

 

 

 

 

 

 

 

 

 

 

N (xi

 

 

)2

 

 

DГ

= σГ 2 =

xГ

– невзвешенная;

 

i=1

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

Если же значения признака

x1.x2 ,K, xk генеральной совокуп-

ности имеют

соответственно

частоты N1,N2 ,K, Nk , причем

N1 + N2 +K+ Nk = N , то

 

 

 

 

 

 

 

 

 

 

 

 

 

k (xi

 

)2 Ni

DΓ

= σΓ 2 =

xΓ

i=1

 

 

 

– взвешенная.

 

k

 

 

 

 

 

 

Ni

 

 

 

i=1

21

Как и любая средняя, дисперсия имеет определенные математические свойства:

а) если все значения признака xi уменьшить (увеличить) на определенную величину, дисперсия не изменится;

б) если все значения признака изменить в К раз, то дисперсия изменится в К² раз;

в) в случае замены частот долями дисперсия не изменится.

Генеральным средним квадратическим отклонением назы-

вают корень квадратный из генеральной дисперсии:

 

N (xi

 

 

 

)2

 

 

σГ =

 

xГ

 

 

i=1

– невзвешенное;

N

 

 

 

 

k (xi

 

)2 Ni

σΓ =

xΓ

i=1

 

– взвешенное.

k

 

 

Ni

 

 

 

i=1

 

 

Среднее квадратическое отклонение имеет размерность признака.

Выборочная дисперсия

Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака X выборки вокруг своего среднего значения xВ , вводят сводную характеристику – выборочную дисперсию.

Выборочной дисперсией DВ называют среднее арифметическое квадратов отклонений наблюдаемых значений признака выборочной совокупности от их среднего значения xВ

Если все значения

x1.x2 ,K,xn признака выборочной совокупно-

сти объема n различны,

то

22

 

 

 

 

n (xi

 

 

)2

 

 

 

 

DВ = σВ

2

=

xВ

 

 

 

 

 

i=1

 

 

 

 

 

 

– невзвешенная;

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

Если же значения признака x1.x2 ,K,xk

выборочной совокупно-

сти имеют соответственно

частоты

n1,n2 ,K,nk , причем

n1 + n2 +K+ nk = n , то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k (xi

 

)2 ni

 

DB = σB

2

=

xB

 

i=1

 

 

 

– взвешенная.

 

 

k

 

 

 

 

 

 

 

 

ni

 

 

 

 

i=1

Выборочным средним квадратическим отклонением назы-

вают корень квадратный из выборочной дисперсии:

 

n (xi

 

 

)2

 

 

σB =

xB

 

 

i=1

 

 

 

 

 

– невзвешенное;

 

 

n

 

 

 

 

 

 

 

k (xi

 

)2 ni

σB =

xB

 

i=1

 

 

– взвешенное.

 

 

k

 

 

 

 

ni

 

 

 

 

 

i=1

 

 

Среднее квадратическое отклонение имеет размерность признака.

Расчет дисперсии прямым способом в ряде случаев трудоемок. Упростить ее вычисления можно, используя расчет диспер-

сии по способу отсчета от условного нуля или способу моментов

по следующей формуле:

σВ2 = xкnAi 2 ni k 2 (xВ A)2 .

23

Формула расчета дисперсии по способу моментов имеет следующий вид:

σ 2 = k 2 (m2 m12 ),

где k – величина интервала;

А – условный нуль, в качестве которого используют середину интервала с наибольшей частотой;

 

 

 

x

A

 

 

 

 

i

 

 

ni

 

 

 

 

k

 

m1

=

 

 

 

 

– начальный момент первого порядка;

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

x

A 2

 

 

 

 

i

 

 

ni

 

 

 

 

 

k

 

m2

=

 

 

 

 

– начальный момент второго порядка.

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

В случае, когда А приравнивается к нулю и, следовательно, не вычисляются отклонения, формула принимает вид:

σ 2 = x2 (x)2 или σ 2 = xi2ni xini 2. ni ni

Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.

Допустим, что все значения количественного признака X совокупности, безразлично – генеральной или выборочной, разбиты на k групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти групповую среднюю и дисперсию признака, принадлежащих группе, относительно групповой средней.

24

Групповой дисперсией называют дисперсию значений признака, принадлежащих группе, относительно групповой средней, групповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака – фактора, положенного в основание группировки. Она исчисляется следующим образом:

DjΓp = (xi( j) x( j) )2 ni ,

ni

где ni – частота значений xi ; j – номер группы; xΓP(j ) – групповая средняя группы j; ni – объем группы j.

Зная дисперсию каждой группы, можно найти их среднюю арифметическую.

Внутригрупповой дисперсией называют среднюю арифмети-

ческую дисперсий, взвешенную по объемам групп:

DjBHΓP =

N j

DjΓp

,

 

n

 

 

 

 

 

где N j – объем группы j; n = N j

– объем всей совокупности.

Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней. Она рассчитывается по формуле:

DМЕЖГР = (x j nx)2 N j ,

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:

Dобщ = (xi nxi )2 ni .

где x – общая средняя.

25

Правило сложения дисперсий. Если совокупность состоит из нескольких групп, то общая дисперсия равна сумме межгрупповой и внутригрупповой дисперсий:

Dобщ = DВНГР + DМЕЖГР .

Согласно этому правилу, общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Оценка генеральной дисперсии по исправленной выборочной

Пусть из генеральной совокупности в результате n независимых наблюдений над количественным признаком X извлечена выборка объема n.

Требуется по данным выборки оценить неизвестную генеральную дисперсию. Если в качестве оценки генеральной дисперсии принять выборочную дисперсию. То эта оценка будет приводить к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Объясняется это тем, что выборочная дисперсия является смещенной оценкой генеральной дисперсии, другими словами, математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно

M[DB ]= nn1 DΓ ,

n

Умножив DB на дробь n-1 получим исправленную диспер-

сию S2 .

 

 

 

 

k

 

S 2 =

n

 

DB =

ni (xi xB )2

 

i=1

.

n 1

n 1

 

 

 

26

Исправленная дисперсия является несмещенной оценкой генеральной дисперсии. Действительно,

M[S2 ]= M nn1 DB = nn1M[DB ]= nn1 nn1 DΓ = DΓ .

Для оценки среднего квадратического отклонения генеральной совокупности используют исправленное среднее квадратическое отклонение, которое равно квадратному корню из исправленной дисперсии:

k

ni (xi xB )2

S =

i=1

 

.

 

n 1

 

 

 

В статистической практике для изучения и измерения вариации используют различные показатели (меры) вариации в зависимости от поставленных задач. Так, к абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Относи-

тельные показатели вариации – это коэффициенты осцилляции,

вариации, относительное линейное отклонение и др.

Размах вариации (R) является наиболее простым измерителем вариации признака. Он определяется как разность между наибольшим и наименьшим значениями варьирующего признака.

R = xmax xmin ,

где xmax , xmin – наибольшее и наименьшее значение варьирующего признака.

Среднее линейное отклонение ( d ) представляет собой сред-

нюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения:

27

d = xi x – невзвешенное среднее линейное отклонение; n

 

 

 

xi

 

ni

 

 

 

 

 

 

 

 

x

 

d =

– взвешенное среднее линейное отклонение.

 

 

 

 

 

ni

 

 

 

Символы xi , x, ni и n имеют то же значение, что и в предыдущей главе. Рассмотренные выше показатели имеют ту же размерность, что и признак, для которого они вычисляются.

Для целей сравнения колебания различных признаков в одной и той же совокупности или же при сравнении колебаний одного и того же признака в нескольких совокупностях вычисляются отно-

сительные показатели вариации. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха, или среднего линейного отклонения, или среднего квадратического отклонения к средней арифметической. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 %. Различают следующие относительные показатели вариации:

– коэффициент осцилляции – процентное отношение размаха вариации к средней величине признака:

VR = Rx 100 %,

– линейный коэффициент вариации процентное отноше-

ние среднего линейного отклонения к средней величине признака:

Vd = dx 100 %,

– коэффициент вариации процентное отношение среднего квадратического отклонения к средней величине признака:

Vσ = σx 100 %.

28

В качестве статистических характеристик вариационных рядов распределения рассчитываются так называемые структурные средние – мода и медиана.

Мода значение признака, наиболее часто встречающее в исследуемой совокупности.

Медиана значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.

Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда.

Для интервальных вариационных рядов мода определяется по формуле:

 

 

M0 = xM 0 +iM 0

fM 0 fM 0 1

 

 

 

,

 

 

( fM 0 fM 0 1) + ( fM 0 fM 0 +1)

где xM 0

– нижняя граница значения интервала, содержащего моду;

iM 0

– величина модального интервала;

fM 0

– частота модального интервала;

fM 0 1

– частота интервала, предшествующего модальному;

fM 0 +1

– частота интервала, следующего за модальным.

Медиана интервального ряда распределения определяется по формуле:

Me = xMe +iMe 1/ 2ffMeSMe1 ,

где xMe – нижняя граница значения интервала, содержащего медиану;

29