Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Курс лекций по статистике

.pdf
Скачиваний:
75
Добавлен:
03.06.2015
Размер:
2.98 Mб
Скачать

где fМо - частота модального интервала;

fМо-1 - частота интервала, предшествующего модальному; fМо+1 - частота интервала, следующего за модальным;

d - величина модального интервала;

X Мо - нижняя граница модального интервала.

Модальный интервал - это интервал, имеющий наибольшую частоту. Медиана – это варианта, которая находится в середине вариационного

ряда. Медиана делит ряд пополам, по обе стороны от нее находится одинаковое количество единиц совокупности.

Медиана в интервальном вариационном ряду с равными интервалами рассчитывается по формуле:

 

d( 1

f

i

S

Me 1

)

 

Me XMe

2

 

 

 

,

 

f Me

 

 

 

 

 

 

 

где d - величина медианного интервала;fi - сумма всех частот;

SМе-1 - накопленная частота интервала, предшествующего медианному; fМе - частота медианного интервала;

X Ме - нижняя граница медианного интервала.

Медианным интервалом называется первый интервал, накопленная частота которого больше или равна половине суммы всех частот.

SМе ≥ 0,5 fi

5.2. Показатели вариации

Вариация – это колеблемость, изменяемость величины признака у отдельных единиц совокупности. Это различие в значениях какого-либо признака у разных единиц совокупности в один и тот же период или момент времени.

Основные показатели, характеризующие вариацию: размах, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

К абсолютным показателям вариации относят размах вариации, сред-

нее линейное отклонение, среднее квадратическое отклонение, дисперсию.

Они позволяют оценить вариацию в единицах измерения исследуемой совокупности.

1. Размах вариации R:

R= Xmax – Xmin .

2.Среднее линейное отклонение L. Это средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней. Это именованная величина, выражается в единицах измерения признака.

В зависимости от исходных условий расчет ведется по формулам:простая средняя используется для несгруппированных данных:

 

 

 

 

 

 

L

 

Xi

X

;

 

 

 

 

n

 

 

 

 

 

 

 

взвешенная средняя используется для сгруппированных данных:

 

 

 

 

 

 

L

 

Xi X

fi

.

 

 

 

 

 

fi

 

 

 

3. Дисперсия σ2 - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней.

Дисперсия признака может принимать только положительное значение. Дисперсия постоянной величины равна нулю.

В зависимости от исходных данных она вычисляется по формулам:простая средняя используется для несгруппированных данных:

 

2

 

(X

i

 

X)2

;

 

 

 

 

 

n

 

 

 

 

 

взвешенная средняя используется для сгруппированных данных:

 

 

 

 

 

 

 

 

 

 

2

 

(X

i

 

X)2 fi

.

 

 

 

 

 

 

fi

 

 

 

 

 

Расчет дисперсии по способу моментов основан на свойствах диспер-

сии. Используется только в интервальных вариационных рядах с равными интервалами.

 

X

i

X

0

2

 

 

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

2

 

 

 

d2 (X X )2 .

 

 

f i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

Расчет дисперсии по формуле:

X2 (X)2 ,

 

где X2 - средняя из квадратов вариантов:

X2 (Xi )2 fi ;

fi

(X) 2 - квадрат средней арифметической:

 

 

 

 

 

Xifi

 

2

 

 

 

2

 

(X)

 

 

 

.

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

По правилу сложения дисперсий общая дисперсия является суммой межгрупповой и средней из внутригрупповых дисперсий.

4.Среднее квадратическое отклонение σ – это корень квадратный из дис-

персии.

Котносительным показателям вариации (показателям степени вари-

ации) относят коэффициент вариации, коэффициент осцилляции.

5.Наилучшей характеристикой для сравнения вариации различных совокупностей служит коэффициент вариации V. Это отношение среднего квад-

ратического отклонения к средней величине. Дает характеристику однородности совокупности.

V 100 . X

В отличие от абсолютных значений вариации коэффициент вариации измеряет колеблемость в относительном выражении, относительно среднего уровня, что во многих случаях предпочтительнее. Характеризует степень однородности совокупности. Если коэффициент вариации не превышает 33%, то совокупность по рассматриваемому признаку можно считать однородной.

Выяснение общего характера распределения предполагает оценку его однородности, а также вычисление показателей ассиметрии. Для симметричных распределений частоты любых двух вариант, равноотстоящих в обе стороны от центра распределения, равны между собой. Рассчитанные для таких распределений средняя, мода и медиана также равны.

Величина коэффициента ассиметрии может быть положительной и отрицательной. В первом случае речь идет о правосторонней ассиметрии, а во втором о левосторонней.

Если коэффициент асимметрии выше 0,5 (независимо от знака), то асимметрия считается значительной; если коэффициент меньше 0,25, то незначительной.

6.Выборочное наблюдение

6.1.Понятия, преимущества и научные принципы выборочного

наблюдения

Статистическое наблюдение – это планомерный, научно организованный сбор массовых данных о явлениях общественной жизни.

Статистическое наблюдение можно организовать как сплошное и несплошное. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности явлений, несплошное – лишь ее часть. К несплошному наблюдению относится и выборочное наблюдение.

Выборочное наблюдение - это такое наблюдение, при котором статистическому наблюдению подвергаются не все единицы изучаемой совокупности, а лишь отобранные в определенном порядке.

Цель выборочного наблюдения состоит в том, чтобы по характеристикам отобранной части единиц судить о характеристиках всей совокупности.

Основные причины, по которым во многих случаях выборочному наблюдению отдается предпочтение перед сплошным наблюдением, следующие.

Преимущества выборочного наблюдения:

Достижение большей точности результатов обследования благодаря сокращению ошибок регистрации (за счет работы более квалифицированных участников).

Экономия трудовых, денежных средств и времени в результате сокращения объема работы.

Возможность детального обследования каждой единицы наблюдения за счет расширения программы наблюдения.

Преимущества выборочного наблюдения по сравнению со сплошным можно обеспечить, если оно организовано и проведено в строгом соответствии с научными принципами выборочного наблюдения.

Научные принципы выборочного наблюдения:

Обеспечение случайности отбора единиц (при отборе каждой из единиц изучаемой совокупности обеспечивается равная возможность попасть в выборку).

Обеспечение достаточного числа отобранных единиц совокупности. Соблюдение этих принципов позволяет получить совокупность единиц,

которая по интересующим исследователя признакам представляет всю изучаемую совокупность, т.е. является репрезентативной (представительной).

6.2. Понятие генеральной и выборочной совокупности

Генеральная совокупность (N) – это вся исходная изучаемая статистическая совокупность, из которой на основе отбора единиц или групп единиц формируется совокупность выборочная.

Выборочная совокупность (n) – это совокупность отобранных единиц, по которым собирается информация.

Основные понятия и характеристики выборочного наблюдения

Основное понятие выборочного

 

Характеристика

наблюдения

 

 

 

 

 

 

 

Доля выборки

Отношение численности выборочной

 

совокупности к численности гене-

 

ральной совокупности:

 

 

 

 

k n : N .

 

Генеральная средняя

Среднее значение признака всей сово-

 

купности – x .

 

 

 

Выборочная средняя

Среднее значение признака у единиц,

 

которые

подверглись

 

выборочному

 

наблюдению:

 

 

xi fi

 

~

 

xi

~

 

 

x

n

или x

fi

 

 

 

 

 

Генеральная доля

Доля единиц, обладающих тем или

 

иным признаком в генеральной сово-

 

купности – p .

 

 

 

 

 

Выборочная доля

Доля единиц, обладающих тем или

 

иным признаком в выборочной сово-

 

купности:

 

 

 

 

 

 

 

 

 

w m : n,

 

 

где m – численность единиц, облада-

 

 

 

ющих определенным призна-

 

 

 

ком в выборочной совокупно-

 

 

 

сти.

 

 

 

 

 

 

 

 

 

Генеральная дисперсия

Дисперсия количественного признака

 

в генеральной совокупности –

2

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия количественного

2

 

~

2

2

 

~

2

fi

 

(xi x )

 

 

(xi x )

 

 

~

 

 

 

или ~

 

 

 

 

 

 

 

признака в выборочной

n

 

fi

 

 

 

x

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

совокупности

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия доли признака в

 

 

p2

p (1 p)

 

 

 

 

 

 

генеральной совокупности

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия доли признака в

 

 

w2

w (1 w)

 

 

 

 

 

 

выборочной совокупности

 

 

 

 

 

 

 

 

 

 

 

 

6.3. Ошибки выборочного наблюдения

При проведении выборочного наблюдения нельзя даже теоретически получить абсолютно точные данные, как при сплошном обследовании. Обусловлено это тем, что наблюдению подвергается не вся совокупность, а только ее часть, поэтому при проведении выборочного наблюдения неизбежна некоторая свойственная ему погрешность (ошибки).

Ошибки, свойственные выборочному наблюдению, называются ошиб-

ками репрезентативности.

Ошибка репрезентативности – это расхождение между выборочной характеристикой и характеристикой генеральной совокупности. Они возникают потому, что отобранная и обследованная совокупность недостаточно точно воспроизводит (репрезентирует) всю исходную совокупность в целом.

Виды ошибок репрезентативности

1.Систематические (возникают в результате нарушения научных принципов отбора единиц совокупности).

преднамеренные;

непредномеренные.

2.Случайные (возникают в результате несплошного характера наблюдения).

средняя (стандартная) ошибка выборки;

предельная ошибка выборки.

Теоретическим обоснованием появления случайных ошибок выборки является теория вероятности и ее предельные теоремы.

Сущность предельных теорем состоит в том, что в массовых явлениях совокупное влияние случайных причин на формирование закономерностей и обобщающих характеристик будет сколько угодно малой величиной или практически не зависит от случая.

Так как случайная ошибка выборки возникает в результате случайных различий между границами выборочной и генеральной совокупностей, при достаточно большом объеме выборки эта ошибка будет сколько угодно мала. Этот вывод, опирающийся на доказательства предельных теорем, позволяет

предполагать, что характеристики выборочного наблюдения могут достаточно хорошо представлять характеристики генеральной совокупности.

Случайные ошибки могут быть доведены до незначительных размеров, а главное, их размеры и пределы можно определить с достаточной точностью на основании закона больших чисел.

Средняя ошибка выборки (µ) – это такое расхождение между средними

~

 

 

 

х) , которое не превышает

выборочной и генеральной совокупностями ( х

.

 

 

 

Средняя ошибка выборки зависит от:

Объема выборки (чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки).

Степени варьирования признака (чем меньше вариация признака, а

следовательно, и дисперсия, тем меньше ошибка выборки, и наоборот). Формулы для определения величины средней ошибки выборки зависят

от методов и способов отбора.

Предельная ошибка выборки – это максимально возможное расхожде-

ние между средними выборочной и генеральной средних ( ~ , т.е. макси-

х х)

мум ошибки при заданной вероятности ее появления.

О величине предельной ошибки можно судить с определенной вероятностью, на величину которой указывает коэффициент доверия t. Табличные значения коэффициента следующие:

t

1,0

1,96

 

 

 

 

2,0

 

 

2,58

3,0

P(t)

0,683

0,950

 

 

 

0,954

 

 

0,990

0,997

Предельная ошибка выборки:

 

 

 

 

 

 

 

 

 

 

 

~ t ~

или

w

t

w

,

 

 

 

 

x

x

 

 

 

 

 

 

где – предельная ошибка выборки;

t– коэффициент доверия, зависящий от вероятности, с которой гарантируется предельная ошибка выборки

Чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью можно установить ее величину. Предельная ошибка выборки позволяет определять предельные значения характеристик генеральной совокупности при заданной вероятности и их доверительные интервалы.

Чем больше вариация признака, тем при прочих равных условиях ошибка выборки больше.

Например, при увеличении среднеквадратического отклонения в 2 раза объем повторной случайной выборки увеличится в 4 раза, т.к. в формуле стоит дисперсия, т.е. квадрат среднеквадратического отклонения.

Определение необходимой численности выборки

При подготовке выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно определить объем (численность) выборочной совокупности. Согласно одному из принципов выборочного наблюдения объем выборки должен быть достаточным, чтобы обеспечить репрезентативность выборки.

Формулы для определения необходимой численности выборки зависят от методов и способов отбора.

6.4.Методы, виды и способы отбора единиц из генеральной совокупности

В теории выборочного наблюдения разработаны различные методы, способы и виды отбора единиц из генеральной совокупности.

Методы отбора

Повторный. Каждая единица, отобранная в случайном порядке, после обследования возвращается в генеральную совокупность и в последующем отборе может снова попасть в выборку. При таком отборе вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется независимо от числа отобранных единиц.

Бесповторный. Каждая единица, отобранная в случайном порядке, после обследования в генеральную совокупность не возвращается. Вероятность попасть в выборку для каждой единицы генеральной совокупности увеличивается по мере производства отбора.

Так как бесповторный отбор охватывает все новые и новые совокупности, а повторный отбор на всем протяжении одну и ту же совокупность, бесповторный отбор дает более точные результаты, чем повторный.

Виды отбора

Индивидуальный. В выборочную совокупность отбираются отдельные единицы генеральной совокупности.

Групповой. В выборочную совокупность отбираются качественно однородные группы или серии изучаемых единиц.

Комбинированный. Происходит сочетание первого и второго видов отбора.

Способы отбора

1.Собственно – случайный

2.Механический

3.Типический

4.Серийный

5.Комбинированный

Понятие собственно - случайного отбора Собственно – случайный отбор – это отбор, при котором наблюдению

подвергается часть совокупности, отобранная из всей совокупности в случайном порядке.

Собственно – случайный отбор бывает повторным и бесповторным.

Основные формулы, используемые при собственно – случайном отборе

Показатель

 

 

Основные формулы

 

 

 

Повторная выборка

Бесповторная выборка

 

Средняя ошибка

 

 

 

 

 

 

 

 

 

~

 

~

n

 

 

2

 

 

2

 

 

 

выборки для средней

~

x

~

x (1

 

)

 

 

 

 

x

n

x

n

N

 

 

 

 

Средняя ошибка

w

 

w (1 w)

 

 

w

 

 

 

 

w (1 w)

(1

 

n

)

 

 

 

 

 

 

 

 

 

 

выборки для доли

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

N

Численность выборки

 

 

 

t

2

 

2

 

 

 

 

 

 

 

 

t

2

 

2

N

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

при определении сред-

 

n

 

 

 

x

 

 

n

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

2

 

2

 

 

 

 

 

него размера признака

 

 

 

 

 

~

 

 

 

 

 

 

 

 

N ~ t

 

 

~

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Численность выборки

n

 

t 2 w (1 w)

 

n

 

 

t 2 w (1 w) N

при определении доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2w

 

 

 

 

N 2w t 2

w (1 w)

признака

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Понятие механического отбора Механический отбор применяется в тех случаях, когда генеральная со-

вокупность каким-нибудь образом упорядочена, т. е. имеется определенная последовательность в расположении единиц (например, номера домов, списки избирателей).

При механическом отборе устанавливается шаг отсчета, т.е. расстояние между отбираемыми единицами (N/n – величина, обратная доле выборки) и начало отсчета – номер единицы, которая должна быть обследована первой.

Механический отбор всегда бывает бесповторный. При этом отборе применяются те же формулы, что и при собственно – случайном бесповторном отборе.

Механический отбор имеет преимущество перед случайным отбором, его не только легче организовать, но при нем единицы выборочной совокупности равномернее распределяются в генеральной совокупности.

Понятие типического отбора Типический отбор – это отбор, при котором генеральная совокупность

разбивается на качественно однородные типические группы, затем из каждой группы при помощи собственно – случайной или механической выборки проводится отбор единиц в выборочную совокупность.

Из всех типических групп можно отбирать число единиц, пропорциональное и непропорциональное их численности. В зависимости от этого раз-

личают пропорциональный и непропорциональный типический отбор.

Типический отбор бывает повторным и бесповторным.

Разбивка на типические группы дает возможность избежать влияния межгрупповой вариации на точность выборки. Так как в типическую выборку должны попасть представители всех групп, средняя ошибка типической выборки зависит только от средней из внутригрупповых дисперсий i2 , или

w (1 w), а не от общей дисперсии.

Основные формулы, используемые при типическом отборе

Показатель

 

 

 

 

 

 

 

 

Основные формулы

 

 

 

 

 

 

 

 

 

Повторная выборка

Бесповторная выборка

 

Средняя ошибка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выборки для средней

 

 

~

i

~

i

(1

n

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

n

 

x

 

n

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя ошибка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

 

 

w (1 w)

w

 

w (1 w)

(1

n

)

 

 

 

выборки для доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Численность выборки

 

 

 

 

 

 

 

i2

 

 

 

 

 

t 2

 

i2

 

 

 

 

 

 

 

 

 

 

t 2

 

 

 

 

 

 

N

 

 

 

 

 

 

n

 

 

 

n

 

 

 

 

 

при определении сред-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

N ~ t

2

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

i

 

него размера признака

 

 

 

 

 

~

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Численность выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

t 2

w (1 w)

 

n

 

 

t 2 w (1 w) N

 

при определении доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2w

 

N 2w t 2 w (1 w)

 

признака

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Понятие серийного отбора Серийный отбор – это такой отбор, когда в случайном порядке отби-

раются не единицы, подлежащие обследованию, а группы единиц (серии, гнезда). Внутри отобранных серий обследованию подвергаются все единицы, т.е. применяется сплошное наблюдение.

Поскольку внутри серий обследуются все единицы, средняя ошибка выборки равновеликих серий зависит от величины только межгрупповой дис-

персии - ~

или

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Серийный отбор бывает повторным и бесповторным.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Основные формулы, используемые при серийном отборе

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатель

 

 

 

 

 

 

 

 

Основные формулы

 

 

 

 

 

 

 

 

 

 

 

 

Повторная выборка

Бесповторная выборка

 

 

 

 

 

Средняя ошибка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

~

 

 

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

выборки для средней

 

~

 

 

 

х

 

 

 

 

 

~

 

 

x (1

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

r

 

 

 

 

 

x

 

 

r

 

 

 

 

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя ошибка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

выборки для доли

 

w

 

 

w

 

 

 

 

 

w

 

w (1

r

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

 

 

 

r

 

 

 

 

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Численность выборки

 

 

 

t

2

 

2

 

 

 

 

 

 

 

t

2

 

2

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

при определении сред-

 

n

 

 

 

 

x

 

 

 

 

n

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

R

 

 

2

 

2

 

2

 

 

него размера признака

 

 

 

 

~

 

 

 

 

 

 

 

~ t

 

~

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Численность выборки

 

n

t 2 w2

 

 

 

 

n

 

 

t 2 w2

R

 

 

 

 

 

 

при определении доли

 

 

 

 

 

 

 

 

 

 

 

 

 

2w

 

 

 

 

N 2w t 2

w (1 w)

признака

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обозначения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R – общее число серий;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r – число отобранных серий.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Межгрупповая дисперсия средней определяется по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

~

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

(хi x )

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

средняя i-й серии;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

средняя по всей выборочной совокупности.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Межгрупповая дисперсия доли определяется по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(wi

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

r

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где wi

доля признака i-й серии;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w – общая доля признака во всей выборочной совокупности.

6.5. Понятие малой выборки

Малая выборка – это несплошное статистическое обследование, численность единиц которого не превышает 30.

Для определенного способа отбора единиц величина стандартной ошибки зависит от объема выборки и степени колеблемости изучаемого признака в генеральной совокупности. Чем меньше объем выборки, тем большую величину стандартной ошибки следует ожидать, а это снижает точность оценки параметров генеральной совокупности.

Для оценки возможных пределов ошибки малой выборки применяется

отношение Стъюдента, определяемое по формуле:

~

t x x ,

М .В.

где М .В. величина среднего квадратического отклонения малой выборки, которая определяется по формуле:

М .В.

 

 

2

 

 

 

 

.

n 1

 

 

 

n 1

 

 

 

 

 

 

Величина вычисляется на основе данных выборочного наблюдения:

 

 

 

 

 

~

2

 

 

(xi x )

.

n

 

 

 

Таким образом, для теоретического распределения отношения Стъюдента t имеются величины, определяемые непосредственно по данным выборки. Для отдельных значений t и n доверительную вероятность малой выборки находят по специальным таблицам Стъюдента, которые приводятся в учебниках по математической статистике.

Предельная ошибка малой выборки определяется по формуле:

М .В. t М .В.

Порядок расчета тот же, что и при больших выборках.

6.6. Распространение данных выборочного наблюдения на генеральную совокупность

Конечной целью любого выборочного наблюдения является распространение его характеристик на генеральную совокупность.

Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы.

Формула для определения интервальной оценки генеральной совокупности:

~

~

~

х

~ х х

 

x

х

Таким образом, с заданной вероятностью можно утверждать, что значе-

ние генеральной средней можно ожидать в пределах от

~

~ до

~

~ .

х

х

 

 

x

 

х

Формула для определения интервальной оценки генеральной доли:

w w p w w .