- •Выборочное наблюдение
- •1. Общая характеристика выборочного наблюдения
- •Основные этапы выборочного наблюдения:
- •2. Ошибки выборки при собственно случайном отборе Виды случайного отбора
- •Ошибки выборки при случайном повторном отборе
- •Ошибки выборки при случайном бесповторном отборе
- •3. Основные способы формирования выборочной совокупности
- •4. Определение необходимой численности выборки
- •5. Малая выборка
- •6. Распространение результатов выборочного наблюдения на генеральную совокупность
- •7. Общие понятия и схема статистической проверки гипотез
- •8. Проверка гипотез о средней и о доле Гипотезы о средней
- •Гипотезы о доле
- •9. Практика применения выборочного метода наблюдения
- •Список использованной литературы
5. Малая выборка
Приведенные в параграфах 2 — 4 формулы средней ошибки выборки показывают, что ее величина зависит от объема выборки n, степени колеблемости изучаемого признака в генеральной совокупности и способа отбора. Для собственно случайной повторной выборки
(5.1)
Если
объем выборки достаточно велик, единицей
в знаменателе можно пренебречь. На
практике иногда приходится отбирать
из генеральной совокупности небольшое
число единиц. В этом случае использование
в формуле (5.1) вместо
величины n может значительно повлиять
на результат, т.е. занизить среднюю
ошибку выборки. Как правило, выборка
считается малой,
если
обследуется не более 30 единиц. Таким
образом, средняя
ошибка малой выборки
при
собственно случайном или механическом
повторном отборе рассчитывается по
формуле
(5.2)
В условиях малой выборки дисперсия выборочной совокупности не может рассматриваться в качестве оценки генеральной дисперсии.
Второе отличие заключается в том, что в выборках большого объема вероятность появления определенного нормированного отклонения выборочной средней от генеральной подчиняется нормальному закону распределения независимо от того, как распределены единицы в генеральной совокупности. Как следует из центральной предельной теоремы, предположение о нормальном распределении всех возможных значений выборочной средней и соответствующей величины t справедливо только при значительном объеме выборки.
В
условиях малой выборки характер
распределения единиц в генеральной
совокупности оказывает влияние на
вероятность появления той или иной
ошибки выборки. В условиях нормально
распределенной генеральной совокупности
при п
<
30 нормированное отклонение выборочной
средней от генеральной
и соответствующая вероятность подчинены
закону распределения Стьюдента, открытому
в 1908 г. английским математиком У. Госсетом
(псевдоним — Стьюдент).
Графически распределение Стьюдента имеет вид одновершинной кривой, которая симметрична относительно оси ординат и при увеличении объема выборки приближается к кривой нормального распределения (рис. 5.1). При п > 100 вероятность наступления того или иного значения t, найденная в соответствии с распределением Стьюдента, практически совпадает с соответствующей величиной интеграла вероятностей Лапласа. При 30 ≤ n ≤ 100 расхождения между указанными значениями невелики, поэтому на практике данное распределение используется лишь для n < 30.
Рис. 5.1. Кривые нормального распределения и распределения Стьюдента (при v = 3)
Согласно распределению Стьюдента, плотность распределения для нормированного отклонения выборочной средней от генеральной определяется по формуле
(5.3)
где v – число степеней свободы.
При определении выборочной дисперсии необходимо знать среднее значение признака, поэтому v = n – 1.
Гамма-функция имеет вид
.
(5.4)
Последовательно
подставляя в формулу (5.4) вместо u
значения
и
,
можно получить значения гамма-функции,
которые необходимо использовать при
расчете плотности распределения ошибок
малой выборки.
Вероятность того, что нормированное отклонение выборочно средней от генеральной не превысит заданного значения t, будет равна площади, ограниченной кривой распределения Стьюдента и осью абсцисс в интервале от –∞ до t:
(5.5)
Формула (5.5) свидетельствует о том, что в условиях малой выборки вероятность появления той или иной ошибки зависит не только от t, но и от объема выборки, так как v = n – 1. Чем меньше n, тем медленнее указанная кривая приближается к оси абсцисс (см. рис. 5.1). Следовательно, при малой выборке вероятность больших отклонений выборочной средней от генеральной более высока.
Найденное по формуле (5.5) значение функции S(t) — это вероятность того, что фактический коэффициент доверия tфакт ≤ t. Следовательно, (1 – S(t)) — вероятность того, что tфакт > t. Если рассматривать абсолютную величину нормированного отклонения, т.е. | tфакт |, то вероятность ее выхода за заданные пределы t
P ( | tфакт | > | t | )=2 [ 1 – S (t)].
Вероятность того, что это отклонение будет находиться в пределах от –t до +t,
P ( | tфакт | > | t | ) = 1 – P (| tфакт | > | t |) = 1– 2[ 1– S(t)] = 2S(t) –1. (5.6)
Кроме
того, эта величина равна вероятности
попадания среднего значения признака
в генеральной совокупности в пределы
,
где
–
предельная ошибка малой выборки.
Величины S(t) для разных значений t и v табулированы, поэтому в каждом конкретном случае нет необходимости выполнять расчет по формуле (5.5). Соответствующие таблицы могут быть представлены двумя способами:
искомая вероятность P(t) или S(t) находится на пересечении строки, соответствующей значению коэффициента доверия t, и столбца, соответствующего числу степеней свободы v или объему выборки n, так как v = n – 1 (см. Приложение 2);
в клетках таблицы указывается значение коэффициента доверия t, соответствующее определенному числу степеней свободы v и некоторым наиболее часто употребляемым значениям доверительной вероятности P(t) (0,90; 0,95; 0,99) или уровню значимости, равному α = 1 – P(t) (0,10; 0,05; 0,01) (см. Приложение 3).
В статистических таблицах вероятности S(t) и P(t) не тождественны:
S(t) – вероятность того, что фактическое значение нормированного отклонения выборочной средней от генеральной будет не больше, чем табличное значение, т.е. S(t) = P ( фактt ≤ t );
P(t) — вероятность того, что tфакт по абсолютной величине не превосходит значение | t |, т.е. P(t)= P( |t| ≤ | t |) = 2S(t) – 1.
Пример. В результате выборочной проверки налоговой инспекцией 10 промышленных предприятий города средняя доля документально неоформленных работ на них составила 17%. Определить вероятность того, что в генеральной совокупности доля документально неоформленных работ не превышает 25%.
Для нахождения средней ошибки малой выборки необходимо знать ее дисперсию:
σ2 = w (1 – w) = 0,17 (1 – 0,17 ) = 0,1411.
В таком случае
,
.
Следовательно,
,
отсюда
при
v = n –1=9. По таблице Приложение 3 находим:
при t = 0,64 и n = 10 вероятностью S(t) = 0,718.
Таким
образом, с вероятностью 0,718 можно
утверждать, что доля документально
неоформленных работ на всех предприятиях
города не превышает 25%.
Пример. При выборочном обследовании налоговой инспекцией 15 обменных пунктов города было установлено, что разница между курсом покупки и курсом продажи в среднем составляет 84 коп. за 1 долл. при среднем квадратическом отклонении 10 коп. С вероятностью 0,95 определить пределы, в которых находится разница между курсом покупки и курсом продажи валюты во всех обменных пунктах города.
Средняя ошибка малой выборки
Так
как P(t)=
0,95, то
.
При
n=15
(т.е. v
= 15 – 1 = 14) и S(t)
= 0,975
по таблице Приложения 2 определяем, что
значение t находится между 2,1 и 2,2. Более
точно установить эту величину позволяет
таблица Приложения 3: при v
= 14 и α
= 1 – P(t)
= 0,05 соответствующее значение t
= 2,145.
Следовательно, предельная ошибка выборки
Пределы, в которых находится разница между курсом покупки и курсом продажи валюты, при найденном значении предельной ошибки выборки составляют
т.е.
,
или
С вероятностью 0,95 можно утверждать, что в генеральной совокупности разница между курсом покупки и курсом продажи валюты составляет от 78 до 90 коп.
Выводы, сделанные на основе малой выборки, справедливы лишь при нормальном распределении значений изучаемого признака в генеральной совокупности. Поэтому использование малой выборки для оценки доли и средней в генеральной совокупности целесообразно в том случае, если исследователь не располагает необходимыми ресурсами для проведения выборки большего объема или если выборочное обследование связано с порчей единиц наблюдения (например, при проверке качества продуктов питания).
