Определения выборки:
1. Выборка – это некоторая часть объектов генеральной совокупности, которая выступает в качестве объектов непосредственного изучения. 2. Выборка (sample, set) — конечный набор прецедентов (объектов, случаев, событий, испытуемых, образцов, и т.п.), некоторым способом выбранных из множества всех возможных прецедентов, называемого генеральной совокупностью. 3. Выборка (Выборочная совокупность). Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.
Репрезентативность – свойство выборки воспроизводить характеристики генеральной совокупности. Таким образом, выборка должно быть копией генеральной совокупности относительно характеристик, существующих для цели исследования. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.
ПРИМЕР
Пример 1. Вычисление среднего значения и доверительного интервала для непрерывного количественного признака.
Для оценки скорости расчета с кредиторами в банке проведена случайная выборка 10 платежных документов. Их значения оказались равными (в днях): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.
Необходимо с вероятностью Р = 0,954 определить предельную ошибку Δвыборочной средней и доверительные пределы среднего времени расчетов.
Решение. Среднее значение вычисляется по формуле из табл. 9.1 для выборочной совокупности
![]()
Дисперсия вычисляется по формуле из табл. 9.1.
![]()
Средняя
квадратическая погрешность
дня.
Ошибка средней вычисляется по формуле:
![]()
т.е. среднее значение равно x ± m = 12,0 ± 2,3 дней.
Достоверность среднего составила
![]()
Предельную
ошибку вычислим по формуле из табл. 9.3
для повторного отбора, так как численность
генеральной совокупности
неизвестна,
и для Р
= 0,954уровня
достоверности.
![]()
Таким образом, среднее значение равно `x ± D = `x ± 2m = 12,0 ± 4,6, т.е. его истинное значение лежит в пределах от 7,4 до16,6 дней.
Использование таблицы Стьюдента. Приложения позволяет заключить, что для n = 10 — 1 = 9 степеней свободы полученное значение достоверно с уровнем значимости a £ 0,001, т.е. полученное значение среднего достоверно отличается от 0.
Задача
1. Для
определения скорости расчетов с
кредиторами предприятий корпорации в
коммерческом банке была проведена
случайная выборка 100 платежных документов,
по которым средний срок перечисления
и получения денег оказался равным 22
дням (
= 22)
со стандартным отклонением 6 дней (S=
6).
Необходимо
с вероятностью Р
= 0,954
определить предельную ошибку
выборочной средней и доверительные
пределы средней продолжительности
расчетов предприятий данной
корпорации.
Решение. Предельную
ошибку
= t
определяем
по формуле повторного отбора (6.20),
так как численность генеральной
совокупности N неизвестна.
Из представленных значений Ф (t)
(см. с. 98) для вероятности Р =
0,954 находим t
=
2.
Следовательно,
предельная ошибка выборки,
дней:
Предельная
относительная ошибка выборки,
%:
Генеральная
средняя будет равна
=
±
,
а доверительные интервалы (пределы)
генеральной средней исчисляем, исходя
из двойного неравенства:
![]()
![]()
Таким
образом, с вероятностью 0,954 можно
утверждать, что средняя продолжительность
расчетов предприятий данной корпорации
колеблется в пределах от 20,8 до 23,2
дней.
Задача
2. Среди
выборочно обследованных 1000 семей региона
по уровню душевого дохода (выборка
2%-ная, механическая) малообеспеченных
оказалось 300 семей.
Требуется
с вероятностью 0,997 определить долю
малообеспеченных семей во всем
регионе.
Решение. Выборочная
доля (доля малообеспеченных семей среди
обследованных семей) равна:
По представленным
ранее данным Ф(t)
для вероятности 0,997 находим t
=
3 (см. с. 99). Предельную ошибку доли
определяем по формуле бесповторного
отбора (механическая выборка всегда
является бесповторной):
Предельная
относительная ошибка выборки,
%:
Генеральная
доля
а
доверительные пределы генеральной
доли исчисляем, исходя из двойного неравенства:
В
нашем примере:
Таким
образом, почти достоверно, с вероятностью
0,997 можно утверждать, что доля
малообеспеченных семей среди всех семей
региона колеблется от 28,6 до 31,4%.
Задача
3. Для
определения урожайности зерновых
культур проведено выборочное
обследование 100 хозяйств региона
различных форм собственности, в результате
которого получены сводные данные
(табл.6.1). Необходимо с вероятностью
0,954 определить предельную ошибку
выборочной средней и доверительные
пределы средней урожайности зерновых
культур по всем хозяйствам
региона.
Таблица
6.1
Распределение
урожайности по хозяйствам региона,
имеющим различную форму собственности
|
Хозяйства (по формам собственности) |
Количество обследованных хозяйств f |
Средняя урожайность, ц/га xi |
Дисперсия урожайности в каждой группе Si2 |
|
Коллективные Акционерные общества Крестьянские (фермерские) |
30 50 20 |
18 20 28 |
15 25 40 |
|
Итого |
100 |
— |
— |
Решение. Поскольку
обследованные хозяйства региона
сгруппированы по формам собственности,
предельную ошибку средней
урожайности определяем
по формуле для
типической выборки, осуществляемой
методом повторного отбора (численность
генеральной совокупности N
неизвестна):
В
этой формуле неизвестна средняя из
внутригрупповых дисперсий.
Она
исчисляется по формуле:
По
представленным ранее (см. с. 98) данным Ф (t)
для вероятности Р =0,954
находим t
=
2.
Тогда
предельная ошибка выборки,
ц/га:
Генеральная
средняя:
=
±
.
Для нахождения
ее границ вначале нужно исчислить
среднюю урожайность по выборочной
совокупности
,
ц/га:
Предельная
относительная ошибка выборки,
%:
Доверительные
пределы генеральной средней исчисляем,
исходя из двойного
неравенства:
![]()
Таким
образом, с вероятностью 0,954 можно
гарантировать, что средняя урожайность
зерновых культур по региону будет не
менее чем 20 ц/га, но и не более чем 22
ц/га.
Определение
необходимого объема выборки. При
проектировании выборочного наблюдения
с заранее заданным значением допустимой
ошибки выборки очень важно правильно
определить численность (объем)
выборочной совокупности, которая с
определенной вероятностью обеспечит
заданную точность результатов
наблюдения. Формулы для определения
необходимой численности выборки п легко
получить непосредственно из формул
ошибок выборки.
Так,
из формул предельной ошибки выборки
для повторного
отбора нетрудно
(предварительно возведя в квадрат обе
части равенства) выразить необходимую
численность выборки:
• для
средней количественного
признака
(29)
• для
доли (альтернативного
признака)
(30)
Аналогично
из формул предельной ошибки выборки
для бесповторного
отбора находим,
что
(для
средней);
(31)
(для
доли).
(32)
Эти
формулы показывают, что с увеличением
предполагаемой ошибки выборки
значительно уменьшается необходимый
объем выборки.
Для
расчета объема выборки нужно знать
дисперсию. Она может быть заимствована
из проводимых ранее обследований данной
или аналогичной совокупности, а если
таковых нет, тогда для определения
дисперсии надо провести специальное
выборочное обследование небольшого
объема.
