- •Практическое занятие № 10
- •Тема 6: «Выборочный метод статистического наблюдения».
- •1. Основные понятия теории выборочного наблюдения.
- •2. Основные характеристики выборочной совокупности.
- •Вариант №1
- •Вариант №2
- •Вариант №3
- •Вариант №4
- •Вариант №5
- •Вариант №6
- •Вариант №7
- •Вариант №8
- •Вариант №9
- •Вариант №10
2. Основные характеристики выборочной совокупности.
Основная задача выборочного метода – определение ошибки выборки, т.к. если не известен размер ошибки, данные выборки не могут иметь практического значения. Результаты выборочного наблюдения тем точнее, чем меньше колеблемость изучаемого признака.
При выборочном наблюдении по количественному признаку ставится задача определить среднее значение этого признака в выборочной совокупности. Далее возникает вопрос, насколько это среднее значение типично или показательно, т.е. насколько правильно и точно характеризует среднее значение данную совокупность по изучаемому признаку. Для ответа на этот вопрос необходимо вычислить особый показатель - среднее квадратическое отклонение.
Судебная статистика, в частности
уголовно-правовая, чаще имеет дело
с качественными признаками. При
выборочном наблюдении интересующих
явлений по качественному признаку,
ставится задача установить долю
явлений, обладающих этим признаком.
Если долю явлений, обладающих данным
признаком, обозначить символом
,
то доля остальных явлений, не обладающих
этим признаком, будет определяться как
.
Действительно, если допустить, что
доля осужденных, совершивших хулиганство
в состоянии опьянения, составляет
90% (или 0,9), то очевидно, доля хулиганов
«трезвенников», будет равна разности:
100% — 90% (или 1-0,9), т.е. 10% (или 0,1).
Разработанная математической статистикой формула колеблемости отдельных вариантов ряда для совокупности явлений, исчисляемых по качественным признакам, выглядит следующим образом:
– дисперсия качественного признака.
Дисперсия – это средний квадрат отклонения изучаемого признака от среднего значения признака.
Напомним, дисперсия количественного признака определяется следующим образом:
.
Среднее квадратическое отклонение можно получить, извлекая квадратный корень из дисперсии:
- для качественного признака,
- для количественного признака.
Основной вопрос выборочного наблюдения заключается в том, насколько средняя выборочной совокупности отличается средней генеральной совокупности, т.е. как велика ошибка репрезентативности.
Ответ на вопрос, каким образом определить размер ошибки выборки, дает математическая теория выборочного метода.
При достаточно большом числе независимых наблюдений можно почти достоверно, утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым (теорема П.Л. Чебышева). На размерах ошибки выборки будет сказываться, с одной стороны, действие закона больших чисел: чем больше единиц попадает в выборку, тем будет меньше возможная ошибка, а с другой стороны размер ошибки зависит от колеблемости, пестроты обследуемых по определенному признаку единиц совокупности.
Для определения ошибки репрезентативности, обозначаемой в статистике W, рекомендуется пользоваться следующими двумя формулами:
- для количественного
признака;
- для качественного признака.
где W - средняя
ошибка репрезентативности;
- показатель колеблемости количественного
признака (
- среднее квадратическое отклонение);
п - число единиц, попавших в выборку;
Р - доля данного качественного
признака в выборке
- доля противоположного признака.
Правило трех сигм. Необходимо
отметить, что данное правило можно
использовать для случайных величин,
имеющих нормальный закон распределения.
Следующее свойство среднего квадратического
отклонения позволяет правильно
оценить надежность выборочных показателей.
Если площадь, ограниченную кривой
нормального распределения, принять
за 1 или 100%, то площадь, заключенная в
пределах 1
вправо и влево от средней арифметической,
составит 0,683 всей площади. Это означает,
что 68,3% всех изученных вариант отклоняется
от средней арифметической не более чем
на 1
,
т.е. находится в пределах
.
Интервал значений от
до
принято называть первым доверительным
интервалом.
Рис 2. Правило трех .
Площадь, заключенная в пределах 2
вправо и влево от средней арифметической,
составляет 0,954 всей площади, т.е. 95,4% всех
единиц совокупности находится в пределах
.
Интервал значений от
до
принято называть вторым доверительным
интервалом. Площадь, заключенная в
пределах 3
влево и вправо от средней арифметической,
составляет 0,997 всей площади, или 99,7% всех
единиц совокупности находится в пределах
.
Интервал значений от
до
принято называть третьим доверительным
интервалом.
ПРАКТИЧЕСКИЕ ЗАДАНИЯ И ПОРЯДОК ИХ ВЫПОЛНЕНИЯ
Для закрепления изученного материала предлагается выполнить практические задания по расчету характеристик выборочной совокупности. Для этого воспользуемся персональным компьютером и офисными приложениями Word и Excel.
Порядок выполнения заданий №1. При выборочном наблюдении получены данные о возрасте осужденных.
Выборочная совокупность
Возраст |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
Количество осужденных |
3 |
4 |
5 |
10 |
7 |
3 |
1 |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Возраст |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
Количество осужденных |
5 |
8 |
14 |
25 |
17 |
12 |
8 |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Решение
Определим среднее значение признака для выборочной совокупности, учитывая, что частоты вариант различны. Поэтому для расчета воспользуемся формулой взвешенной средней арифметической
,
получим
.
Далее рассчитаем среднее квадратическое отклонение по данным выборочной совокупности, для этого воспользуемся выражением
,
в результате получаем
.
Найдем ошибку репрезентативности выборочных данных
,
где n – объем выборочной
совокупности, его можно найти как сумму
частот, т.е.
.
Определим первый доверительный интервал
или (22,5÷23,1), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.
Определим второй доверительный интервал
или (22,2÷23,4), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.
Определим третий доверительный интервал
или (19,9÷23,7), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.
Для определения в какой доверительный интервал попадает среднее значение признака для генеральной совокупности определим это значение:
.
Значение
оказывается в интервале (22,2÷23,4), с
вероятностью 0,954.
Порядок выполнения заданий №2. В
порядке случайной выборки обследовано
700 заключенных из 4000. В результате
наблюдения установлено, что доля
заключенных, совершивших преступление
в состоянии опьянения, составила 0,7 или
70 %. Необходимо определить ошибку
репрезентативности выборочных данных,
рассчитать доверительные интервалы,
если коэффициенты доверия принимают
значения
,
,
.
Решение
Для определения ошибки репрезентативности при исследовании качественного признака необходимо воспользоваться выражением:
,
где п – объем выборки, Р - доля исследуемого качественного признака в выборке (совершение преступления в состоянии опьянения), а - доля противоположного признака.
Подставляя имеющиеся данные получим
или
1,7 %.
Определим первый доверительный интервал
или (68,3% ÷ 71,7%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.
Определим второй доверительный интервал
или (66,6% ÷ 73,4%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.
Определим третий доверительный интервал
или (64,9% ÷ 75,1%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.
