Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПРЗ 10 Тема 6 2013.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
229.38 Кб
Скачать

2. Основные характеристики выборочной совокупности.

Основная задача выборочного метода – определение ошибки выборки, т.к. если не известен размер ошибки, данные выборки не могут иметь практического значения. Результаты выборочного на­блюдения тем точнее, чем меньше колеблемость изучае­мого признака.

При выборочном наблюдении по количественному приз­наку ставится задача определить среднее значение этого признака в выборочной совокупности. Далее возникает вопрос, насколько это среднее значение типично или показательно, т.е. насколько правильно и точно характе­ризует среднее значение данную совокупность по изучаемому признаку. Для от­вета на этот вопрос необходимо вычис­лить особый показатель - среднее квадратическое отклонение.

Судебная статистика, в частности уголовно-правовая, чаще име­ет дело с качественными признаками. При выборочном наблюдении интересующих явлений по качественному признаку, ставится задача установить долю явлений, обладающих этим признаком. Если долю явлений, обладающих данным призна­ком, обозначить символом , то доля остальных явлений, не обла­дающих этим признаком, будет определяться как . Действительно, если допустить, что доля осужденных, совершивших хулиганство в со­стоянии опьянения, составляет 90% (или 0,9), то очевидно, доля ху­лиганов «трезвенников», будет равна разности: 100% — 90% (или 1-0,9), т.е. 10% (или 0,1).

Разработанная математической статистикой формула колеблемо­сти отдельных вариантов ряда для совокупности явлений, исчисляе­мых по качественным признакам, выглядит следующим образом:

– дисперсия качественного признака.

Дисперсия – это средний квадрат отклонения изучаемого признака от среднего значения признака.

Напомним, дисперсия количественного признака определяется следующим образом:

.

Среднее квадратическое отклонение можно получить, извлекая квадратный корень из дисперсии:

- для качественного признака,

- для количественного признака.

Основной вопрос выборочного наблюдения заключается в том, насколько средняя выборочной совокупности отличается средней гене­ральной совокупности, т.е. как велика ошибка репрезентативности.

Ответ на вопрос, каким образом определить размер ошибки вы­борки, дает математическая теория выборочного метода.

При достаточно большом числе независимых наблюдений мож­но почти достовер­но, утверждать, что отклонение выборочной средней от гене­ральной будет сколько угодно малым (теорема П.Л. Чебышева). На размерах ошибки выборки будет сказываться, с одной стороны, действие закона больших чисел: чем больше единиц попадает в выборку, тем будет меньше возможная ошибка, а с другой стороны размер ошибки зависит от колеблемости, пе­строты обследуемых по определенному признаку единиц совокуп­ности.

Для определения ошибки репрезентативности, обозначае­мой в статистике W, рекомендуется пользоваться следующими двумя формулами:

- для количественного признака;

- для качественного признака.

где W - средняя ошибка репрезентативности; - показатель колеб­лемости количественного признака ( - среднее квадратическое от­клонение); п - число единиц, попавших в выборку; Р - доля данного качественного признака в выборке - доля противо­положного признака.

Правило трех сигм. Необходимо отметить, что данное правило можно использовать для случайных величин, имеющих нормальный закон распределения. Следующее свойство среднего квадратического отклонения позво­ляет правильно оценить надежность выборочных показателей. Если пло­щадь, ограниченную кривой нор­мального распределения, принять за 1 или 100%, то площадь, заключенная в пределах 1 вправо и влево от средней арифметической, составит 0,683 всей площади. Это означает, что 68,3% всех изученных вариант откло­няется от средней арифметической не более чем на 1 , т.е. находится в пре­делах . Интервал значений от до принято называть первым доверительным интервалом.

Рис 2. Правило трех .

Площадь, заключенная в преде­лах 2 вправо и влево от средней арифметической, составляет 0,954 всей площади, т.е. 95,4% всех единиц совокупности находится в пре­делах . Интервал значений от до принято называть вторым доверительным интервалом. Площадь, заключенная в пределах 3 влево и вправо от средней арифметической, составляет 0,997 всей площади, или 99,7% всех единиц совокупности находится в пределах . Интервал значений от до принято называть третьим доверительным интервалом.

ПРАКТИЧЕСКИЕ ЗАДАНИЯ И ПОРЯДОК ИХ ВЫПОЛНЕНИЯ

Для закрепления изученного материала предлагается выполнить практические задания по расчету характеристик выборочной совокупности. Для этого воспользуемся персональным компьютером и офисными приложениями Word и Excel.

Порядок выполнения заданий №1. При выборочном наблюдении получены данные о возрасте осужденных.

Выборочная совокупность

Возраст

20

21

22

23

24

25

26

Количество осужденных

3

4

5

10

7

3

1

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

Генеральная совокупность

Возраст

20

21

22

23

24

25

26

Количество осужденных

5

8

14

25

17

12

8

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

Решение

Определим среднее значение признака для выборочной совокупности, учитывая, что частоты вариант различны. Поэтому для расчета воспользуемся формулой взвешенной средней арифметической

,

получим .

Далее рассчитаем среднее квадратическое отклонение по данным выборочной совокупности, для этого воспользуемся выражением

,

в результате получаем .

Найдем ошибку репрезентативности выборочных данных

,

где n – объем выборочной совокупности, его можно найти как сумму частот, т.е. .

Определим первый доверительный интервал

или (22,5÷23,1), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.

Определим второй доверительный интервал

или (22,2÷23,4), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.

Определим третий доверительный интервал

или (19,9÷23,7), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.

Для определения в какой доверительный интервал попадает среднее значение признака для генеральной совокупности определим это значение:

.

Значение оказывается в интервале (22,2÷23,4), с вероятностью 0,954.

Порядок выполнения заданий №2. В порядке случайной выборки обследовано 700 заключенных из 4000. В результате наблюдения установлено, что доля заключенных, совершивших преступление в состоянии опьянения, составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы, если коэффициенты доверия принимают значения , , .

Решение

Для определения ошибки репрезентативности при исследовании качественного признака необходимо воспользоваться выражением:

,

где п – объем выборки, Р - доля исследуемого качественного признака в выборке (совершение преступления в состоянии опьянения), а - доля противо­положного признака.

Подставляя имеющиеся данные получим

или 1,7 %.

Определим первый доверительный интервал

или (68,3% ÷ 71,7%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.

Определим второй доверительный интервал

или (66,6% ÷ 73,4%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.

Определим третий доверительный интервал

или (64,9% ÷ 75,1%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]