
- •Мат.Статистика
- •1)Измерение социальных явлений и процессов. Измерительные шкалы: номинальные, ранговые (порядковые) и интервальные.
- •6) Интервальные оценки неизвестных параметров распределения по выборке. Доверительная вероятность. Доверительные интервалы.
- •7) Задачи интервального оценивания параметров нормального закона распределения.
- •8) Расчет объема выборочной совокупности.
- •9)Проверка статистических гипотез. Понятие статистической гипотезы. Уровень значимости. Нулевая гипотеза.
- •10)Проверка гипотезы о равенстве средних.
- •11) Проверка гипотез о законе распределения
- •12) Ранговый критерий проверки статистических гипотез Ван-дер-Вардена.
- •13) Понятие корреляционной зависимости между выборочными случайными величинами.
- •14) Связь номинальных признаков. Таблицы сопряженности. Коэффициент ассоциации Пирсона.
- •15) Связь порядковых признаков. Коэффициент корреляции рангов Спирмена.(первая чать вопроса не найдена!!!!!)
- •16) Связь количественных признаков. Корреляционная таблица. Линейный коэффициент корреляции. Уравнение регрессии.
- •Коэффициент линейной корреляции Пирсона
- •Уравнение регрессии
- •17) Случайное событие. Составные и элементарные события.
- •18) Достоверное и невозможное событие. Полная группа событий.
- •19) Произведение и сумма событий.
- •20) Понятие вероятности события. Классическая формула расчета вероятностей. Свойства вероятностей.
- •21) Независимые и зависимые события. Условная вероятность. Теорема умножения вероятностей.
- •22) Несовместные и совместные события. Теорема сложения вероятностей.
- •23) Формула полной вероятности. Формула Байеса.
- •24) Понятие дискретной случайной величины. Закон распределения. Ряд распределения. Функция распределения дискретной случайной величины.
- •25) Математическое ожидание и дисперсия дискретной случайной величины. Среднее квадратическое отклонение.
- •26) Функция распределения, плотность распределения непрерывной случайной величины, их взаимосвязь и свойства.
- •27) Математическое ожидание и дисперсия непрерывной случайной величины. Среднее квадратическое отклонение
- •28) Плотность распределения непрерывной случайной величины. Закон равномерной плотности.
- •29) Нормальный закон распределения случайной величины.
- •30) Функция Лапласа. Вероятность попадания величины, распределенной по нормальному закону, на заданный интервал.
- •31) Закон больших чисел.
- •32) Центральная предельная теорема Ляпунова.
8) Расчет объема выборочной совокупности.
Каждый исследователь, желающий получить достоверные данные о генеральной совокупности изучаемых явлений и процессов, стоит перед проблемой определения объема выборочной совокупности (я). Он определяется исходя из заданных и наличных показателей. Заданными показателями в этом случае будут предельная ошибка репрезентативности (W или А), коэффициент доверия (0, а наличными — дисперсия (о) изучаемых признаков и (в некоторых случаях) численность генеральной совокупности (W).
Формулы расчета выборочной совокупности выводятся из формул расчета ошибок репрезентативности.
р( — р) Из формулы W = J-i-----'-, по которой рассчитывается ошибка
повторной выборки качественного признака при коэффициенте доверия /= 1, может быть легко вычислен объем выборки. Для
131
этого необходимо знать значение удельного веса признака и задать предельную ошибку выборки. Обратимся к известному примеру. Доля лиц, совершивших преступления в состоянии опьянения (Р), составляла 35%, или 0,35. Предельную ошибку (W) зададим равной ± 5%, или 0,05. В этом случае
^ Р( - Р) = 0,35(1 W
• 0,35)
0,0025
= 91 преступление (дело, статкарта, приговор).
Если задать ошибку, равной ± 4%, то следует изучить 143 единицы, ± 3% - 225, ±296- 575 и т.д.
Из формулы W = J— , по которой
I П
определяется однократная
ошибка повторной выборки количественного признака, объем выборочной совокупности можно рассчитать после нахождения дисперсии (о) и необходимой предельной ошибки выборки (W). Вновь обратимся к примеру о сроках лишения свободы. В нем а = = 2,29 года, W= ± 0,15 года. Найдем объем выборочной совокупности (/?):
2,29 0,0225
= 102 единицы.
Это означает, что если нас удовлетворяет ошибка выборки, равная ±0,15, то следует изучить 100 преступлений (дел, статкарт и т. д.), а если она допустима в пределах ± 0,3, то достаточно 25 единиц изучения.
Выше говорилось, что коэффициент доверия, равный 1 (/=1), недостаточно надежен, так как только 683 единицы из 1000 могут быть в пределах заданной ошибки репрезентативности. Поэтому чаще всего при расчете объема выборочной совокупности вводится коэффициент доверия, равный 2 (/=2), который означает, что в 954 случаях из 1000 число единиц выборочной совокупности будет находиться в пределах заданной ошибки репрезентативности. С этой целью в приведенные формулы, как и при расчете ошибки репрезентативности, вводится коэффициент /.
Из формул предельных ошибок повторной выборки для качественных и количественных признаков выведем формулы расчета объемов выборочной совокупности.
Из д
следует и =
(качественные признаки).
Из д = /J— следует п = -~- (количественные признаки).
V и А
Принимая / = 2 и используя данные предыдущих примеров, определяем объемы выборочных совокупностей для качественных и количественных признаков:
, ч 0,35(1-0,35) 4 "*"
п (кач.) =-----^ пппг, '— -- 364 преступления;
и (колич.) =
2,29 4
= 407 преступлений.
0,0225
Расчеты выборочных совокупностей показывают, что если повысить коэффициент доверия вдвое (/=2), то объем выборки необходимо увеличить вчетверо, ^то означает, что в пределах тех же ошибок репрезентативности ± 5% и ± 0,15 года теперь будет находиться не 683, а 954 единицы из 1000. В этих случаях ошибка выборки именуется двукратной, поскольку распространяется на все единицы выборочной совокупности, расположенные в пределах 28 нормального распределения.
Все предшествующие расчеты производились для повторной выборки. В реальной жизни криминологические и социально-правовые изучения проводятся, как правило, бесповторным способом, т. е. уголовное дело, статкарта, гражданское дело и т. д. по какому-то признаку изучаются или респонденты (при анкетировании) опрашиваются единожды. В этом случае применяются формулы для бесповторной выборки.
Из д =
- — следует и =
NtP( - Р)
= —-------i-------'—-
+ tP( - Р)
Л/ЬЧ
2,2
> = ',—1--7Г следует л = —
/1 I, N ) £f,, т, и
Эти формулы расчета выборочных совокупностей для качественных и количественных признаков являются наиболее полными. В них учтены коэффициент доверия, кратность предельной ошибки и бесповторность выборки. Пользуясь этими формулами, рассчитаем выборочные совокупности для известных данных.
Итак, дано:
Р (удельный вес признака)
А (предельная ошибка выборки)
/ (коэффициент доверия)
N (генеральная совокупность)
= 35 %, или 0,35;
= 5 %, или 0,05;
= 2;
— 5000.
п =
п (выборочная совокупность)
5000 • 4 • 0,35 • (1 - 0,35) _ 4600 O.OD25 5000 + 4 0,35 (1-0,35) ~ 13,42
= 343 преступления.
Если уменьшить ошибку выборки до ±3%, то выборочная совокупность должна быть увеличена до 848 единиц, если до ± 2 % — объем выборки должен составить 1575 единиц.
Второй пример решим применительно к количественному признаку.
Дано:
о (дисперсия) = 2,29 года;
Д (предельная ошибка выборки) = 0,15 года;
t (коэффициент доверия) = 2;
N (генеральная совокупность) = 3000.
(выборочная совокупность)
3000 4 2,29 27480
0,0225 3000 + 4 2,29 67,5 + 9,16
= 358 преступлений.
Увеличение генеральной совокупности вдвое, т. е. до 6000, увеличит выборку ненамного, лишь до 381 единицы. Это говорит о том, что объем генеральной совокупности — относительно второстепенный параметр даже при расчете объема бесповторной выборки, хотя он и стоит в формуле расчета. При повторной выборке объем генеральной совокупности не имеет никакого значения, поэтому он отсутствует в формуле расчета как дисперсии, так и численности выборки. Следовательно, там, где численность генеральной совокупности по тем или иным причинам точно не известна, ею можно пренебречь и рассчитывать выборочную совокупность по формулам повторной выборки или использовать приблизительную численность генеральной совокупности.
Для определения объема повторной выборки по качественному признаку можно использовать табл. 6. Как и табл. 5 (о пределах ошибок), она рассчитана применительно к коэффициенту доверия, равному 2 (/=2).
Таблица 6
Число наблюдений, необходимое для того, чтобы ошибка не превысила заданного предела (t=2)
Удельный вес |
Предел ошибки, % |
|||||
наблюдений, % |
|
|||||
|
1 |
2 |
3 |
4 |
5 |
10 |
10 (90) |
3600 |
900 |
400 |
230 |
150 |
37 |
15 (85) |
5100 |
1300 |
570 |
320 |
210 |
52 |
20 (80) |
6400 |
1600 |
710 |
400 |
260 |
65 |
25 (Z5i |
75ПП |
19ПП |
аза |
470 |
ям |
76 |
30 (70) |
8400 |
2100 |
930 |
530 |
340 |
85 |
35 (65) |
9100 |
2300 |
1010 |
570 |
370 |
92 |
40 (60) |
9600 |
2400 |
1070 |
600 |
390 |
97 |
45 (55) |
9900 |
2500 |
1100 |
620 |
400 |
100 |
50 (50) |
10 000 |
2500 |
1110 |
630 |
400 |
100 |
Примечание. Таблица приводится в сокращенном виде.
Предположим, что удельный вес изучаемого признака равен 25%. Находим этот показатель в первой графе табл. 6. Рассматривая строку (она подчеркнута), на которой находится 25% (75%), слева направо, мы увидим, что при заданной ошибке ± 1% численность выборки должна составить 7500 единиц, при ± 2% -1900, при ± 3% - 830, при ± 4% - 470, при + 5% - 300 единиц и т. д. Исходя из того, какая ошибка может быть признана допустимой при том или ином изучении, и определяется объем выборочной совокупности.
В криминологических и других социально-правовых исследованиях чаще всего бывает достаточной выборка до 300—400 единиц. Даже при максимальной колеблемости качественного признака 50% (дисперсия -- 0,25) предельная двукратная ошибка выборки составляет ±5%, при удельном весе признака 20% (80%) — ±4%, при удельном весе признака 10% (90%) — ± 3%.