
- •Методическая разработка для проведения лекции
- •Рассмотрена на заседании кафедры прикладной математики и информационных технологий
- •Санкт-Петербург
- •I. Учебные цели
- •II. Воспитательные цели
- •III. Расчет учебного времени
- •IV. Учебно-материальное обеспечение
- •V. Методические рекомендации преподавателю по подготовке к проведению лекции
- •VI. Литература, рекомендованная преподавателю Основная: Основная:
- •Дополнительная:
- •VII. Приложение
- •1. Определение объема выборки
- •Точечные и интервальные оценки вариационного ряда
- •3. Характеристики вариационного ряда
- •4. Измерение вариации признака
- •5. Статистические критерии согласия
Дополнительная:
Сборник задач по математике для вузов: Специальные разделы математического анализа /Под ред. А.В.Ефимова и Б.П. Демидовича. – М.: Наука, 1986. -342 с.
Вентцель Е.С., Овчаров Л.А. Теория вероятностей. – М.: Наука, 1973. -334 с.
Гмурман В.Е. Теория вероятностей и математическая статистика.-
М.: Высшая школа, 2001. -342 c.
VII. Приложение
1. Текст лекции
2. Слайды
Разработал
Доцент кафедры прикладной математики и информационных технологий
А.Ю. Лабинский
Числовые характеристики статистического распределения
Числовые характеристики статистического распределения.
Учебные вопросы:
Определение объема выборки
Точечные и интервальные оценки вариационного ряда
Характеристики вариационного ряда
Измерение вариации признака
Статистические критерии согласия
1. Определение объема выборки
На практике часто возникает вопрос «Какой объем должна иметь выборка, чтобы получить результаты нужной точности?».
Конечно, чем большее количество первичного материала имеет исследователь, тем не хуже. Однако из практики социально-правовых исследований известно, что чем больше первичного материала, тем больше необходимо провести вычислений, и, соответственно увеличиваются затраты на получение и обработку этого материала.
Поэтому целесообразно ориентироваться на тот минимальный объем, который экономичен и дает возможность получить удовлетворительные результаты.
Объем выборки в существенной мере зависит от способа организации выборки.
Различают следующие способы отбора выборочных данных:
- собственно случайный отбор;
- механический отбор ;
- типический отбор;
- серийный (гнездовой) отбор ;
- комбинированный отбор .
Наиболее доступным и распространенным является собственно случайный отбор.
1. Собственно случайный отбор.
Этот способ означает выборку конкретных единиц из генеральной совокупности без дробления генеральной совокупности на группы. При этом существуют два варианта отбора:
- повторный (отобранная единица вновь участвует в последующей процедуре отбора);
- бесповторный (отобранная единица не участвует в последующей процедуре отбора).
Примеры:
в архиве суда тома уголовных дел отбираются и откладываются в сторону – это бесповторная выборка;
в архиве суда тома уголовных дел отбираются по их номеру несколькими независимыми экспертами – это повторная выборка.
Целями выборочного исследования могут быть:
а) изучение некоторых средних характеристик:
- средний срок осуждения;
- количество судимостей;
- средний возраст освобождающихся из мест лишения свободы и др.;
б) изучение долей определенных категорий в генеральной совокупности:
- доля рецидивистов среди содержащихся в исправительно-трудовой колонии строгого режима;
- доля осужденных за кражи;
- доля ложных сигналов в дежурную часть органа внутренних дел и др.
В зависимости от цели социально-правового исследования различаются и формальные соотношения для объема проектируемой выборки (таблица 5):
Таблица 5.
Соотношения для определения объема выборки
|
Способ отбора |
|
Повторный |
Бесповторный |
|
Изучение средних величин |
|
|
Изучение долей |
|
|
В таблице приняты следующие обозначения:
σ – среднее квадратическое отклонение;
δ – доля определенных элементов в генеральной совокупности;
N – объем генеральной совокупности;
Δ – требуемая точность оценки характеристик генеральной совокупности;
t - параметр, связанный с вероятностью, надежностью получения оценки.
В связи с тем, что величины σ и δ априори неизвестны, рекомендуется брать их приближенные оценки, полученные в других исследованиях или наблюдениях.
В частности, если даже приблизительно неизвестна доля изучаемых элементов в генеральной совокупности, то следует вместо произведения
δ(1- δ) подставить в формулы для объемов выборки его максимальное значение, равное 0,25. В этом случае соотношения во второй строке таблицы 5 примут вид:
- для повторной
выборки; (18)
-
для бесповторной выборки. (19)
При очень больших (более 1000 единиц) объемах генеральной совокупности формулы для повторной и бесповторной выборок практически совпадают.
При вероятности (надежности) 0,95 обеспечения заданной точности выборочных оценок t = 2, а при вероятности 0,99 - t = 3.
В социально-правовых исследованиях, как правило, надежность в 95% является вполне приемлемой.
Пример 1 проектирования выборочного наблюдения.
Пусть необходимо определить средний срок расследования преступлений в N-ом управлении внутренних дел.
Требуемая точность Δ – одна неделя.
Общее число уголовных дел в последний год – 15000.
Требуемая надежность – 95% (то есть t = 2).
Произведенные пробные выборки дали приближенную оценку для дисперсии σ2 = 49.
По формуле для бесповторной выборки применительно к средним величинам получаем объем выборочной совокупности для указанных условий n = 194 (проверить самостоятельно).
Поскольку объем генеральной совокупности достаточно велик, то можно воспользоваться более простой формулой для повторной выборки. В этом случае n = 196 (проверить самостоятельно).
Пример 2 проектирования выборочного наблюдения.
Пусть необходимо провести выборочное наблюдение для оценки доли осужденных за кражи, содержащихся в колонии общего режима с фактической наполняемостью в 1200 человек.
Если никаких предварительных данных о размере этой доли не имеется то произведение δ(1- δ) в формуле таблицы 5 заменяем на 0,25.
Требуемая точность определения доли – 5% с надежностью 0,95.
Воспользовавшись выражением (19) для бесповторной выборки, оцениваем ее объем n = 303.
Основной принцип организации собственно-случайной выборки – это обеспечение равной возможности быть отобранным каждому элементу генеральной совокупности. Для этого используются таблицы случайных чисел или датчики случайных чисел для ЭВМ.
2. Механический отбор.
При механическом отборе генеральная совокупность «механически» делится на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект.
Например, если нужно отобрать для анализа личности правонарушителя 20% уголовных дел, связанных с совершением тяжких телесных повреждений, то отбирают каждое пятое дело; если требуется отобрать 5% уголовных дел, то отбирают каждое двадцатое.
Можно пронумеровать элементы генеральной совокупности, а затем в зависимости от объема выборки, установив шаг отбора, произвести их отбор.
Иногда механический отбор может не обеспечить репрезентативность выборки.
3. Типический отбор.
При типическом отборе генеральная совокупность по тому или иному признаку делится на типические группы таким образом, чтобы максимально уменьшить в каждой типической группе колеблемость признака.
Количество единиц из каждой типической группы выбирается пропорционально среднему квадратическому отклонению признака в этой группе.
При типическом отборе получаются более точные результаты, чем при механическом отборе.
4. Серийный (гнездовой) отбор.
При серийном отборе генеральную совокупность делят на ряд групп (серий), а затем случайным образом производят выборку из них. Серии, попавшие в выборку, обследуются сплошным образом.
Серийная выборка применяется в том случае, когда сложно организовать выборочное наблюдение путем собственно случайного отбора, механического отбора или типического отбора в силу ограниченности ресурсов (людских, материальных и др.) участников выборочного наблюдения.
Пользуются серийным отбором тогда, когда обследуемый признак колеблется в различных сериях незначительно.
5. Комбинированный отбор.
При комбинированном отборе отбор проводится следующим образом:
- на первом этапе проводится выборочный отбор серий одинакового объема;
- на втором этапе простым случайным отбором выбирают несколько серий;
- на третьем этапе из каждой серии простым случайным отбором извлекают отдельные объекты, то есть выборочный отбор единиц из этих серий.