3 Стратегии:
предварительный расчет выборки: должно быть на входе некое утверждение о желаемой точности (задаем ДИ, ошибку предельную). Расчет объема выборки основан на понятии предельной ошибки выборки (заданной точности) и принятого уровня доверительной, то есть, вероятности того, что для изучаемого признака отклонения выборочного значения характеристики не превысят некоторого критического значения (предельной ошибки):
e = t x корень из (pq/n). n = (t^2 pq) / e^2
!!!!! n = (2^2 0,5 0,5) / (0,4^2)
Для оценки доли признака в генеральной совокупности, обладающего данным качеством, объем выборки с возвращением. M = б/ корень из n. E = txM.
T = 1,96 при P=0,95
T = 2 при Р=0,954
Максимальная степень неоднородности — 0,5х0,5 (0,25)
последовательная стратегия
комбинированная стратегия
10.04.13
Лекция. Продолжение прошлой.
Нет понятия относительного объема выборки — он всегда абсолютный. Зависит от ряда факторов (степень однородности совокупности — по наиболее изменчивому признаку; методы сбора информации; …). Существует 3 основных стратегии расчета выборки: предварительного, последовательного, комбинированная.
Стратегия предварительного расчета выборки — ориентировачный объем выборки расчитывается до проведения исследования. Должно иметься некоторое утверждение относительно желаемой точности выборки — допустимая предельная ошибка (задаем ДИ): {О с палкой и волной — е <или равно О с палкой <или равно О с палкой и волной + е}
О с палкой — параметр генеральной совокупности
О с палкой и волной — параметр выбороной совокупности
e — предельная ошибка выборки
Нужно заранее задать допустимую степень риска, которому мы подвергаемся. Такая вероятность, которая представляет собой вероятность допустить ошибку 1го рода, то е сть отвергнуть правильную гипотезу, называется уровнем значимости альфа.
Расчет объема выборки основан на понятиях предельной ошибки выборки (заданной точности) и принятого уровня доверительной вероятности, то есть, вероятности того, что для изучаемого признака отклонения выборочного значения характеристики не превысят некоторого критического значения (предельной ошибки). Величина ошибки выборочной средней мю, фоторая выражается формулой: мю = корень из (б квадрат/ n)
Предельная ошибка: е = tмю
Тогда объем выборки равен: n = (t^2 б^2) / e^2
t — коэффициент доверия, гарантирующий, что ошибка не превысит z-кратнуюсреднюю ошибку (нормальное отклонение, задаваемое исходя их уровня доверительной вероятности, которое находится по таблицам критических точек стандартного нормального распределения)
Для оценки доли признака в генеральной совокупности в генеральной совокупности, обладающего данным качеством: е = t корень (pq/n)
объем выборки с возвращением: n = (t^2 pq) / e^2. Тут p — это доля, а не вероятность.
Объем выборки без возвращения: n = (t^2 pqN) / (e^2 N + t^2 pq)
t = 1,96 для доверительной вероятности 0,95
t = 2 для......0, 954
Таблица. Ориентировачный объем выборки в зависимости от делаемой степени точности.
Предельная ошибка выборки |
объем выборки с вероятностью 0,95 |
объем выборки с вероятностью 0,954 |
10% |
96 |
100 |
5% |
384 |
400 |
4% |
600 |
625 |
3% |
1067 |
1111 |
2,5% |
1537 |
1600 |
2% |
2401 |
2500 |
1% |
9604 |
10000 |
Если переменные количественные:
Откуда взять предварительные оценки дисперсии?
С помощью отбора в 2 этапа (1 — случайная выборка, потом на ее основе дисперсию)
По данным пробного исследовнаия
По данным предыдущих обследований по аналогичным совокупностям
На основе априорных представлений о характере распределения изучаемого признака в генеральной совокупности
Каждая группа долдна быть наполнена не менее объема малой выборки (25-30 единиц).
Последовательная стратегия — объем выборки ставится в зависимости от результатов, получаемых в ходе исследования (прирост информации, данные о разбросе оценок). Решение о достаточности принимается тогда, когда происходит насыщение, то е сть прекращаеттся существенный прирост информации
Комбинированная стратегия — сочетание обеих стратегий. Априорный расчет дает верхнюю границу, а затем ведется оценка прироста информации.
Виды выборок:
(способ отбора единиц, число ступеней отбора, степень преобразования основы выборки)
2 крупные группы: вероятностные (случайные) и неслучайные выборки.
Вероятностная группа (все элементы ГС имеют равные шансы попасть в выборку)
1.1. Собственно случайная (в том числе механическая). Эталон для организации исследования.
1.2. Модифициорованная случайная.
2 разновидности случайного отбора: повторный, бесповторный (с/без возвращением/я)
Лекция 17.04.13
отбор первого элемента 2) шаг 3) анализ особенностей основы выборки
я не понимаю, что писать:(
Стратифицированная выборка. Основана на использовании априорной информации, которую мы фактически перобразуем для получения однородных групп. Из этих групп мы и формируем выборку. Стратификацию выгодно применять для неоднородных совокупностей. Это удобно, если большая дисперсия и мы пытаемся выделить однородные группы, которые сильно отличаются между собой. 2 цели: увеличить точность и что-то еще
Проблемы: выбор переменной стратификации, определение числа страт,определение границ страт, размещение выборки по стратам.
Стратифицирующие признаки должны быть связаны с тем, что мы изучаем.
Принцип стратификации по минимуму дисперсии (принцип Далениуса)
Пропорциональное, равномерное (объем выборки из каждой страты - константа), оптимальное размещение выборки
Лекция 8.05.13.
Первая модификация связана с уменьшением внутригрупповой дисперсии за счет предварительного выделения групп, более однородных чем вся совокупность в целом. Получается стратифицированная выборка
Вторая модификация, осуществляемая за счет уменьшения межгрупповой дисперсии, представлена гнездовой (серийной) выборкой, причем она наиболее эффективна в случае …
Гнездовой отбор базируется на выделении промежуточных единиц отбора, представляющих собой группы, состоящие из более мелких единиц отбора (элементов), которые являются единицами обследования. Единица отбора и единица наблюдения не совпадают.
Гнездовую выборку иногда назыают кластерной или серийной.
Преимущество перед собственно случаной выборкой: повышение организационной эффективности выборки, ее концентрация.
Основу выборки для гнездового опроса сформировать проще, чем для собственно случайной выборки, поскольку основой в этом случае является список совокупностей, а не отдельных ее элементов.
Часто гнездовой отбор выступает как элемент многоступенчатой выборки, когда вначале выбираются гнезда, а затем выборка из отобранных гезд.
Причины распространения многоступенчатой ывборки: удобство организации, концентрация на ограниченной территории, недостаточность априорной информации, имеющейся у исследователя относительно единц наблшюдения.
Принципиальные особенности:...........
Многофазная выборка:
