Лекция 20.03.13.
Репрезентативность выборки.
В матстате такого понятия вообще нет. С точки зрения точных наук это понятие так же бесполезно. Поэтому вообще вопрос обсуждаемый.
Определения:
Репрезентативность — (с фр. Показательный, представляющий собой) — в общей теории статистики — соответствие характеристик полученных в результате выборочного наблюдение показателям, характериемых всю генеральную совокупность. Расхождение между указанными показателями представляют собой ошибку репрезентативности, которая может быть случайной или систематической. (Большой энциклопедический словарь)
Репрезентативность — главное свойство выборочной совокупности, состоящее в близости ее характеристик к тем характеристикам, откуда они отобраны. (А. Я. Боярский). Рассмотрение выборочной совокупности в 2 направлениях — сравнение переменных и характеристик, и колеблемость изучаемых характеристик. Чаще всего репрезентативность измеряется ошибкой выборки.
В самом общем виде, репрезентативность — это то свойство выборки, позволяющее переходить от выборочной совокупности к совокупности генеральной.
На чем основывается уверенность в таких методах? Есть проблемы: каждое исследование уникально (с полной точностью мы не можем воспроизвести ситуацию опроса). И вообще эффективны ли индуктивные методы. Справедливы ли наши заключения?
Многие утверждают, что если отбор элементов произведен правильно, то репрезентативность обеспечивается автоматически. Но это так-то не так: ведь объем выборки большой, и она неоднородна.
Надо иметь в виду:
В силу индуктивного характера, репрезентативность всегда конкретна (каждый раз надо обосновывать построение)
Репрезентативность — всегда гипотеза, которая хуже или лучше обоснована. Но всегда есть шанс, что она будет отвергнута.
Априорное обоснование лежит не в статистических методах и процедурах отбора, а в понимании закономерностей, которые лежат в основе изучаемого явления.
В социологических исследованиях речь идет не только о статистических методах. Обеспечение валидности (нестатистическое понимание репрезентативности)
В экспертных опросах, качественных методах вообще нет того смысла. В качественных методах строится теоретическая выборка (обеспечивается репрезентативность понятий)
В. И. Шлипентох: обращает внимание на то, что можно выделить прямую и обратную задачу репрезентативности. Т.е. Задачу вычленения репрезентативной части можно условно назвать «прямой». Всегда есть сверх-объект (в отношении чего репрезентативна часть). Какую сверх часть представляет наша выборка — обратная задача.
Планирование выборки включает в себя много этапов:
выбор единицы отбора
установление основы выборки
собственно планирование выборки (включает в себя выделение параметров отбора и оценки репрезентативности, выбор критериев отбора, определение ориентировочного объема выборки, установление вида выборки и схема отбора)
формирование выборочной совокупности
контроль репрезентативности и ремонта выборки
распространение резултатов на исследуемую совокупность
центральные вопросы: установления основы выборки, выбор единицы отбора и планирование выборки. т.е. кого, сколько и как отбирать? Эти вопросы увязану между собой. Они должна соответствовать объекту и цели.
Мы должны разделить изучаемую совокупность на единицы отбора (чаще всего это индивид или группа людей, но так не всегда. Единицами могут быть самые разные объекты. Единицы наблюдения и единицы наблюдения могут не совпадать)
Основа выборки. Общая схема определяется основой выборки. Формирование и оценка качества этой основы являются важными. Набор требований: полнота основы (представленность в списке всех единиц генеральной совокупности), отсутствие дублирования (каждая единица должна быть представлена 1 раз), точность (не устаревшие данные о генеральной совокупности), адекватность целям исследования, удобство использования.
Основа выборки будет считаться не полной, если содержит пропуски отдельных единиц или групп, либо содержит сведения о несуществующих единицах, либо данные о существующих единицах, но не реальные. И т.п.
Недостати есть всегда.
Устаревание!!!
Лекция 27.03.13
Основы, наиболее употребительные для соц. Исследований:
списки отдельных лиц (сост. Определенными органами, организациями и т.д.), регистры (если бы они существовали), картотеки (предприятий, кадров), базы данных (о категориях лиц, клиентские базы), материалы переписи населения, списки домохозяйств, похозяйственные книги с/х, карты (районов, регионов), списки жилищ, списки отдельных территориальных единиц, списки и описание избирательных участков, счетных комиссий, справочники и так далее.
Описание основ выборки было дано Ейцем (написание фамилии хреновое у меня)))).
Арутюнян. Что-то тоже делал в середине 80-х годов. Списки он делал.
Информация — дефицитный ресурс (в силу стоимости).
Один из первых регистров был создан в Швеции 1749 году. Ребенок попадает в регистр с момента рождения и выбывает только при смерти или после выезда из страны. В России предложения о создании регистра, но как-то не судьба.
Горяченко сейчас что-то говорит о переписях, но я ничего не понимаю. А потом про натурный обход и карты. Но логики никакой. Я хочу спать. Не знаю зачем пришла сюда. Она говорит, что телефонные базы — стремные. А инет сейчас вполне себе неплох.
Объем выборки
Често встает вопрос: «какой % генеральной совокупности надо опросить?», но этот вопрос вообще не правомерен, т.к. не существует относительного объема выборки. Объем обычно меньше 0,1%, а то и 0,004%. Но тем не менее все репрезентативно и вообще окей. Существует только абсолютный объем выборки!
Нужна информация о: допустимая погрешность, желаемая точность результатов и ресурсные ограничения. Все выборки содержат элемент ошибки.
Только случайно можно получить такую ситуацию, когда оценка по генеральной совокупности совпадет с выборочной.
Всегда есть шанс построить неудачную выборку (даже если она была построена по всем правилам и канонам), что она превысит 5%. Ошибки распределения распределены нормально. Всегда есть шанс, что будет косяк. Если бы увеличиваем ош. В 2 раза, то объем выбоорки мы должны увеличить в 4 раза. Для гетерогенной совокупности — ошибка больше и соответственно объем больше.
Парамерты: однородность, целесообразный уровень надежности выводов, степени дробности группироков для анализа планируемых по задачам, которые мы решаем.
