
- •3. Методология методы, техника, процедуры социологического исследования.
- •5.Программа социологического исследования: методологическая и методическая часть.
- •6. Рабочий план исследования.
- •7. Методологический раздел программы социологического исследования.
- •8. Определение цели и замысла исследования. Разработка концепции исследования.
- •9. Проблема исследования. Проблемная ситуация.
- •11. Фазы формирования гипотез.
- •13. Интерпретация и операциональное определение понятий.
- •14. Социологическое измерение. Индикаторы.
- •15. Три основные типа шкал.
- •16. Основные требования к построению социологической шкалы: валидность, полнота, чувствительность.
- •17. Понятие социальной установки и её измерения.
- •18. Шкала самооценки, ранжирования.
- •20. Шкала Гутмана.
- •21. Шкала Терстоуна.
- •23. Шкала Лайкерта.
- •24. Метод семантического дифференциала.
- •25. Текстовые тесты.
- •26. Анкетный опрос.
- •27. Особенности различных опросов.
- •28. Композиция и оформление анкеты.
- •29. Логический контроль и апробация составленной анкеты.
- •30. Почтовый опрос.
- •31. Интервьюирование.
- •32. Формализованное интервью.
- •33. Фокусированное и свободное интервью.
- •34. Эффект интервьюера. Контроль качества работы интервьюера.
- •43. Уровень компетенции эксперта и его оценки.
- •Генеральная и выборочная совокупности
- •Случайные ошибки в выборке
- •Стратификация и взвешивание
- •Отбор группы. Кластерные выборки.
Генеральная и выборочная совокупности
Всю совокупность объектов, подлежащих исследованию, обычно называют генеральной совокупностью. Она может составлять более чем 2,5 млн человек. Разумеется, задать серию вопросов такому количеству людей практически невозможно. Необходимо ограничиться сравнительно небольшим числом опрашиваемых, входящих в генеральную совокупность, то есть выборочной совокупностью. Это можно сделать в том случае, если выборка, отражая качества генеральной совокупности, является репрезентативной. Репрезентативность обеспечивается вероятностным отбором, базирующимся на случайном равновероятностном отборе из всех единиц генеральной совокупности (список генеральной совокупности). При таком отборе возможны лишь случайные расхождения между признаками выборки и генеральной совокупности. Если известны шансы того, что единицы генеральной совокупности попадут в выборку, то можно рассчитать степень случайных отклонений.
В некоторых случаях люди, потенциально являющиеся объектом исследования сами определяют, войдут ли они в выборочную совокупность, то есть, будут ли участвовать в опросе. Пример такого самоотбора – программы ТВ, когда телезрителей призывают звонить по телефону и сообщать свое мнение о каком-либо событии. В других случаях само исследователи определяют единицы, которые они хотели бы включить. Это – целевой отбор. Такая система формирования выборки носит название неслучайного отбора. Решение о том, какие единицы войдут в выборочную совокупность, принимается случайно. Однако этот подход может привести к тому, что выборка будет систематически отличаться от генеральной совокупности. Систематические отклонения возникают, когда существует взаимосвязь между переменными и факторами, определяющими, какие единицы будут включены в выборку. Взаимосвязи между переменными в данной конкретной выборке должны полностью соответствовать тем, что приведены в выборке, репрезентативной для всей страны. Разница взаимосвязи между участием в политической жизни и семейным положением мужчин и женщин, живущих в трех промышленных поселках, вряд ли будет больше той, что существует по всей стране, однако твердой уверенности в этом нет.
Случайные ошибки в выборке
2.
При интервьюировании на улице можно обратиться к тем, кто нам покажется симпатичней или кто выразит желание принять участие в интервью. В обоих случаях результат будет с систематическими искажениями. Если же вместо этого опрашивать каждого десятого прохожего, есть все основания утверждать, что выборка репрезентативна для всех людей, проходивших мимо во время интервьюирования.
Относительно удовлетворительное распределение в выборке можно получить, если, например, 60% прохожих составляют женщины, а 40% мужчины.. Чтобы иметь положительное отражение генеральной совокупности в выборке из 10 человек, у нас должно быть шесть женщин и четверо мужчин.
При малой выборке в 10 человек не исключено, что женщины составят 40 или 80%, хотя оптимальное значение для генеральной совокупности – 60%. При увеличении выборки до 100 человек риск получить в результате 50 или более 70% женщин немного снижается. При объеме выборки в 1000 человек, пространство для случайных отклонений станет еще уже. Если выборку проводить несколько раз, чтобы вместе они составили целую серию, большинство из них даст результат между 57 и 63% женщин. Итак, по мере увеличения объема выборки возможность для случайных ошибок будет постоянно сокращаться.
Статистики разработали методы, позволяющие точно определить величину допустимых отклонений вследствие случайных ошибок при формировании выборки. Самый распространенный способ простой случайный отбор. Осуществляется он точно также как розыгрыш в лотерее. Всем единицам генеральной совокупности присваиваются номера, и совершенно случайно отбирается то количество номеров, которое соответствует размеру желаемой выборки (количество выигрышей). Если генеральная совокупность мала, можно написать номера на бумажках, хорошо их перемешать и затем тянуть.
При большом количестве единиц получения случайных цифр, соответствующих принципу лотереи, используют ЭВМ.
Другой распространенный вариант выбора каждой к-той единицы из списка – систематический отбор. Если для выборки нужно вытянуть из картотеки, в которой числиться 20 тыс. членов, 1 тыс. карточек, то вытягивается каждая двадцатая от зафиксированной стартовой точки (случайное число находится между 1 и 20). Случайным образом отбирается 1-ая единица, (с помощью таблиц случайных чисел), затем отбору подлежит каждый k-тый элемент, где k- шаг отбора. K= N/n = 20000/1000=20. k= N/n = 20000/200=100. Этот способ удобен, т.к. нет необходимости нумеровать единицы, но он предполагает, что в исходном списке не существует никакой схемы, которая могла бы привести к искажениям. Например, если вытягивать каждую седьмую единицу из списка газетных изданий (включая воскресные), составленного в хронологическом порядке, то в результате может случиться, что все единицы выборки будут представлять один и тот же день недели.
В таблице приведены границы погрешности (доверительные интервалы) при простом случайном отборе. Статистики вычислили, как далеко в обе стороны от правильных параметров генеральной совокупности могут сместиться параметры выборки. Абсолютное большинство результатов обследования должно укладываться в рамки полученного нами доверительного интервала. Величина интервала зависит не только от объема выборки, но и от того, насколько однородна генеральная совокупность. Чем она более однородна, тем ближе к 0 или к 100% доля единиц наблюдения, обладающих одинаковыми исследуемыми качествами, тем уже интервал.
Таблица 1.
Величина погрешности при простом случайном отборе
(в %, уровень надежности 95%)
Количество единиц наблюдения |
Результаты выборки в 5 |
|||||||
1/99 |
5/95 |
10/90 |
15/85 |
20/80 |
30/70 |
40/60 |
50/50 |
|
25 |
4,0 |
8,8 |
12,0 |
14,2 |
16,0 |
18,4 |
19,6 |
20,0 |
50 |
2,4 |
6,2 |
8.5 |
10,1 |
11,3 |
13,0 |
13,9 |
14,1 |
100 |
2,0 |
4,4 |
6,0 |
7,1 |
8,0 |
9,2 |
9,8 |
10,0 |
150 |
1,6 |
3,6 |
4,9 |
5,8 |
6,5 |
7,4 |
8,0 |
8,2 |
200 |
1,2 |
3,1 |
4,2 |
5,1 |
5,6 |
6,5 |
6,9 |
7,1 |
300 |
1,2 |
2,5 |
3,5 |
4,1 |
4,6 |
5,3 |
5,7 |
5,8 |
400 |
1,0 |
2,2 |
3,0 |
3,6 |
4,0 |
4,6 |
4,9 |
5,0 |
500 |
0,8 |
2,0 |
2,7 |
3,2 |
3,6 |
4,1 |
4,4 |
4,5 |
600 |
0,6 |
1,8 |
2,4 |
2,9 |
3,3 |
3,8 |
4,0 |
4,1 |
800 |
0,6 |
1,5 |
2,1 |
2,5 |
2,8 |
3,2 |
3,5 |
3,5 |
1000 |
0,6 |
1,4 |
1,9 |
2,3 |
2,5 |
2,9 |
3,1 |
3,2 |
1600 |
0,5 |
1,1 |
1,5 |
1,8 |
2,0 |
2,3 |
2,5 |
2,5 |
3000 |
0,4 |
0,8 |
1,1 |
1,3 |
1,5 |
1,7 |
1,8 |
1,8 |
5000 |
0,2 |
0,6 |
0,9 |
1,0 |
1,1 |
1,3 |
1,4 |
1,4 |
Таблица показывает, что, если, например, 11% единиц генеральной совокупности обладают необходимым качеством, а выборка из нее насчитывает 300 единиц, то величина погрешности составит 3,5%. Это означает, что если взять серию выборок по 300 единиц и если доля политически активных в генеральной совокупности составляет 11%, то абсолютное большинство выборок даст результат где-то между 11%–3,5% и 11%+3,5%.
Это утверждение будет верным для 95 случаев из 100. В 5 из 100 выборок случайные отклонения дадут такую большую погрешность, которая выйдет за рамки доверительного интервала. При помощи таблицы мы можем, например, рассмотреть результаты расчета по отдельной выборке, где 11% из приблизительно 300 замужних женщин ведут активную политическую жизнь. Насколько этот результат близок или, наоборот, далек от правильного для всей генеральной совокупности числа, неизвестно. Статистика может лишь сообщить, что для серии однотипных выборок итоговое значение данного параметра будет варьировать в пределах =/- 3,5% в 95% случаев выборочных исследований. Величина 95% позволяет оценить вероятность получения ненадежных данных обусловленную большой погрешностью, выходящей за границы доверительного интервала.
Уровень надежности и величина погрешности тесно связаны. Если нужно уменьшить вероятность того, что результат выйдет за границы допустимой погрешности, последние необходимо расширить, повысив тем самым уровень надежности. Случается, сто в исследовании реализуются более низкие уровни надежности данных (например, 90%) или более высокие уровни (99%).
Согласно выборке, среди 337 наиболее активных мужчин женатые составляют 28%. В табл. В первом столбце находим показатель объема выборки – 300 единиц, в верхней строке результат выборки – 30%; в столбце на пересечении этих показателей им соответствует погрешность +/- 5,3%. Следовательно, доля женатых мужчин указана верно, т.к. для всей генеральной совокупности ( т.е. для всех женатых мужчин в трех промышленных поселках) правильное число находится где-то между 24 и 34% (если округлить предел погрешности до +/- 5%).
Поскольку мы пришли к выводу о том, что доля наиболее политически активных замужних женщин, превышающая 14,5%, мало вероятна, и, в то же время, доля женатых политически активных мужчин вряд ли опускается ниже 24%. Можно заключить, что в генеральной совокупности существует тенденция к тому, что женатые мужчины чаще, чем замужние женщины, активно участвуют в политической жизни. Разница между двумя результатами выборки – 29 и 11 – настолько очевидна, что можно с уверенностью исключить предположение о влиянии на нее случайных погрешностей при формировании выборки (именно это имеется в виду, когда мы употребляем в научных отчетах выражение «значимая разница»).
Определение объема выборки
Принимая во внимание затраты, объем выборки желательно ограничить, но стремление обобщить результаты с высокой степенью точности (небольшие пределы погрешности и высокая достоверность) ведет в противоположную сторону.
Чтобы определить целесообразный объем выборки, необходимо, прежде всего, оценить, какая погрешность приемлема, исходя из постановки задачи. Затем с помощью таблицы выяснить, какой объем выборки удовлетворяет такому доверительному интервалу. Потребность в точности зависит от характера ожидаемых выводов. Если речь идет о газетной статье, посвященной отношению к «левой» работе, допустима существенно большая величина ошибки, чем в вопросе о том, в какой степени определенный дневной рацион может служить причиной увеличения риска заболеть раком.
Иногда подобные размышления убеждают, что нет смысла проводить исследование, если ресурсов для достижения желаемой точности результатов недостаточно. Например, имея случайные выборки их совокупности двух объявлений, мы хотим выяснить, какое их них более привлекательно. Если ресурсы позволяют нам взять интервью у 100 человек в каждой выборке, то, судя по табл., величина погрешности может достигнуть +/- 10%. Для 2-х выборок =/- 20%. Из табл. явствует, что для каждой из выборок нам нужно, по крайней мере, по 400 человек, чтобы можно было бы с большей достоверностью предполагать, что разница в 10% между результатами неслучайна.
Исследования, нацеленные на получение прочных знаний о состоянии дел и служащие основой для дальнейших научных разработок, должны отличаться точностью.
В случае, когда цель исследования является скорее практической, нежели научной, как в примере с выбором из двух вариантов объявлений, можно удовлетвориться менее высоким уровнем надежности. Скажем, остановимся на величине погрешности при уровне надежности 90%, умножим из табл. на к-т 0,84, а при уровне надежности 80% – на коэффициент 0,65. Однако даже в тех случаях, когда ресурсы позволяют опросить большое число людей, исследователи обычно ограничивают размер выборки одной-двумя тысячами единиц. Причина состоит в том, что сокращение величины погрешности резко уменьшается с увеличением объема выборки. (Чтобы сократить допустимую погрешность наполовину, необходимо увеличить объем выборки в 4 раза). В то же время большие выборки необходимы для точного суждения о составляющих их отдельных группах. В подобном случае следует принимать во внимание размер групп. Здесь стоит прибегнуть к стратифицированному формированию выборки. Стремление провести исследование, включив в него много переменных, также требует большей выборки. В нашем примере с двумя независимыми переменными – пол и семейное положение – образуют шесть групп, которые сравниваются между собой, когда дело касается их политической активности.
Включение еще нескольких независимых переменных увеличивает количество групп и, соответственно, возрастает потребность в большем объеме выборки.