
- •Оглавление
- •1. Предмет социологии
- •2. Общество и личность.
- •3. Социальные законы функционирования и развития общества
- •4. Формы проявления и механизмы действия социальных законов
- •1. Общая социологическая теория
- •2. Теоретический и эмпирический уровни социологического познания. Теоретическая и прикладная социология
- •3. Специальные социологические теории и эмпирические исследования
- •1. Основные условия и формы жизнедеятельности общества. Способ производства и образ жизни
- •2. Социальная структура и социальные отношения
- •3. Социально-территориальные общности
- •4. Социально-политическая организация общества и социальные институты
- •5. Духовная жизнь общества. Средства массовой информации и пропаганды Социальные проблемы идеологической деятельности
- •5. Социальное планирование. Социальные показатели
- •1. Постановка проблемы. Цели и задачи исследования
- •2. Определение объекта и предмета исследования
- •3. Интерпретация и операционализация понятий
- •4. Выдвижение и проверка гипотез
- •5. Организационно-методический план исследования
- •6. Рабочий план исследования и подготовка исполнителей
- •1. Понятие измерения в социологии. Уровни измерения
- •2. Группировка материала статистических наблюдений
- •3. Графическая интерпретация эмпирических зависимостей
- •4. Средние величины и характеристики рассеяния значений признака
- •5. Нормальное распределение. Статистические гипотезы
- •6. Статистические взаимосвязи и их анализ
- •7. Новые подходы к анализу данных, измеренных по порядковым и номинальным шкалам
- •1. Основные понятия выборочного метода
- •2. Простой случайный отбор
- •3. Систематическая и серийная выборки
- •4. Стратифицированный отбор
- •5. Многоступенчатые и комбинированные способы формирования выборочной совокупности
- •6. Неслучайные методы отбора и другие подходы к построению выборки
- •1. Виды шкал
- •402. Насколько Вы лично удовлетворены следующими сторонами своей жизни?
- •2. Некоторые методы измерения
- •3. Надежность измерения социальных характеристик
- •1. Понятие документа. Классификация документов
- •2. Методы анализа документов
- •3. Выборка документов и проблемы качества документальной информации
- •1. Понятие наблюдения.
- •2. Программа наблюдения
- •3. Виды наблюдения
- •4. Фиксация результатов. Подготовка наблюдатели
- •1. Понятие опроса
- •2. Критерии качества данных опроса
- •3. Основные фазы опроса
- •4. Типы и виды вопросов
- •5. Разновидности опроса
- •6. Эмпирическое обоснование методики опроса
- •1. Социометрический опрос
- •2. Обработка и анализ результатов социометрического опроса
- •3. Социометрические индексы
- •1. Понятие эксперимента
- •2. Экспериментальные переменные
- •3. Виды экспериментов
- •4. Обработка экспериментального материала
- •1. Подготовка данных к анализу на эвм
- •2. Описание и объяснение в социологическом исследовании
- •3. Способы проверки гипотез
5. Нормальное распределение. Статистические гипотезы
Адекватное применение количественных методов, вошедших в практику социологических исследований, в той или иной степени опирается на предположение, что изучаемый признак (или совокупность признаков) подчиняется определенному статистическому закону распределения. Таким наиболее часто встречающимся распределением является нормальный закон, представление о котором дано здесь в очень кратной форме.
Вторая группа вопросов, рассмотренных в этом разделе, связана с проверкой гипотез. Можно выделить две функции статистических процедур: во-первых, это описание элементов совокупности, во-вторых, помощь исследователю в принятии некоторых решений о них. В предыдущих разделах этой главы их рассмотрение было связано с дескриптивной функцией статистики. Здесь же кратко описаны основные понятия и принципы статистического вывода.
Нормальное распределение. Наиболее широко известным теоретическим распределением является нормальное, или гауссовское, распределение. Нормальное распределение признака наблюдается в тех случаях, когда на величину его значений действует множество случайных независимых или слабозависимых факторов, каждый из которых играет в общей сумме примерно одинаковую и малую роль (т. е. отсутствуют доминирующие факторы), Функция плотности гауссовского распределения имеет вид
где 2 — дисперсия случайной величины (2 — это теоретическая дисперсия, отличающаяся от s2, вычисляемой по выборочным данным); — среднее значение (математическое ожидание) (рис. 7).
В практических расчетах часто используется так называемое правило трех сигм, которое заключается том, что лишь 0,26% всех значений нормально распределенного признака лежат вне интервала ±3, т. е. почти все значения признака укладываются в интервале из шести сигм (рис. 8).
Статистические гипотезы. Статистической называют гипотезу о виде неизвестного распределения либо о параметрах известных распределений88. Так, статистической будет гипотеза о том, что переменная в генеральной совокупности распределена по нормальному закону. Проверяемую гипотезу называют нулевой (основной) гипотезой и обозначают Но. Наряду с нулевой рассматривается конкурирующая гипотеза /Л (альтернативная), которая ей противоречит.
Статистический критерий и проверка гипотез. Для проверки нулевой гипотезы используется специально подобранная случайная величина, точное, либо приближенное распределение которой известно и обычно сведено в таблицы. Эта величина называется статистическим критерием. Обозначим его пока К.
Для критерия К фиксируется так называемая критическая область, т. е. совокупность значений критерия, при которых нулевую гипотезу отвергают. Точка Kкр называется критической, если она отделяет критическую область от области принятия гипотезы.
Различают правостороннюю, левостороннюю и двустороннюю критические области.
Принятие или отверженце гипотезы производится на основе соответствующего статистического- критерия с определенной вероятностью. Считают, что пулевая гипотеза справедлива, если вероятность того, что критерий К примет значение, большее Kкр, т. е. попадет в критическую область, равна выбранному значению вероятности , т. е.
(для
правосторонней области);
(для
левосторонней области);
(для двусторонней
области).
Принятая вероятность называется уровнем значимости.
Практически принятие или отвержение нулевой гипотезы проводится следующим образом: выбирается соответствующий критерий (этот вопрос будет обсуждаться далее); вычисляется наблюдаемое значение критерия KH, исходя из эмпирического распределения; выбирается уровень статистической значимости (обычно 0,05 или 0,01).
По таблице распределения критерия К для данного уровня значимости находят критическую точку Kкр. Если KH>Kкр, нулевую гипотезу отвергают, если же KH<Kкр, то ее отвергать нет основания.
Делая такие выводы (т. е. принимая или отвергая гипотезу), можно совершить ошибки двух типов: отвергнуть гипотезу, когда она верна; принять ее, когда она неверна. Поэтому при принятии гипотезы было бы неверным считать, что она тем самым полностью доказана. Для большей уверенности необходимо ее проверять другими способами (например, увеличить объем выборки).
Отвергают гипотезу более категорично, чем принимают.
Примеры статистических гипотез: а) нормальное распределение имеет заданное среднее и дисперсию либо имеет заданное среднее (о дисперсии ничего не говорится); б) распределение нормальное либо два неизвестных распределения одинаковы.
В качестве критериев чаще всего используются случайные величины, распределенные нормально (2—критерий), по закону Фишера (F — критерий Фишера), по закону Стьюдента (критерий Стьюдента), по закону хи-квадрат (критерий 2) и т. д.
В качестве конкретного примера рассмотрим применение критерия хи-квадрат для проверки гипотезы о виде распределения изучаемого признака.
Критерий хи-квадрат. Популярность критерия хи-квадрат обусловлена главным образом тем, что применение его не требует предварительного знания закона распределения изучаемого признака. Кроме того, признак может принимать как непрерывные, так и дискретные значения,, причем измеренные хотя бы на поминальном уровне.
Если закон распределения признака неизвестен, по есть основания предположить, что он имеет определенный вид А, то критерий 2 позволяет проверить гипотезу: исследуемая совокупность распределена по закону А. Для проверки такой гипотезы сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в предположении определенного распределения А) частоты. Выпишем эти частоты:
Значения признака |
x1 |
x2 |
..., |
xk |
Эмпирические частоты |
n1 |
n2 |
..., |
nk |
Теоретические частоты |
|
|
..., |
|
Как правило, эмпирические и теоретические частоты будут различаться. Возможно, что наблюдаемое различие случайно (статистически незначимо) и объясняется либо малым числом наблюдений, либо способом их группировки, либо иными причинами. Но возможно, что расхождение частот значимо и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о характере распределения значений рассматриваемых признаков, генеральной совокупности. Критерий 2 отвечает на вопрос, случайно или нет такое расхождение частот. Как любой критерий, 2 не доказывает справедливость гипотезы, а лишь с определенной вероятностью а устанавливает ее согласие или несогласие с данными наблюдениями.
Критерий 2 имеет вид
(17)
Критическая точка распределения 2 находится; (см. табл. Б приложения) по заданному уровню значимости , и числу степеней свободы df. Число степеней свободы находят по формуле
,
где k — число интервалов вариационного ряда; r — число параметров предполагаемого распределения, которые оценены по данным выборки (например, для нормального распределения оценивают два параметра: и s2).
Рассмотрим пример, когда признак оценивался в терминах очень низкий, средний), очень высокий и был получен следующий ряд распределения для этих трех категорий:
Очень низкий |
Средний |
Очень высокий |
|
5 |
10 |
9 |
|
Проверим гипотезу о том, что в генеральной совокупности значения этого признака распределены равномерно.
Теоретическое распределение для этих групп получим, если предположим, что эти категории независимы, т. е. респондент с одинаковой вероятностью может попасть в любую группу. Очевидно, ожидаемая (теоретическая) частота будет равна 24/3 = 8 человек.
Таким образом, имеем следующие эмпирические и теоретические частоты:
5 |
10 |
9 |
|
8 |
8 |
8 |
|
Проверяется гипотеза, что число респондентов во всех трех категориях одинаково, т. е. отличие распределения от равномерного статистически незначимо.
Вычислим величину
по формуле (17):
По таблице
распределения 2,
например, для уровня значимости 0,05 и
степени свободы, равном df
= 3 – 1 = 2,
находим критическую точку
.
Таким образом, наблюдаемое значение 2
меньше
,
следовательно, данные наблюдений
согласуются с нулевой гипотезой и не
дают оснований ее отвергнуть.
Хи-квадрат-критерий применим и для проверки нулевой гипотезы об отсутствии связей между признаками в случае, если эмпирические данные сгруппированы не по одному, как выше, а по нескольким признакам. Например, пусть имеется выборка в 190 человек, чье мнение относительно какого-то определенного вопроса исследовалось (табл. 5). Расчленим эту выборку па три независимых категории по возрасту. Рассмотрим следующие гипотезы: Н0 — не существует различия мнений относительно этого вопроса среди различных возрастных групп; Н1 — существует различие. Проверим гипотезу для уровня значимости = 0,05.
Таблица 5. Пример для вычисления 2
Ответ |
Возраст опрашиваемого |
Всего | ||
более 40 |
25-40 |
менее 25 | ||
Категорически не согласен Не согласен Согласен Полностью согласен
Всего |
(а)18 (г)23 (а)11 (л)8
60 |
(б)13 (д)13 (и)14 (м)16
56 |
(в)10 (ж)12 (к)23 (н)29
74 |
41 48 48 53
190 |
Для нахождения ожидаемой (теоретической) частоты в любой плетке таблицы необходимо просто перемножить соответствующие маргинальные частоты и разделить произведение на итоговую сумму. Например, ожидаемая частота для клетки (а) равна
Процедуру вычисления представим в табл. 6. Число степеней свободы определяется по формуле
где r — число строк, а с — число столбцов в табл. 5.
Для нашего примера df = (4—1)(3—1) == 6. По табл. Б приложения находим, что 2 = 16,812. Следовательно, нужно отвергнуть гипотезу о том, что нет различий в мнении среди неодинаковых возрастных групп, т. е. можно предположить, что существует значимая статистическая взаимосвязь между тем, к какой возрастной группе принадлежит респондент, и тем мнением, которое он высказывает. Однако величина 2 не говорит о силе связи между переменными, а лишь указывает на вероятность существования такой связи. Для определения интенсивности связи необходимо использовать соответствующие меры связи.
Для корректного применения методов, основанных на 2, исследователь должен обеспечить выполнение следующих условий. Выборку необходимо получить из независимых наблюдений. Данные могут быть измерены на любом уровне, по ни одна из ожидаемых частот не должна быть слишком мала (минимум 5). Если же частоты оказываются менее 5, то необходимо либо уменьшить степень дробности группировки признаков, объединив соседние категории, либо обратиться к другому критерию89.
Таблица 6. Схема вычисления 2
Ячейка (табл. 5) |
Частота
|
Ожидаемая частота
|
|
|
|
а б в г д ж з и к л м н |
18 13 10 23 13 12 11 14 23 8 16 29 |
12,9 12,1 16,0 15,2 14,1 18,7 15,2 14,1 18,7 16,7 15,6 20,6 |
5,1 0,9 6,0 7,8 1,1 6,7 4,2 0,1 4,3 8,7 0,4 8,4 |
26,01 0,81 36,00 60,84 1,21 44,89 17,64 0,01 18,49 75,69 0,16 70,56 |
2,016 0,067 2,250 4,003 0,086 2,400 1,160 0,001 0,989 4,532 0,010 3,425 |
|
|
|
|
|
|