
- •Тема 1. Общие идеи. Постановка проблемы и выдвижение гипотез
- •1. Идея метода
- •2. Постановка проблемы и выдвижение гипотез
- •3. Требования к теории
- •Тема 2. Понятия ковариации и каузации. Каузальная модель теории
- •1. Ковариация и каузация
- •2. Понятие функциональной связи
- •3. Построение каузальной модели
- •Тема 3. Понятие операционализации, альтернативные и рабочие гипотезы
- •1. Альтернативные гипотезы
- •2. Процедура операционализации
- •3. Рабочие гипотезы, их отличие от альтернативных гипотез
- •Тема 4. Измерение. Ошибки измерения
- •1. Понятие измерения
- •2. Ошибки измерения
- •Тема 5. Валидность и надежность измерения
- •1. Понятие валидности
- •2. Способы валидизации
- •3. Надежность измерения
- •Тема 6. Построение анкеты
- •1. Структура анкеты
- •Уважаемые сограждане!
- •Сводная таблица данных1
- •2. Виды вопросов и их формулировка
- •3. Расположение вопросов и ответов
- •4. Предварительное опробование анкеты
- •Тема 7. Формирование выборки
- •1. Генеральная совокупность и выборка
- •2. Способы построения выборки
- •3. Определение объема выборки
- •Тема 8. Проведение опроса
- •1. Опрос и его виды и способы организации
- •2. Проведение опроса
- •3. Контроль над проведением опроса
- •4. Вторичный анализ данных опроса
- •Тема 9. Интервью
- •1. Определение интервью. Выборочное интервью
- •2. Направленное интервью
- •3. Специализированное интервью
- •Тема 10. Социологический эксперимент
- •1. Понятие переменной
- •2. Классический эксперимент в социологии
- •3. Способы подбора групп, участвующих в эксперименте. Полевой эксперимент и квазиэксперимент
- •Тема 11. Контент-анализ
- •1. Определение контент-анализа
- •2. Содержательный контент-анализ
- •3. Структурный контент-анализ
- •4. Что нужно учитывать при проведении контент-анализа
- •Тема 12. Описание и анализ данных: таблицы, диаграммы, гистограммы
- •1. Перечневая таблица
- •2. Графическое изображение
- •3. Другие способы представления данных
- •4. Правила оформления данных
- •Тема 13. Анализ номинальных и порядковых переменных
- •1. Анализ номинальных переменных
- •2. Анализ порядковых переменных
- •Тема 14. Анализ интервальных переменных
- •1. Понятия средней арифметической и стандартного отклонения
- •2. Анализ нормального распределения
- •Тема 15. Анализ связей между номинальными переменными
- •1. Связь двух номинальных переменных с двумя значениями. Понятие Хи-квадрата
- •2. Связь двух номинальных переменных, имеющих больше двух значений
- •3. Связь между несколькими номинальными переменными
- •Тема 16. Анализ связи между порядковыми переменными
- •1. Определение связи между двумя порядковыми переменными
- •2. Определение связи между таблицами с порядковыми переменными
- •Тема 17. Анализ связей между интервальными переменными
- •1. Понятие линии регрессии. Определение коэффициента связи между интервальными переменными
- •2. Проверка коэффициента связи на статистическую значимость
- •3. Смысл коэффициента корреляции Пирсона
- •Тема 18. Пример социологического исследования
2. Проверка коэффициента связи на статистическую значимость
Мы справились с первой задачей – измерили количественно зависимость между обеими переменными. Теперь необходимо решить вторую задачу: убедиться в том, что найденный коэффициент 0,286 статистически значим.
Снова, не вдаваясь в математические тонкости, дадим формулу, по которой проверяется статистическая значимость полученного коэффициента связи. Это так называемый коэффициент корреляции Пирсона, обозначим его Rxy.
Строим таблицу, в которой присутствуют все необходимые элементы уже этой формулы (табл. 17.3).
Опираясь на данные таблицы, производим вычисления:
________________________________
Rxy = (20 х 623,5 – 11550) : √(20 х 776 – 12100) х (20 х 575,5 – 11025) =
____________________________
= (12470 – 11550) : √(15520 – 12100) х (11510 – 11025) =
_________ _______
= 920 : √3420 х 485 = 920 : √1658700 = 920 : 1287,9 = 0,714.
Итак, Rxy = 0,714.
Таблица 17.3
№ |
x |
y |
xy |
x2 |
y2 |
1 |
1 |
3 |
3 |
1 |
9 |
2 |
1 |
4,5 |
4,5 |
1 |
20,25 |
3 |
2 |
3,5 |
7 |
4 |
12,25 |
4 |
3 |
5 |
15 |
9 |
25 |
5 |
3 |
4 |
12 |
9 |
16 |
6 |
3 |
5 |
15 |
9 |
25 |
7 |
4 |
5 |
20 |
16 |
25 |
8 |
4 |
4 |
16 |
16 |
16 |
9 |
4 |
6 |
24 |
16 |
36 |
10 |
5 |
5 |
25 |
25 |
25 |
11 |
6 |
5 |
30 |
36 |
25 |
12 |
6 |
7 |
42 |
36 |
49 |
13 |
7 |
5 |
35 |
49 |
25 |
14 |
7 |
6 |
42 |
49 |
36 |
15 |
8 |
7 |
56 |
64 |
49 |
16 |
8 |
6 |
48 |
64 |
36 |
17 |
9 |
5 |
45 |
91 |
25 |
18 |
9 |
6 |
54 |
81 |
36 |
19 |
10 |
7 |
70 |
100 |
49 |
20 |
10 |
6 |
60 |
100 |
36 |
|
= 110 |
= 105 |
= 623,5 |
= 776 |
= 575,5 |
Теперь можно выяснить, является ли коэффициент связи 0,286 статистически значимым. Для этого сначала нужно определить количество степеней свободы. Оно определяется по формуле N − 2, где N − количество случаев. У нас N = 20. Поэтому количество степеней свободы равно 18 (20 − 2). Теперь нужно определиться с желательным уровнем значимости. Пусть он будет 0,05, что означает, что для нас достаточно ошибиться в 5 случаях из 100.
Смотрим на фрагмент таблицы коэффициентов корреляции для различных уровней значимости (табл. 17.4), полный вариант этой таблицы см. в Приложении настоящего учебного пособия, табл. 6.
Таблица 17.4
df |
0,1 |
0,05 |
0,01 |
0,001 |
16 17 18 19 20 |
0,4000 0,3887 0,3783 0,3687 0,3598 |
0,4683 0,4555 0,4438 0,4329 0,4227 |
0,5897 0,5751 0,5614 0,5487 0,5368 |
0,7084 0,6932 0,6787 0,6652 0,6524 |
Уровню значимости 0,05 и количеству степеней свободы 18 в таблице соответствует число 0,4438. Получившийся у нас коэффициент Пирсона 0,714 больше этого числа. Следовательно, для уровня значимости 0,05 коэффициент связи (0,286) является статистически значимым. То есть своим уравнением прямой Y = 0,286X + 3,68 мы выразили не случайную, но значимую связь.
Но даже если бы мы претендовали на 1 ошибку в 1000 случаях, то наш коэффициент все равно являлся бы статистически значимым, так как таблица дает в этом случае число 0,6787, которое все равно меньше получившегося у нас коэффициента Пирсона.
Опираясь на полученное выше уравнение Y = 0,286X + 3,68, можно представить, вокруг какого числа будут крутиться, если можно так выразиться, точки, указывающие на количество часов просмотра телепередач, у респондентов, вышедших на пенсию 15 лет назад.
Подставляем 15 вместо X в уравнение Y = 0,286X + 3,68.
Получаем: 0,286 х 15 + 3,68 = 7,97.
Итак, средний мужчина в возрасте 75 лет должен, по нашим данным, высиживать перед телевизором примерно 8 часов в сутки.
А в возрасте 80 лет, т. е. на 20-м году после выхода на пенсию? Тоже можно подсчитать: 0,286х20 + 3,68 = 9,4.
Правда, так можно досчитаться до того, что в 100-летнем возрасте мужчина в среднем будет прикован к телевизору больше 15 часов в сутки, отводя на сон, еду и прочие потребности меньше 9 часов. Но ясно, что наши математические расчеты имеют границу в виде здравого смысла.