
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания вступительная статья
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания предисловие
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •Введение
- •1. Процесс исследования
- •Формулирование теории
- •Операционализация теории
- •Выбор адекватных методов исследования
- •Наблюдение за поведением
- •Анализ данных
- •Интерпретация результатов
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания подготовка к исследованию
- •2. Создание теории: понятия и гипотезы в политологии
- •Что такое теория?
- •Логика построения теории
- •Компоненты теории
- •Проверка и совершенствование теории
- •Роль гипотез
- •Формулирование гипотез
- •Заключение
- •Дополнительная литература к главе 2
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •3. От абстрактного к конкретному: операционализация и измерение
- •Операционализация: связь между теорией и наблюдением
- •Операционные определения
- •Измерение
- •Уровни измерения
- •Рабочая гипотеза
- •Ошибка измерения
- •Валидность
- •Надежность
- •Заключение
- •Дополнительная литература к главе 3
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •4. Работа по плану: как составить программу исследования
- •Цель и программа исследования
- •Учет в программе исследования альтернативных конкурирующих гипотез
- •Экспериментальные программы исследования
- •Формирование групп
- •Полевые эксперименты и неэкспериментальные программы
- •Квазиэкспериментальные программы
- •Выбор программы исследования
- •Факторы, угрожающие валидности
- •Факторы, угрожающие внутренней валидности
- •Факторы, угрожающие внешней валидности
- •Дополнительная литература к главе 4
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •5. Кто, что, где, когда: проблема выборки
- •Репрезентативная выборка
- •Процедуры формирования репрезентативной выборки
- •Установление необходимого объема выборки
- •Краткие характеристики выборок разного объема
- •Заключение
- •Дополнительная литература к главе 5
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания методы сбора данных
- •6. Опрос
- •Этапы проведения опроса
- •Концептуализация
- •Подготовка инструментария
- •Планирование опроса и построение выборки
- •Проблемы, связанные с финансированием опроса
- •Обучение и инструктаж персонала
- •Предварительное тестирование
- •Проведение опроса
- •Наблюдение за ходом опроса (мониторинг)
- •Контрольная проверка
- •Вторичный анализ данных опроса
- •Дополнительная литература к главе 6
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •7. Интервьюирование
- •Выборочное интервьюирование
- •Формулирование вопросов
- •Отбор интервьюеров
- •Направленное интервьюирование
- •Методика направленного интервьюирования
- •Специализированное интервьюирование
- •Дополнительная литература
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •8. Шкалирование
- •Построение шкалы: две основные проблемы
- •Шкалирование по лайкерту
- •Шкалирование по гуттману
- •Шкалирование по тёрстоуну
- •Метод семантического дифференциала
- •Дополнительная литература
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •9. Контент-анализ
- •Подготовка к контент-анализу
- •Проведение содержательного контент-анализа
- •Проведение структурного контент-анализа
- •Некоторые проблемы, возникающие в ходе контент-анализа
- •Дополнительная литература к главе 9
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •10. Источники и применение сводных данных
- •Типы сводных данных
- •Проблемы, связанные с использованием сводных данных
- •Источники сводных данных
- •Сбор сводных данных
- •Заключение
- •Дополнительная литература к главе 10
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •11. Поверх границ: практика сравнительных исследований
- •Выявление “кочующих” вопросов
- •Поиск эквивалентной меры
- •Отбор стран для изучения
- •Отбор независимых наблюдений
- •Отбор материала
- •Заключение
- •Дополнительная литература к главе 11
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания обработка данных
- •12. Подготовка и обработка данных
- •Кодирование: что все эти цифры значат?
- •Книга кодов и кодировальный бланк
- •Как обработать данные
- •Дополнительная литература
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •13. Описание данных: построение таблиц, диаграмм, гистограмм
- •Перечневая таблица
- •Линейная диаграмма
- •Секторная диаграмма и гистограмма
- •Двусторонняя гистограмма
- •Некоторые предостережения
- •Дополнительная литература
- •Далее 14. Статистика I: анализ одномерных распределений к оглавлению примечания
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •14. Статистика I: анализ одномерных распределений
- •Измерение средней тенденции и дисперсии
- •Измерения для номинальных переменных
- •Измерения для порядковых переменных
- •Измерения для интервальных переменных
- •Заключение
- •Дополнительная литература
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •15. Статистика II: изучение взаимосвязей между двумя переменными
- •Измерение связи и статистической значимости
- •Измерение связи и значимости для номинальных переменных
- •Измерение связи и значимости для порядковых переменных
- •Измерение связи и значимости для интервальных переменных
- •Заключение
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •16. Статистика III: изучение взаимосвязей между несколькими переменными
- •Анализ таблиц
- •Множественная регрессия
- •Интерпретация результатов множественной регрессии
- •Решение общих проблем множественной регрессии
- •Анализ временных рядов
- •Заключение
- •Дополнительная литература
- •Далее: 17. Математическое моделирование к оглавлению примечания
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •17. Математическое моделирование
- •Процесс моделирования
- •Зачем нужны модели?
- •Примеры математических моделей политического поведения
- •Другие типы моделей
- •Сложности, связанные с моделированием
- •Заключение
- •Дополнительная литература
- •Далее: 18. Некоторые обобщения к оглавлению примечания
- •Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- •18. Некоторые обобщения
- •Разработка гипотезы, измерения и программы исследования
- •Сбор и анализ данных
- •Контрольный бланк для оценки исследований
- •Контрольный бланк для оценки исследования
- •Заключение
- •К оглавлению Примечание
Измерение связи и значимости для номинальных переменных
Широко используемым коэффициентом связи для номинальных переменных, из которых одна считается зависимой, а другая – независимой, является λ (лямбда)3. Лямбда измеряет процентную долю того, насколько возможно угадывание значений зависимой переменной на основе знаний независимой переменной, если обе переменные представлены категориями, не содержащими ранга, интервала или направления.
Представьте, например, что мы определяем партийную принадлежность 100 респондентов и выясняем, что частотное распределение выглядит следующим образом:
|
Демократы Республиканцы Независимые |
50 30 20 |
|
Представьте также, что мы хотим установить партийную принадлежность каждого отдельного респондента и сделать подобные предположения для всех лиц и что мы хотим при этом совершить минимум ошибок. Наиболее очевидный путь – определить моду (самую распространенную категорию); мы предполагаем, что это будут демократы. Мы окажемся правы в 50 случаях (для 50 демократов) и не правы в 50 случаях (для 30 республиканцев и 1 независимых); это не просто стоящее внимания замечание, но самое лучшее, что мы можем сделать, поскольку ни мы выберем республиканцев, то окажемся не правы 170 случаях, а если выберем независимых, то это приведет к 80 неверным предположениям. Таким образом, данная [c.417] мода обеспечивает наилучший уровень предположений для имеющейся в распоряжении информации.
Но мы можем располагать еще одним набором данных, партийной принадлежности отца каждого респондента, представленным следующим распределением:
|
Демократы Республиканцы Независимые |
60 30 10 |
|
Если эти две переменные связаны друг с другом, т. е. если каждый отдельный респондент вероятнее всего принадлежит к той же партии, что и ее (или его) отец, то знание партийных предпочтений отца каждого респондента может помочь нам в определении партийных предпочтений самих респондентов. Это будет так в том случае, если, определяя для каждого респондента не моду всего распределения, как мы делали прежде, а просто партийную принадлежность его (или ее) отца, мы сможем снизить количество неверных предположений до уровня более низкого, чем 50 неверно определенных нами случаев.
Чтобы это проверить, нужно построить таблицу сопряженности, подытоживающую распределение признаков по этим двум переменным. В табл. 15.1 независимая, или определяющая, переменная (партийная принадлежность отца) дана по рядам, ее итоговое распределение находится в правой части таблицы. Зависимая переменная (партийная принадлежность респондента) расположена по колонкам, и ее итоговое распределение находится в низу таблицы. Значения в таблице даны произвольно, и в действительности они, конечно, должны пересчитываться самим исследователем.
Таблица 15.1.
Определение партийности на основании партийной принадлежности отца (1)
Партийность отца |
Партийность респондента |
|||
Демократ |
Республиканец |
Независимый |
Всего |
|
Демократ Республиканец Независимый Всего |
45 2 3 50 |
5 23 2 30 |
10 5 5 20 |
60 30 30 100 |
[c.418]
По этой таблице мы можем партийные предпочтения родителей использовать для определения партийных предпочтений респондентов. Для этого мы, как и раньше, определим моду, но только внутри каждой категории независимой переменной, а не по всему набору признаков. Таким образом, получится, что для тех респондентов, чьи отцы зафиксированы как демократы, мы прослеживаем предпочтение той же партии. Мы будем правы 45 раз и не правы 15 (для 5 республиканцев и 10 независимых). Для тех, чьи отцы зафиксированы республиканцами, мы предполагаем принадлежность к республиканской партии, при этом в 23 случаях мы окажемся правы и в 7 – не правы. Тех, чьи отцы зафиксированы независимыми, отнесем к независимым и будем правы в 5 из 10 случаев. Сравнив эти результаты, увидим, что теперь мы в состоянии верно предположить 73 раза и все еще ошибаемся 27 раз. Иными словами, наличие второй переменной существенно улучшило наши шансы. Для того чтобы точно определить процентную долю этого улучшения, используем общую формулу коэффициента связи.
В приведенном примере это выглядит так:
Используя партийную принадлежность отца в качестве определителя партийной принадлежности респондента, мы можем улучшить (ограничить количество ошибок) наши предположения примерно на 46%.
Формула подсчета λ, которая приведет нас к тем же результатам, хотя и несколько другим путем, такова:
,
[c.419]
где fi – максимальная частота внутри каждой категории или градации независимой переменной; Fd – максимальная частота в итоговых распределениях зависимой переменной;
N – количество признаков.
Лямбда изменяется в пределах от 0 до 1, где высшие (близкие к 1) значения обозначают сильную связь. Поскольку номинальные переменные не имеют направления, λ всегда будет положительной.
Следующий наш шаг – определить, чем вызваны взаимосвязи, выраженные λ, – истинными параметрами совокупности или просто случаем, т.е. мы должны определить, являются ли эти взаимосвязи статистически значимыми.
Для номинальных переменных тест на статистическую значимость проводится путем подсчета критерия χ2 (хи-квадрат). Этот коэффициент говорит нам о том, насколько вероятно, что номинальный тип связей, который мы только что наблюдали, является результатом случая. Это делается путем сравнения тех результатов, которые мы реально имеем, с теми, которые ожидаются тогда, когда между переменными нет никакой связи. Подсчет χ2 также начинается с таблицы взаимной сопряженности признаков, хотя и несколько отличающейся от табл. 15.1. Рассмотрим табл. 15.2.
Таблица 15.2.
Определение партийности на основании партийной принадлежности отца (2)
Партийность отца |
Партийность респондента |
|||
Демократ |
Республиканец |
Независимый |
Всего |
|
Демократ Республиканец Независимый Всего |
50 |
30 |
20 |
60 30 30 100 |
Эта таблица напоминает табл. 15.1 тем, что категории переменных те же самые, но табл. 15.2 не содержит никаких распределений в своих графах. Определение χ2 начинается с того, что мы задаем себе вопрос: какое значение мы ожидаем в каждой графе при [c.420] имеющихся итоговых распределениях, если между переменными нет связи? Для 60 респондентов, чьи отцы были демократами, например, мы можем ожидать, что половина (50/100) будут демократами, около трети (30/100) будут республиканцами и один из 5 (20/100) – независимым, или, другими словами, 30 демократов, 18 республиканцев и 12 независимых.
Точно так же мы можем прикинуть ожидаемые значения для тех, у кого отцы были республиканцами или независимыми. Эти ожидаемые значения собраны в табл. 15.3.
Таблица 15.3.
Определение партийности на основании партийной принадлежности отца (3)
Партийность отца |
Партийность респондента |
|||
Демократ |
Республиканец |
Независимый |
Всего |
|
Демократ Республиканец Независимый Всего |
30 15 5 50 |
18 9 3 30 |
12 6 2 20 |
60 30 30 100 |
Тогда встает вопрос: действительно ли значения табл. 15.1 настолько отличаются от тех значений, которые можно предположить в табл. 15.3, что мы можем быть решительно уверены в надежности наших результатов? Хи-квадрат и является тем инструментом, который посредством сравнения двух таблиц даст ответ на наш вопрос. Уравнение для χ2 выглядит следующим образом:
,
где f0 – частота, наблюдаемая в каждой графе (см. табл. 15.1); fe – частота, ожидаемая в каждой графе (см. табл. 15.3).
Подсчитывается χ2 путем внесения значений в каждую графу табл. 15.4. [c.421]
Таблица 15.4.
Значения, используемые для получения χ2
f0 |
fe |
f0 –fe |
(f0 –fe)2 |
(f0 –fe)2 fe |
45 5 10 2 23 5 3 2 5 |
30 18 12 15 9 6 5 3 2 |
15 – 3 –2 –13 14 –1 –2 –1 3 |
225 169 4 169 196 1 4 1 9 |
7,5 9,39 0,33 11,27 21,78 0,17 0,8 0,33 4,50 |
Порядок граф таблицы не имеет значения, но f0 из табл. 15.1 и fe из табл. 15.3 в каждой определенной строке должны относиться к одному и тому же случаю. Причина того, что разность между f0 и fe сначала возводится в квадрат и лишь потом делится на fe, та же, что в случае колебаний вокруг среднего геометрического при определении стандартного отклонения. Хи-квадрат определяется путем сложения всех цифр в последней колонке. В нашем примере он получает значение 56,07.
Прежде чем мы интерпретируем эту цифру, нам необходимо сделать еще одно вычисление – подсчитать так называемые степени свободы (degrees of freedom – df). Степени свободы в таблице – это количество ячеек таблицы, которые могут быть заполнены цифрами, прежде чем содержание всех остальных ячеек станет фиксированным и постоянным. Формула для определения степеней свободы в любой определенной таблице такова:
df = (r – 1) (c – 1),
где r = количество категорий переменной в ряду; с = количество категорий переменной в колонке. Например, df = (3 – 1) (3 – 1) = 4.
Теперь мы готовы оценить статистическую значимость наших данных. Таблица А.4 в приложении содержит [c.422] значимые величины χ2 для различных степеней свободы на уровнях 0,001; 0,01; 0,05. Если значение χ2, которое мы подсчитали (56,07), превышает то, что указано в таблице на любом из этих уровней для таблицы с определенными степенями свободы (4), то можно сказать, что те взаимосвязи, которые мы наблюдали, на данном уровне статистически значимы. В настоящем случае, например, для того чтобы связь была значимой на уровне 0,001 (т.е. если мы допускаем, что наблюдаемая связь отражает характеристики всей совокупности, то мы рискуем ошибиться один раз из 1000), наблюдаемый χ2 должен превышать 18,467. Если это так, то мы можем быть абсолютно уверены в своих результатах. [c.423]