Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kol_metody_i_inform_tekhnologii.doc
Скачиваний:
6
Добавлен:
01.04.2025
Размер:
629.25 Кб
Скачать

Тема 5. Анализ взаимосвязи качественных признаков

Эмпирические данные, на основании которых строится гуманитарное исследование делятся на два основных вида: количественные (т.е. выраженные в цифрах характеристики изучаемого явления) и качественные (характеризующие различные качества изучаемого явления) признаки. По своей природе качественные признаки могут быть выражены числом только опосредовано, через подсчет количества, доли и частоты встречаемости данного признака в изучаемой совокупности. Качественные признаки в свою очередь можно разделить на ранговые, отношения между которыми упорядочены по принципу больше-меньше, лучше-хуже (например, воинские звания или экзаменационные оценки), и номинативные, в которых этот принцип не работает (например, цвет волос или национальность).

Для установления взаимосвязи между ранговыми признаками в статистике разработан коэффициент ранговой корреляции Спирмэна ( р):

Для расчета этого коэффициента значения переменных Х и У нумеруются в порядке возрастания или убывания, т.е. им присваивается определенный порядковый номер в упорядоченном ряду или ранг. А затем, ранги отдельных значений факторного признака сопоставляются с рангами значений результативного признака. Если разность между рангами (d) равна нулю, т.е. ранги результативного признака полностью совпадают с рангами факторного признака, коэффициент Спирмэна будет равен 1, т.е. связь между переменными является полной. Данный коэффициент, как и корреляция Пирсона, имеет диапазон значений [-1, +1]. Знак коэффициента корреляции (+ или – ) показывает направление связи (прямая или обратная). Сила связи определяется размером коэффициента: чем ближе полученное значение коэффициента к 1 или –1, тем связь сильнее, а чем ближе к 0, тем слабее.

Для анализа взаимосвязи между номинативными качественными признаками существует группа методов, основанных на изучении распределения значений номинативных признаков с помощью перекрестной таблицы частот, называемой также таблицей сопряженности (прямоугольная таблица, в строках которой указываются значения одной переменной (х), а в столбцах – другой (у). В ячейках таблицы проставляются числа, показывающие, сколько единиц совокупности встречается с сочетанием каждого из вариантов каждой переменной. В зависимости от характера распределения частот внутри таблицы можно судить о том, существует ли связь между данными переменными. Если изучается распределение номинативных признаков только по двум вариантам значений (наличие или отсутствие качества), то каждая ячейка таблицы получает свою индикацию, выраженную латинскими буквами a, b, c, d, а сама таблица сопряженности имеет вид:

у1

у2

х1

a

b

х2

c

d

Взаимосвязь двух переменных определяется в данном случае с помощью двух коэффициентов, находящихся, как и коэффициенты корреляции в диапазоне [-1, +1]. Чем ближе к 1 полученное значение, тем связь сильнее, чем ближе к 0, тем слабее. Это коэффициенты ассоциации (Q) и контингенции ():

;

Если каждая из переменных х и у имеет более двух вариантов значений, то таблицы сопряженности имеют большее число строк и столбцов. Для анализа взаимосвязи между признаками в таком случае прибегают к построению таблицы ожидаемых частот, в которую вносят результаты гипотетического (случайного) распределения значений переменных, основанного на условии отсутствия влияния факторного признака на результативный. Эмпирическое распределение значений исследуемых переменных из таблицы сопряженности сравниваются с гипотетическим распределением этих же переменных в таблице ожидаемых частот. Если признак (переменная), положенный в основу группировки по столбцам не зависит от признака, положенного в основу группировки по строкам, то значения в таблице сопряженности и в таблице ожидаемых частот совпадут. Однако обычно эмпирическое распределение не совпадает с гипотетическим и оценить случайность или закономерность таких расхождений позволяют статистические критерии согласия хи-квадрат (χ2), который рассчитывается на основе суммирования квадратов разностей эмпирических и ожидаемых частот (при этом число степеней свободы К определяется произведением (число строк К1 – 1)*(число столбцов К2 – 1)). и показатель взаимной сопряженности2), рассчитываемый как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот столбца и строки минус единица. Чем ближе значение (χ2) и (φ2) к нулю, тем связь между переменными слабее.

; , где

f1 – значения эмпирической таблицы сопряженности;

f2 – значения гипотетической таблицы ожидаемых частот;

fij – значения эмпирической таблицы, в которой i – номер строки, а j – номер столбца;

Аij – итоговые частоты по строкам и столбцам.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]