Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ермолаев О.Ю. Математическая статистика.doc
Скачиваний:
369
Добавлен:
13.08.2019
Размер:
23.04 Mб
Скачать

8.1.3. Использование критерия хи-квадрат для сравнения показателей внутри одной выборки

Критерий хи-квадрат может быть применен и для выявления сходства или различия внутри одной, но численно достаточно

152

большой выборки, В этом случае вычленяются показатели (а их может быть два и больше), по которым и осуществляется сравне­ние. Этот аспект применения критерия xи-квадрат сближает его с коэффициентом корреляции, который также находит степень свя­зи между двумя или большим числом признаков. Различие между этими двумя методами прежде всего в том, что для подсчета ко­эффициента корреляции необходимо знать все реличины сравни­ваемых признаков, а для использования критерия хм-квадрат важ­но знать только уровни (градации) сравниваемых признаков.

При сравнении показателей с помощью критерия хи-квадрат нулевая гипотеза Н0 звучит так: сравниваемые признаки не вли­яют друг на друга. В терминах корреляционных отношений: меж­ду признаками связи нет, корреляция не отличается от нуля.

Соответственно альтернативная гипотеза Н1 звучит следую­щим образом: сравниваемые признаки влияют друг на друга. В терминах корреляционных отношений: между признаками связь есть, корреляция значимо отличается от нуля.

В этих случаях применение критерия хи-квадрат основывает­ся на использовании так называемых многопольных таблиц или, как их еще называют, таблиц сопряженности, т.е. таких таблиц, эмпирические данные в которых представлены размерностью большей чем 2x2.

В этом случае расчет эмпирического значения критерия хи-квадрат может осуществляться по следующим двум формулам: (8.10)

где di разность между эмпирическими и «теоретическими» ча­стотами;

fmi есть вычисленная, или «теоретическая» частота.

(8.11)

где k - • число строк многопольной таблицы т -• число столбцов многопольной таблицы Nобщее число значений (элементов) в многопольной таблице, оно всегда является произведением N= k • т С - элементы многопольной таблицы

153

Сi — суммарные значения по строкам многопольной таблицы Сj — суммарные значения по столбцам многопольной таблицы

Проиллюстрируем все вышесказанное решением примера, взя­того с некоторыми модификациями из учебного пособия «Психо­логическая диагностика» под ред. К.М. ГЧревича и М.К. Акимовой. М. Изд-во УРАО, 1997г.

Задача 8.11. Влияет ли уровень интеллекта на профессиональ­ные достижения?

Решение. (Первый способ решения по формуле 8.10). Для . решения этой задачи 90 человек оценили по сте­пени их профессиональных достижений и по уровню интеллекта. При разбиении на уровни (градации признака) по обоим признакам было взято три уровня. Для показателя профессиональ­ных достижений были получены следующие час­тоты признака: 20 человек с высоким уровнем профессиональных достижений, 40 со средним и 30 с низким. Первая группа составляет 22,2% вы­борки, вторая — 44,4% и третья — 33,3% от всей выборки. При разбиении по уровню интеллекта было взято три равных по численности группы, в каждой по 30 человек: уровень интеллекта ниже среднего, средний и выше среднего. В процентах каждая группа составляет 33,3% от всей выборки. Все эмпирические данные (частоты) представле­ны ниже в таблице 8.14:

Таблица 8.14

IQ

Оценка профессиональных достижений

Всего

Ниже среднего

Средняя

Выше среднего

Ниже среднего

20 А (10)

5 B (13,3)

5 С (6,7)

30

Средний

5 D (10)

15 E(13,3)

10 F(6,7)

30

Выше среднего

5 G(10)

20 Н(13,3)

5 J (6,7)

30

Итого

30

40

20

90

154

Для удобства каждая ячейка таблицы обозначена соответству­ющей латинской буквой: А, В, С и т.д. Таблица 8.14 устроена сле­дующим образом: в ячейку, обозначенную символом А, заносят­ся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают следующей характеристикой: ниже среднего по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических час­тот) оказалось 20. В ячейку, обозначаемую символом В, заносят­ся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают характеристикой: средние по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических частот) оказалось 5. В ячейку, обозначенную символом С, заносятся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают характеристикой: выше среднего по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических частот) оказалось также 5. Заметим, что 20 + 5 + + 5 = 30, т.е. числу испытуемых, имеющих уровень интеллекта ниже среднего. Подобные «разбиения» были проделаны для каж­дой ячейки таблицы 8.14. Подчеркнем, что в круглых скобках в каждой ячейке таблицы представлены вычисленные для этой ячейки «теоретические» частоты. Покажем, как для каждой ячейки таблицы 8.14 найти соот­ветствующую «теоретическую» частоту. Это делается следующим образом. Для каждого столбца таблицы подсчитываются так на­зываемые «частости» в процентах:

Полученные величины «частостей» дают возможность под­считать «теоретические» частоты для каждой ячейки таблицы 8.14. Они служат основой для подсчета «гипотетических» (а по

155

сути теоретических) частот, т.е. таких частот, которые при за­данном соотношении экспериментальных данных должны были бы быть расположены в соответствующих ячйках таблицы 8.14. (Вспомним решение задачи 8.5).

Согласно этому положению «теоретическая» частота для ячейки А подсчитывается следующим образом. 30 человек имеют уровень интеллекта ниже среднего, поэтому 33,3% от этого чис­ла должны были бы попасть в группу с профессиональными до­стижениями ниже среднего уровня. Находим эту «гипотетическую» величину так: (30•33,3%):100% = 9,99 ≈ 10 Аналогично «теоретическая» частота для ячейки D считается следующим образом: 30 человек имеют средний уровень интел­лекта, поэтому 33,3% от этого числа должны были бы попасть в группу с профессиональными достижениями среднего уровня. На-

ходим эту «гипотетическую» величину так:(30•33,3%):100% = 9,99 ≈ 10.

Аналогично «теоретическая» частота для ячейки G считается следующим образом: 30 человек имеют высокий уровень интел­лекта, поэтому 33,3% от этого числа должны были бы попасть в группу с профессиональными достижениями выше среднего

уровня. Находим эту «гипотетическую» величину так: (30•33,3%):100% = 9,99 ≈ 10.

Рассмотрим, как производится подсчет для ячейки В. 30 че­ловек имеют низкий уровень интеллекта, поэтому 44,4% от это­го числа должны были бы попасть в группу с профессиональны­ми достижениями среднего уровня. Находим эту «гипотетичес-

кую» величину так:(30•44,4%):100% = 13,3 Аналогично производится подсчет для ячейки Е. 30 человек имеют средний уровень интеллекта, поэтому 44,4% от этого чис­ла должны были бы попасть в группу с профессиональными до­стижениями среднего уровня. Находим эту «гипотетическую» величину так: (30•44,4%):100% = 13,3.

156

157

Аналогично производится подсчет для ячейки Н. 30 человек имеют уровень интеллекта выше среднего, поэтому 44,4% от этого числа должны были бы попасть в группу с профессиональ­ными достижениями среднего уровня. Находим эту «гипотети-

ческую» величину так: (30•44,4%):100 %= 13,3.

Рассмотрим, наконец, как производится подсчет для ячейки С. 30 человек имеют низкий уровень интеллекта, поэтому 22,2% от этого числа должны были бы попасть в группу с профессио­нальными достижениями выше среднего уровня. Находим эту

«гипотетическую» величину так:(30•22,2%):100 % = 6,7.

Расчет «теоретических гипотетических» частот для оставших­ся ячеек проведите самостоятельно.

Проверим правильность расчета «теоретических» частот для всех столбцов таблицы 8.14: 10 + 10 + 10 = 30; 13,3 + 13,3 + 13,3 = = 39,9 = 40; 6,7 + 6,7 + 6,7 = 20,1 - 20.

Теперь все готово для использования формулы (8.1).

Для проверки правильности расчета «теоретических» частот в случае сравнения двух эмпирических наблюдений (см. раздел 8.2) или для сравнения показателей внутри одной выборки мо­жет использоваться следующая формула (8.12):

(8.12)

Проверим по этой формуле правильность наших расчетов: fm для ячейки А — 30 • (30:90) = 10,0

fm для ячейки В — 30 •(40:90) = 13,3

fm для ячейки С - 30 •(20:90) =6,7

fm для ячейки D - 30 • (30:90) = 10,0

fm для ячейки Е — 30 • (40:90) = 13,3

fm для ячейки F30 • (20:90)= 6,7

fm для ячейки G — 30• (30:90)= 10,0

fm для ячейки H- 30 • (40:90) = 13,3

fm для ячейки J — 30 • (20:90) = 6,7

Число степеней свободы подсчитаем по знакомой формуле: v = (k - 1). (с - 1) = (3 - 1) • (3 - 1) = 4 где k число строк, а с -число столбцов и в соответствии с таблицей 12 Приложения 1 находим:

х2кр = {9,49 для Р < 0,05

х2кр = {13,28 для Р< 0,01

Строим «ось значимости»:

Полученные эмпирическая величина критерия хи-квадрат попала в зону значимости. Иными словами, следует принять ги-

158

потезу Н1 о том, что уровень интеллекта влияет на успешность профессиональной деятельности.

Решение. (Второй способ решения по формуле 8.11).

Подставим данные таблицы 8.14 в формулу (8.11) получим:

Как и следовало ожидать, эмпирическое значение х«-квадрат получено то же самое, что и при первом способе решения. Все дальнейшие операции уже проделаны выше при первом спосо­бе решения данной задачи, поэтому не будем их повторять. Бе­зусловно, что второй способ существенно проще первого, од­нако, при расчетах по формуле (8.11) можно легко допустить ошибки. Подчеркнем, что как первый, так и второй способы расчета эмпирического значения хи-квадрат позволяют работать с таблицами практически любой размерности: 3 х4, 4 х4, 5 хЗ, 5 х 6 и т.п.

Для применения критерия хи-квадрат необходимо соблюдать следующие условия:

1. Измерение может быть проведено в любой шкале.

2. Выборки должны быть случайными и независимыми.

3. Желательно, чтобы объем выборки был > 20. С увеличением объема выборки точность критерия повышается.

4. Теоретическая частота для каждого выборочного интервала не должна быть меньше 5.

5. Сумма наблюдений по всем интервалам должна быть равна об-

щему количеству наблюдений.

6. Таблица критических значений критерия хи-квадрат рассчита-

на для числа степеней свободы v, которое каждый раз рассчи­тывается по определенным правилам.

159

В общем случае число степеней свободы определяется по формуле: v = с - 1, где с — число альтернатив (признаков, зна­чений, элементов) в сравниваемых переменных.

Для таблиц число степеней свободы определяется по фор­муле: v = (k - 1) • (с - 1), где kчисло столбцов, с — число строк.