Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5361.pdf
Скачиваний:
3
Добавлен:
13.11.2022
Размер:
1.29 Mб
Скачать

Результаты опроса отражены в следующей таблице сопряженности (частоты исходной таблицы, как и раньше, будем обозначать через f0):

 

 

 

 

 

 

 

 

Таблица 4.2.1

 

Таблица наблюдаемых частот

 

 

 

Предпочитают продукт

 

Район города

 

Итого

 

 

 

A

 

B

 

C

(

r )

 

 

 

 

 

 

 

 

 

 

Только этой фирмы

 

107

 

66

 

36

209

 

Все равно

 

88

 

108

 

81

277

 

Других фирм

 

38

 

65

 

11

114

 

Итого ( С )

 

233

 

239

 

128

600 (

f )

 

 

 

 

 

 

 

 

 

 

 

Для проверки гипотезы о независимости предпочтений от места жительства составим таблицу ожидаемых частот в предположении верности нулевой гипотезы о том, что в зависимости от места жительства предпочтений в товарах нет. Как известно,

такие частоты определяются из соотношения:

r

C /

f , где

r - сумма

частот по строке, C - по столбцу,

f - общая сумма частот.

 

 

Например, если бы предпочтения отсутствовали, то из 233 опрошенных жителей района А предпочли бы товары только этой фирмы (233 . 209) / 600 = 81,2 (если округлять, то 81) житель, а тех, которым все равно, было бы (233 . 277) / 600 = 107,5 и т.д. Итак, таблица ожидаемых частот (fe) следующая (см. табл. 4.2.2):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4.2.2.

 

 

 

 

 

 

 

 

 

 

 

Таблица ожидаемых частот

 

 

 

 

 

 

 

 

Предпочитают продукт

 

 

 

 

 

Район города

 

Итого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

B

 

 

C

 

(

r )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Только этой фирмы

 

 

81,2

 

 

83,2

 

44,6

 

209

 

 

 

 

 

 

Все равно

 

 

 

 

 

 

107,5

 

 

110,4

 

59,1

 

277

 

 

 

 

 

Других фирм

 

 

 

 

 

 

44,3

 

 

45,4

 

24,3

 

114

 

 

 

 

 

Итого (

С )

 

 

 

 

 

 

233

 

 

 

239

 

128

 

600 (

f )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ

2

 

 

 

( f0

fe )2

 

 

 

(107 -81,2)2

 

 

(66

83,2)2

 

(36 44,6)2

 

 

 

 

 

 

fe

 

 

 

 

 

 

81,2

 

83,2

 

 

44,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(88

107,5)2

.....

(11

24,3)2

 

41,75

 

 

 

 

 

 

 

 

 

 

 

107,5

 

 

 

24,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число степеней свободы для таблиц сопряженности определяется из соотношения:

 

=

(r –

1)(C –

1) ,

 

 

где

 

r – число строк таблицы,

 

С – столбцов. У нас

 

= ( 3 - 1) ( 3 - 1) = 4 . Для

= 4 и

= 0,05 из таблицы значений критерия находим,

что

2

= 9,49. Т.к.

2

= 41,75 >

2

 

= 9,49, то гипотеза об отсутствии зависимости

0,05

 

0,05

отклоняется, т. е. связь между предпочтениями в товарах и местом жительства значима.

Другой вопрос: какова эта связь? – тесная или слабая? В данном случае на основе критерия 2 этот вопрос не решается.

Рассмотрим реализацию этого алгоритма на основе ППП Statgraphics (рис.20).

Рис. 20. Отчет о проверке гипотезы о независимости в ППП Statgraphics

Р-величина, равная нулю, подтверждает сделанный ранее вывод.

В заключении этой темы отметим, что, как следует из формулы для 2, каждый интервал или клетка таблицы вносят в 2 вклад, равный (fo – fe)/fe. При малых fe роль такого вклада неоправданно увеличивается. Чтобы ее снизить, рекомендуется провести группировку так, чтобы все fe были достаточно большими. На практике это сводится к требованию, чтобы в каждом интервале или клетке было не менее пяти наблюдений. Если это не так, то рекомендуется объединять соседние интервалы.

Эта рекомендация заложена и в компьютерные программы вычисления критерия 2: в одних ППП (например, в Statgraphics), в автоматическом режиме происходит объединение интервалов с малыми частотами, в других - указывается наименьшая встречающаяся частота, с тем, чтобы можно было принять решение, нужно ли

объединять интервалы.

Одним из недостатков критерия 2 является то, что его значение зависит от объема выборки и не нормировано. Разработано несколько модификаций критерия 2, направленных на преодоление этих недостатков.

Например, для минимизации влияния размера выборки и ограничения диапазона изменения критерия разработаны: коэффициент сопряженности Пирсона, определяемый из соотношения:

CC =

22

(n

22 )

и критерий V –Крамера:

 

 

 

 

 

 

 

 

 

 

2

 

 

 

V =

2

N (k

1) ,

где N = rc, a k = min(r,c).

Оба эти критерия равны нулю при полной независимости качественных переменных, но чем теснее связь между переменными, тем больше значения этих

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]