Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
уч_комплекс_эконометр.doc
Скачиваний:
46
Добавлен:
04.04.2013
Размер:
2.81 Mб
Скачать

Анализ двухвходовых таблиц ""

В качестве примера двухвходовой таблицы "", можно рассмотреть случай анализа результатов выборов (рейтинги кандидатов). Тогда каждому региону, участвующему в выборах, сопоставляем строку, а каждому кандидату - столбец в таблице. Нас интересует, есть ли связь между регионом и рейтингом кандидата в нем?

Статистики тесноты связи

Фи-коэффициент

Фи-коэффициент используют для измерения тесноты связи для таблицы с двумя рядами и двумя колонками (2*2).

Для выборки размера n эту статистику находят по формуле:

nr – итоговое число в ряду, nc – итоговое число в колонке, n – полный размер выборки

f0 соответствующее число в таблице.

Фи-коэффициент принимает значение, равное 0, если связь отсутствует и 1, если связь сильная.

Задача 1. На основании данных о пользовании интернетом мужчинами и женщинами (30 человек) сделать выводы о связи пола и объема использования интернетом.

Использование интернета в зависимости от пола

Мужчины

Женщины

Итого по строкам

Много

5

10

15

Мало

10

5

15

Итого

15

15

Для этих данных подсчитаем f1 = 15*15 / 30 = 7.5

f2 = 15*15 / 30 = 7.5

f3 = 15*15 / 30 = 7.5

f4 = 15*15 / 30 = 7.5

Тогда значение хи-квадрат выглядит так: χ2 = (5-7,5)2/7,5 + (10-7,5)2/7,5 + (10-7,5)2/7,5 + (5-7,5)2/7,5 = 0,833+0,833+0,833+0,833 = 3,333

ф =

Таким образом, связь не очень сильна.

Коэффициент сопряженности признаков

Фи-коэффициент применяют только к таблице 22, а коэффициент сопряженности признаков - С - используют для оценки тесноты связи в таблицах любого размера. Коэффициент сопряженности признаков связан с хи-квадрат следующим образом:

Значения коэффициента сопряженности находятся в интервале от 0 до 1. 0- нет связи, 1 – связь очень сильная.

V – коэффициент Крамера.

Это модифицированный коэффициент корреляции фи, используемый для таблиц больше, чем 22. Значение этого коэффициента лежит в интервале от 0 до 1. Для таблицы с r рядами и c колонками связь между V-коэффициентом Крамера и фи-коэффициентом выражается следующим образом:

В нашем примере

Коэффициент взаимной сопряженности Чупрова

Чем он ближе к 1, тем теснее связь.

φ2 – это показатель взаимной сопряженности, определяемый следующим образом:

Например, таблица 33

y

x

1

2

3

Итого

1

nxy

nxy

nxy

nx

2

nxy

nx

3

nx

Итого

ny

ny

ny

n

Задачи для самоконтроля.

Задача 2. Установить, есть ли зависимость между покупкой модной одежды и семейного положения по следующим данным:

мужской пол

женский пол

покупка модной одежды

Женат

Не женат

Замужем

Не замужем

Много

35%

40%

25%

60%

Мало

65%

60%

75%

40%

Итого

100%

100%

100%

100%

Число респондентов

400

120

300

180

Задача 3. Установить, есть ли зависимость желания совершить туристическую поездку за границу от возраста по данным, представленным в таблицах.

Примечание.

Часто введение третьей переменной позволяет маркетологу четче уяснить природу исходной связи между двумя переменными. Часто третьей переменной выступает пол. Третья переменная показывает подавленную связь между первыми двумя переменными.

А) Данные до введения третьей переменной.

Желание совершить туристическую поездку за границу

До 45 лет

После 45 лет

Да

50%

50%

нет

50%

50%

итого

100%

100%

число респондентов

500

500

Б) Данные после введения третьей переменной – пола.

Мужчины

Женщины

Желание совершить путешествие за границу

До 45 лет

После 45 лет

До 45 лет

После 45 лет

Да

60%

40%

35%

65%

Нет

40%

60%

65%

35%

Итого

100%

100%

100%

100%

Число респондентов

300

300

200

200

Проинтерпретировать полученные результаты.

Задача 4. Оценить наличие и силу связи между частотой посещения ресторана быстрого питания с размером семьи и уровнем дохода.

Семьи с низким доходом

Семьи с высоким доходом

Частота посещения ресторана быстрого питания

Редко посещают

Часто посещают

Редко посещают

Часто

посещают

Большая

162

140

120

140

Маленькая

88

160

130

60

Число респондентов

250

300

250

200