Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава_04.doc
Скачиваний:
5
Добавлен:
21.11.2019
Размер:
291.33 Кб
Скачать

4.3 Изучение связи на основе аналитической группировки

Аналитическая группировка является одним из приемов изучения связей между двумя и более признаками, один из которых рассматривается как фактор, а другой (другие) как результат. Чтобы установить взаимосвязь между признаками, единицы совокупности группируются по значению признака-фактора, затем для каждой группы рассчитывается среднее значение результата. Сопоставляя изменения средних значений признака-результата по группам, делают выводы о наличии связи, а если признак-фактор является количественным, то и о направлении (прямая или обратная) и форме связи (линейная или нелинейная).

Рассмотрим пример.

С целью установления зависимости между маркой автомобиля и его страховой суммой провели 5% выборку договоров страхования автомобилей, заключенных в страховой компании за месяц:

Таблица 4.7

Исходные данные.

п/п

Марка автомобиля

Страховая сумма тыс. $

№п/п

Марка автомобиля

Страховая сумма тыс. $

1

Жигули

6

2

Фольксваген

7

2

Опель

5

3

Опель

5

3

Жигули

5

4

Фольксваген

8

4

Фольксваген

6

5

Опель

8

5

Ауди

9

6

Жигули

4

6

Опель

7

17

Опель

7

7

Опель

6

8

Фольксваген

9

8

Фольксваген

7

9

Опель

4

9

Ауди

10

10

Ауди

7

10

Жигули

7

1

Жигули

5

11

Фольксваген

5

По исходным данным нельзя проследить зависимость, поскольку у автомобилей одной и той же марки страховые суммы могут быть разные. Сгруппируем договоры по маркам автомобилей и рассчитаем среднюю страховую сумму по каждой марке (табл.4.8, гр.2.).

Таблица 4.8.

Группировка автомобилей по маркам.

Марка автомобилей

Число застрахованных автомобилей

Средняя страховая сумма тыс. $

Дисперсия страховой суммы

А

1

2

3

Жигули

5

5,4

1,04

Опель

7

6,0

1,71

Фольксваген

6

7,0

1,67

Ауди

3

8,6

1,52

Итого

21

6.5

-

Как видно из табл. 4.8, групповые средние достаточно сильно варьируют по маркам автомобилей, что позволяет сделать вывод о наличии связи между маркой автомобиля и страховой суммой договора.

Измерить тесноту связи между признаками позволяет эмпирическое корреляционное отношение, расчет каждого основан на правиле разложения общей дисперсии на межгрупповую и среднюю из внутригрупповых (это правило называют также правилом сложения дисперсий).

Общая дисперсия характеризует вариацию признака-результата под влиянием всех факторов и условий, вызывающих эту вариацию. Рассчитать общую дисперсию можно по несгруппированнным данным по формуле:

,

где yi - значение результативного признака у i-ой единицы совокупности;

- среднее значение результативного признака в совокупности;

n - число единиц совокупности.

Вариация, обусловленная фактором, положенным в основание аналитической группировки, называется межгрупповой вариацией. Размеры её определяются при помощи дисперсии групповых средних.

Межгрупповая дисперсия характеризует колеблемость групповых средних результативного признака вокруг среднего значения результативного признака в совокупности и исчисляется по формуле:

где - среднее значение результативного признака в j-ой группе;

- частота (частость) j-ой группы.

Для определения влияния на результат всех прочих факторов и условий, кроме положенного в основание группировки, определяют дисперсии в пределах каждой группы - внутригрупповые дисперсии ( ). Эти дисперсии называют ещё остаточными дисперсиями, поскольку они характеризуют ту колеблемость, которая осталась в каждой группе после закрепления признака-фактора на определенном уровне (в нашем примере - это конкретная марка автомобиля). Обобщенное значение внутригрупповой колеблемости находят определив среднюю величину внутригрупповых дисперсий:

Для каждой группы внутригрупповую дисперсию рассчитывают по несгруппированным данным по формуле:

Таким образом, общая дисперсия может быть представлена как сумма межгрупповой дисперсии и средней из внутригрупповых дисперсий.

Это и есть правило сложения дисперсий.

Чем большая часть колеблемости результативного признака обусловлена действием признака-фактора, тем больше доля межгрупповой дисперсии в общей. Отношение межгрупповой дисперсии к общей называется коэффициентом детерминации( ):

,

а корень из этой величины – эмпирическим корреляционным отношением ( ). По величине эмпирического корреляционного отношения, который измеряется в пределах от 0 до 1, судят о тесноте связи между признаками. Чем ближе отношение к 1, тем связь теснее.

Значение эмпирического корреляционного отношения

Теснота связи

до 0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9 и более

слабая

умеренная

заметная

высокая

весьма высокая

Выполним расчеты по данным нашего примера.

Внутригрупповые дисперсии определяем по несгруппированным данным по отдельным маркам автомобилей. Так для автомобилей “Жигули” внутригрупповая дисперсия составит:

Для других марок расчеты выполняются аналогично. Результаты расчетов представлены в табл. 2 гр.3.

Средняя величина из внутригрупповых дисперсий:

Это средняя величина колеблемости страховых сумм внутри каждой группы застрахованных автомобилей, т.е. та колеблемость которая вызвана влиянием всех прочих причин и факторов, кроме марки автомобиля (год выпуска автомобиля, пробег, условия хранения и эксплуатации и т.д.).

Определим межгрупповую дисперсию:

Эта величина характеризует колеблемость страховых сумм, вызванную различием марок застрахованных автомобилей.

По правилу сложения дисперсий общая дисперсия равна:

Соответственно, коэффициент детерминации:

То есть 52% вариации страховых сумм обусловлено различием марок страхуемых автомобилей, а 48% - это вариация, приходящаяся на действие всех прочих факторов. Эмпирическое корреляционное отношение , что свидетельствует о достаточно тесной связи между маркой автомобиля и его страховой суммой.

В том случае, если признак-фактор, положенный в основание группировки, имеет количественное выражение возможен расчет ещё одной характеристики связи - показателя силы связи. Показатель силы связи отвечает на вопрос, как изменится признак-результат при изменении признака-фактора на одну единицу и рассчитывается для каждой группы по формуле:

где: yj,j-1 - значение результативного признака в j-ой и предыдущей группах;

ix - величина интервала признака-фактора.

В случае линейной связи, т.е. когда равномерному изменению признака фактора соответствуют равномерные изменения результата, может быть рассчитан средний показатель силы связи для всей совокупности ( ):

где: y1,m - это средние значения результативного признака, соответственно, в первой и последней группах;

x1,m - середины интервалов в первой и последней группах, выделенных по значению признака фактора.

В нашем примере признак х (марка автомобиля)–это неколичественный признак, поэтому расчет показателей силы связи невозможен.

Обратим внимание на то, что, если показатель тесноты связи – безразмерная величина, то показатель силы связи имеет размерность. Например, он может показывать на сколько единиц в среднем изменится часовая выработка при изменении механизации труда на один процент или же – на сколько рублей в среднем в месяц повысится заработная плата при росте квалификации рабочего на один тарифный разряд и т.д.

Контрольные вопросы и задания.

  1. Как вы могли бы определить сущность метода группировки?

  2. Какие виды группировок вам известны?

  3. Как выбирается группировочный признак? И как определяются интервалы группировочного признака?

  4. Какие виды интервалов используются для группировки?

  5. Какими показателями измеряется структура совокупности и ее динамика?

  6. В чем состоит особенность аналитической группировки?

  7. Как измерить силу связи между признаками на основе аналитической группировки?

  8. В чем состоит правило сложения дисперсий? Приведите формулы межгрупповой, внутригрупповой и общей дисперсий.

  9. В чем состоит значение факторной дисперсии для измерения связи между двумя признаками?

  10. Как измерить тесноту связи на основе аналитической группировки?

  11. Почему коэффициент детерминации не может быть больше единицы?

  12. Почему коэффициент детерминации не может быть меньше нуля?