Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 8. Статметоды изучения взаимосвязей.rtf
Скачиваний:
25
Добавлен:
12.02.2015
Размер:
569.69 Кб
Скачать

Вопрос 2. Простейшие статметоды изучения взаимосвязей.

I. Методы сравнения параллельных рядов.

Предположим, нужно выявить, есть ли зависимость между выпуском продукции на предприятии и себестоимостью. Берем предприятия и ранжируем их по объему выпуска (по возрастанию), и смотрим, возрастает ли или уменьшается при этом себестоимость.

Такой простой способ не применим в большинстве случаев. Например, если у нас не 5 предприятий, а 100, то их ранжирование и прослеживание изменения себестоимости будет тяжелым.

Еще один простой способ – использование коэффициента Фехнера (коэффициента корреляции знака). Он рассчитывается так:

С – число случаев совпадения знаков, Н – число случаев несовпадения знаков отклонения значений признака от значения средней.

Например, есть данные по 5 предприятиям:

№ п/п

Выпуск продукции, млн. руб. (X)

Себестоимость, руб. (Y)

Знак отклонения от среднего значения

знак

знак

1

6

4,4

-

+

2

8

4,2

-

+

3

10

4,3

+

+

4

11

3,2

+

-

5

13

3,9

+

-

,

Знак “минус” показывает, что связь обратная; 0,6 показывает, что связь все-таки есть.

Вообще . Чем ближе абсолютное значение коэффициента к единице, тем сильнее связь. Если, то связь почти не выражена.

Другой показатель – коэффициент ранга Спирмена:

d2 – квадрат разности рангов, ранг – место признаков в ранжированном ряду; n – число единиц.

Например:

№ п/п

X

Y

ранг

Разность рангов

X

Y

1

6

4,4

1

6

-5

2

8

4,2

2

4

-2

3

10

4,3

3

5

-2

4

11

3,2

4

1,5

2,5

5

13

3,9

5

3

2

6

15

3,2

6

1,5

4,5

Таким образом, есть обратная взаимосвязь.

Это коэффициент для грубой оценки.

II. Факторные группировки и анализ дисперсии.

При этом методе мы делаем следующее:

  1. определяем, какой признак факторный, какой – результативный;

  2. производим группировку по факторному признаку;

  3. считаем среднее значение факторного и результативного признака в группах;

  4. выясняем взаимосвязь между этими средними.

Для оценки тесноты связи по результатам факторной группировки используется межгрупповая дисперсия:

Если при этом групповая средняя равна средней общей, то это означает, что фактор, положенный в основу группировки, на результативный признак не влияет.

Межгрупповая дисперсия характеризует колеблемость групповых средних вокруг общей средней, которая возникает под действием факторов, положенных в основу группировки.

Также для оценки тесноты связей используют коэффициент детерминации:

Данный коэффициент показывает, какая часть общей дисперсии связана с факторами, положенными в основу группировки. Если , то это довольно тесная связь.

Этот показатель всегда рассчитывается по выборочным данным, и потому может быть ситуация, когда данное значение получилось случайно. Чтобы исключить случайности, проводят проверку достоверности. Для этого можно рассчитать критерий Фишера:

n – число единиц совокупности, m – число образованных групп.

n-1 – степень свободы по межгрупповой дисперсии, n-m – степень свободы по средней дисперсии из внутригрупповых.

Число степеней свободы – это число свободно варьирующихся элементов, которые могут применять произвольные значения, не меняя ранее исчисленные характеристики.

Фишер составил таблицы, по которым можно определить значения критерия. Если мы получаем значение F, большее, чем значение в таблице, то рассчитываемое значение получилось не случайно (с вероятностью 99% или 95%, в зависимости от того, какую таблицу мы взяли).

Нужно учитывать, что критерий Фишера можно использовать только тогда, когда распределение близко к нормальному. (Так что, вообще применение этого критерия достаточно глупо.)

III. Факторная группировка и изучение стохастической связи между атрибутивными признаками.

Факторная группировка может использоваться не только для изучения корреляционных связей, но и для изучения стохастических связей вообще.

Например, необходимо определить тесноту связи между двумя альтернативными признаками. Для этого используется коэффициент контингенции. Строится четырехпольная таблица.

Пример: нужно выяснить тесноту связи между уровнем квалификации работников и выполнением нормы.

Строим таблицу:

группа по квалификации

число работников, чел.

итого

выполняют норму

не выполняют

квалифицированные

a=55

b=5

a+b=60

неквалифицированные

c=55

d=55

c+d=40

всего

a+c=80

b+d=20

Чтобы получить результат с правильным знаком, нужно чтобы в (1,1)-ой клетке стояло число единиц, которые обладают обоими признаками.

Иногда приходится выяснять тесноту связи между признаками, которые имеют не 2, а более вариантов. Тогда используется коэффициент взаимной сопряженности Пирсона.

Значения L берутся из таблицы:

группы по признаку А

группы по признаку B

всего

B1

B2

B3

A1

f1

f2

f3

n1

A2

f4

f5

f6

n2

A3

f7

f8

f9

n3

итого

m1

m2

m3

Чем ближе значение коэффициента к единице, тем выше теснота связи.