Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции сокращен 14 час.doc
Скачиваний:
32
Добавлен:
02.09.2019
Размер:
1.78 Mб
Скачать

Корреляционно-регрессионный анализ

Понятия «корреляция» и «регрессия» тесно связаны между собой. В корреляционном анализе оценивается сила связи и ее направление, а в регрессионном исследуется ее форма.

Простейшим приемом обнаружения связи является:

1) сопоставление двух параллельных рядов — ряда значений факторного признака и соответствующих ему значений результативного признака. Значения факторного признака располагают в возрастающем порядке и затем прослеживают направление изменения величины результативного признака. Результативный признак (функцию) в дальнейшем будем обозначать через у, а факторный признак — через х.

В тех случаях, когда с возрастанием факторного признака возрастает величина результативного признака, то можно говорить о наличии прямой корреляционной связи. Если же с увеличением факторного признака величина результативного признака уменьшается, то можно предполагать обратную связь между признаками.

x

1

2

3

4

5

y

3

4

7

9

12

Мы видим, что с увеличением величины х величина у также растет. Значит связь между признаками – прямая.

2) Метод группировок. Проводится группировка единиц совокупности по факторному признаку. Для каждой группы рассчитывается среднее значение результативного признака. Если факторный признак и среднее значение результативного признака изменяется в одном направлении, то связь прямая, если в разных – обратная, если нет закономерности, то связь отсутствует.

Затраты на рекламу (усл. ден. ед.)

8

9

10

11

12

Среднее число туристов, воспользовавшихся услугами фирмы, чел.

790

860

966

1062,5

1100

3) Статистическую связь между двумя признаками можно изобразить графически и по графику судить о наличие, о направлении и форме связи. При этом на оси абсцисс откладывают значение факторного признака, а по оси ординат – результативного.

. … …. … ..

. . . . .

. . . .

.. …. …. ….

.. ….. ….. …

. .. …. .. …..

а) зависимость между признаками отсутствует

б) прямая зависимость между признаками

в) обратная зависимость между признаками

Однако большое число единиц в совокупности, а также, если одному значению факторного признака соответствует несколько значений результативного признака, затрудняет восприятие рядов.

В таких случаях целесообразнее воспользоваться для установления факта наличия связи корреляционными таблицами.

4) Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. Так как в приводимом примере факторный признак представлен всего пятью вариантами повторяющихся значений, достаточно в первом столбце табл. 4 записать эти варианты.

Для результативного признака необходимо определить величину интервала. Для этого воспользуемся формулой Стерджесса:

человек,

где k=1+3,322*lg20=5

В корреляционной таблице факторный признак, как правило, располагают в строках, а результативный признак у — в столбцах (графах) таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного сочетания значений х и у (табл. 2).

Группировка значений факторного и результативного признаков Таблица 4

Центральное значение интервала

768

865

962

1059

1156

fx

х*fx

x2*fx

Группы по у

Группы

по х

720-816

817-913

914-1010

1011-1107

1108-1204

8

2

1

-

-

3

800

24

192

9

1

3

1

-

5

865

45

405

10

-

1

3

1

5

962

50

500

11

-

1

1

1

1

4

1035

44

484

12

-

-

1

1

1

3

1059

36

432

fy

3

6

6

3

2

20

-

199

2013

yfy

2304

5190

5772

3177

2312

18755

-

-

-

xyfy

19200

48440

59644

34947

26588

188819

-

-

-

Примечание. yj —среднее значение результативного признака j-й группы значений факторного признака; xyfxy=768*8*2 + 768*9*1=19200 (см. табл.)

fx — частота повторения данного варианта значения факторного признака для всей совокупности;

f y—частота повторения результативного признака по всей совокупности.

По данной корреляционной таблице можно сделать предположение о наличии или отсутствии связи, а также выяснить ее направление. Если частоты в корреляционной таблице расположены по диагонали из левого верхнего угла в правый нижний угол (т.е. большим значениям фактора соответствуют большие значения функции), то можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по диагонали справа налево (из правого верхнего угла в левый нижний угол), то предполагают наличие обратной связи между признаками.

О тесноте связи между признаками x и y можно судить по кучности расположения частот вокруг диагонали. Если клетки заполнены большими цифрами, то связь слабая. Чем ближе частоты (fxy) располагаются к одной из диагоналей, тем теснее связь. Если в расположении частот (fxy) нет системности, то можно судить об отсутствии связи.

Для более четкого выявления основной тенденции связи, можно для каждой строки рассчитать средние значения результативного признака, соответствующие значению признака-фактора.

Корреляционная таблица позволяет компактно изложить материал, поэтому все последующие расчеты (показателей тесноты связи и параметров уравнения регрессии) можно вести по корреляционной таблице, что особенно удобно при значительном объеме исходных данных.