Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпаргалки для студентов.doc
Скачиваний:
4
Добавлен:
21.08.2019
Размер:
1.27 Mб
Скачать

Вопрос 37 Количественная оценка тесноты связи по эмпирическим данным: коэффициент линейной парной корреляции. Ответ

Коэффициент линейной парной корреляции используется для оценки степени тесноты линейной связи (был предложен Кэндэлом Пирсоном).

Строится как отношение показателя ковариации к произведению среднеквадратических отклонений признаков X и Y: .

Показатель ковариации – это показатель связи, который вычисляется следующим образом:

.

Это размерный показатель; его единицы измерения равны произведению единиц измерения Х на единицы измерения Y.

Свойства ковариации:

  1. cov(X,X)=х2 ;

  2. cov(X,A)=0, где A-const.

Линейный коэффициент корреляции в отличие от ковариации – показатель безразмерный и поэтому легко интерпретируемый. Он может быть рассчитан также по формуле: .

Область допустимых значений линейного коэффициента корреляции от -1 до +1. Если значение коэффициента корреляции по модулю близко к единице, то связь близка к линейной функциональной. Если признаки Х и Y взаимно независимы, то значение коэффициента корреляции близко к нулю. Равенство нулю коэффициента корреляции означает отсутствие только линейной связи. Признаки же могут быть связаны тесной нелинейной связью и при этом иметь нулевой коэффициент корреляции (например, в случае параболической формы связи).

Отрицательные значения коэффициента корреляции свидетельствуют об обратной зависимости признаков, положительные значения свидетельствуют о прямой зависимости.

Линейный коэффициент парной корреляции может быть рассчитан по сгруппированным данным, а именно, по данным комбинационной группировки:

Xi

Yj

Итого по строке

(fi)

Y1

Y2

....

Yk

X1

f11

f12

f1k

f1

X2

f21

f22

f2k

f2

....

Xm

fm1

fm2

fmk

fm

Итого по столбцу (fj)

f1

f2

fk

N

В этом случае формула расчета линейного парного коэффициента корреляции следующая:

где N- объем совокупности; f – частоты распределения значений признаков.

Вопрос 38

Понятие регрессии и описание ее на эмпирическом уровне.

ОТВЕТ

Регрессиязависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин.

Описание регрессии на эмпирическом уровне сводится к построению эмпирической регрессии.

Эмпирическая регрессия строится по данным аналитической или комбинационной группировок и представляет собой зависимость групповых средних значений признака-результата от групповых средних значений признака-фактора. Графическим представлением эмпирической регрессии является линия эмпирической регрессии - ломанная линия, составленная из точек, абсциссами которых являются групповые средние значения признака-фактора, а ординатами – групповые средние значения признака-результата. Число точек равно числу групп в группировке.

Рекомендуется наносить эмпирическую линию регрессии на «корреляционное поле». Корреляционное поле – точечный график в системе координат (Х;Y). Каждая точка соответствует единице совокупности. Положение каждой точки на графике определяется величиной 2-ух признаков – факторного и результативного (относящихся к данной единице совокупности).

Точки корреляционного поля обычно не лежат на одной линии, они вытянуты определенной полосой вдоль некоторой гипотетической линии.

Эмпирическая линия регрессии отражает основную тенденцию рассматриваемой зависимости. Если эмпирическая линия регрессии по своему виду приближается к прямой линии, то можно предположить наличие прямолинейной корреляционной связи между признаками. А если линия связи приближается к кривой, то это может быть связано с наличием криволинейной корреляционной связи.

Рассмотрим пример построения эмпирической линии регрессии для анализа взаимосвязи признаков: Y- выработка рабочего (шт./смену) и Х- квалификация (разряд) рабочего по совокупности из 20 рабочих. Исходные данные представлены в таблице:

X

3

3

3

4

4

5

5

5

5

6

6

6

6

7

7

7

8

8

8

8

Y

10

12

13

11

14

12

13

15

16

15

17

17

18

18

20

22

23

24

27

25

Чтобы построить эмпирическую линию регрессии произведем аналитическую группировку рабочих. Результаты представлены в таблице:

Признак-фактор Хj

3

4

5

6

7

8

Nj

3

2

4

4

3

4

Среднее значение признака-результата

11,7

12,5

14

16,75

20

24,75

Так как каждой группе соответствует единственное значение признака-фактора (Хj), то его среднее значение в группе совпадает с Хj: .

Нанесем точки ( ), j=1;m на корреляционное поле, соединим их отрезками и получим эмпирическую линию регрессии (рис.13).

Форма данной эмпирической линии регрессии напоминает возрастающий участок параболы, что позволяет выдвинуть гипотезу о параболической форме связи между признаками «выработка» и «разряд» для данной совокупности рабочих.

Р ис. 13. Построение эмпирической линии регрессии.