Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1627.pdf
Скачиваний:
43
Добавлен:
07.01.2021
Размер:
1.43 Mб
Скачать

3.6.2. Исключение из массива первичной информации промахов

Определяются и исключаются промахи в соответствии с методикой, изложенной в подразд. 2.4. Для упрощения анализа применяется критерий «трех сигм»: определяются значения фактора x, не попавшие в последнюю строку табл. 3.2, они являются промахами и исключаются из выборки. Для последующего анализа формируется новый массив.

3.6.3. Установление факта наличия и направления корреляционной зависимости между результативным и факторным признаками

Основным методом выявления наличияИкорреляционной связи является метод аналитической группировки и определения групповых

Для установления наличия корреляционной связи используются методы параллельного сопоставления рядов результативного и факторного признаков, графического изображения фактических данных с

средних. Он заключается в том, что всеДединицы совокупности разбиваются на группы по величине признака-фактора и для каждой груп-

помощью поля корреляции, построения корреляционной таблицы.

пы определяется средняя величина результативного признака. На ос-

нове данных анал т ческой группировкиА

строится график эмпириче-

ской линии связи (лин я регрессииб), вид которой не только позволяет судить о возможномСнал ч связи, но и дает некоторое представление о форме корреляц онной связи. Если эмпирическая линия связи по своему виду приближается к прямой линии, то можно предположить наличие прямолинейной корреляционной связи; если эмпирическая линия приближается к какой-либо кривой, то это связано с наличием криволинейной связи.

3.6.4. Измерение степени тесноты связи, оценка ее существенности

Для определения степени тесноты парной линейной зависимости служит линейный коэффициент корреляции r. Степень тесноты связи при любой форме зависимости (линейной, криволинейной) оценивают с помощью эмпирического корреляционного отношения .

43

Расчет линейного коэффициента корреляции по несгруппированным данным осуществляется по формуле

 

 

 

 

 

xy

x y

 

 

 

 

 

 

 

r

 

 

 

 

 

 

 

 

 

.

(3.16)

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 2

 

 

 

 

 

 

 

 

 

 

 

 

 

y 2

 

 

 

 

x2

 

 

 

 

y2

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Линейный коэффициент корреляции может принимать значения в пределах от –1 до +1. Чем ближе он по абсолютной величине к 1, тем теснее связь. Знак при коэффициенте указывает направление связи: знак «+» соответствует прямой зависимости, знак «–» – обратной. Если коэффициент корреляции равен нулю, то связи между призна-

ками нет; если он равен единице, то между признаками существует

функциональная связь.

 

 

 

 

И

 

 

 

 

 

 

 

Оценка существенности линейного коэффициента корреляции

 

 

 

 

Д

 

проводится с использованием t-критерия Стьюдента по формуле

 

t

 

r

 

,

 

(3.17)

А

 

 

 

Sr

 

 

 

где Sr – средняя квадратическая ошибка коэффициента корреляции. При большом объеме выборки (свыше 50)

 

 

 

 

1 r2

 

и

Sr

 

 

 

 

 

.

(3.18)

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

При недостаточно ольшом о ъеме выборки

 

С

б

 

 

 

 

 

 

 

 

 

 

 

1 r2

 

 

 

Sr

 

 

 

 

.

(3.19)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 2

 

Критическое значение tT определяется по таблице распределения Стьюдента для заданного уровня значимости и числа степеней свободы d.f n 1 или d.f n 2(в зависимости от объема выборки). Если t tT , то следует говорить о существенности коэффициента корреляции.

Корреляционное отношение определяется по формуле

 

S2y

,

(3.20)

Sy2

 

 

 

где S2y – межгрупповая дисперсия результативного признака, вы-

званная влиянием признака-фактора; Sy2 – общая дисперсия результа-

тивного признака.

44

S2y

 

 

y

j

y

0 2 fj

;

(3.21)

 

 

 

 

 

 

 

 

 

 

 

fj

 

 

 

Sy2

 

yi

 

y

0 2

,

 

(3.22)

 

 

n

 

 

 

 

 

 

 

 

 

где yj – среднее значение результативного признака в соответствую-

щих группах, выделенных по величине признака-фактора; y0 – общая средняя для всей совокупности; f j – число единиц в соответствую-

щих группах.

Вычисление корреляционного отношения требует достаточно большого объема информации, которая должна быть представлена в

форме групповой таблицы или в форме корреляционнойИ таблицы, т.е.

обязательным условием является группировка данных по признакуфактору.

3.6.5. ПостроениеДмодели связи

Тип модели выбирается на основе сочетания теоретического анализа и исследования эмпирических данных посредством построения эмпирической линии регрессии. Чаще всего используются сле-

 

и

А

 

 

 

дующие типы функций:

~

 

 

 

линейная

 

yx

a bx;

 

1

 

С

 

 

 

2

 

 

2

 

 

 

 

 

 

~

 

 

 

 

 

 

 

гиперболическая

бyx a b

 

;

 

 

~

 

 

 

 

 

 

 

 

x

параболическая

yx

a bx cx

 

;

 

показательная

 

~

ab

x

.

 

 

 

 

 

 

yx

 

 

 

 

 

 

Для проверки возможности использования линейной функции

определяется модуль разности

 

 

r

; если она менее 0,1, то счита-

 

 

 

 

 

 

 

 

 

 

 

 

 

ется возможным применение линейной функции.

Система уравнений для определения параметров a и b уравнения прямолинейной корреляционной связи (для несгруппированных дан-

ных) имеет вид

(3.23)

 

 

y an b x;

 

yx a x b x2.

Параметры a и b можно найти по формулам

45

a

y

bx

; b

n xy x y

.

(3.24)

 

 

 

 

 

n x2 x 2

 

В качестве меры достоверности уравнения корреляционной зависимости используется процентное отношение средней квадратической ошибки уравнения Se к среднему уровню результативного признака y:

 

Se

 

 

 

 

~ 2

 

 

 

 

 

100%

;

Se

y y

,

 

(3.25)

 

 

y

 

n g

~

 

 

 

 

 

 

 

 

 

 

где y – фактические значения результативного признака;

– значе-

y

ния результативного признака, рассчитанные по уравнению регрессии; g – число параметров уравнения регрессии.

Если это отношение не превышает 10 – 15 %, то следует счи-

 

И

тать, что уравнение регрессии достаточно хорошо отображает изу-

чаемую взаимосвязь.

Д

Для результативного признака определяются доверительные границы, в пределах которых с заданной доверительной вероятностью будет находиться теоретическое значение y. оверительные границы результативного признака y при значении факторного признака x0

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

 

вычисляются следующим образом:

 

 

 

 

 

 

 

 

 

 

~

Se

 

 

 

x0

x

2

 

 

~

 

Se

 

 

x0

x

2

 

 

yx t

 

 

1

 

и

 

 

y yx

t

 

1

 

 

 

,

(3.26)

 

n

 

 

2

 

 

 

 

2

 

0

 

 

 

 

Sx

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А n

 

 

Sx

 

 

где t определяется в соответствии с уровнем значимости по распре-

делению Стьюдента для ч сла степеней свободы d.f n 1.

3.7. Пример примененияС корреляционно-регрессионного анализа

В табл. 3.3 приведены данные исследования зависимости объема выпускаемой продукции от уровня автоматизации поточных линий. Провести на основе приведенных данных исследование взаимосвязи объема выпускаемой продукции от уровня автоматизации поточных линий. Результативный признак – объем продукции y. Факторный признак – уровень автоматизации поточной линии x.

Первичная информация проверяется на однородность по при- знаку-фактору с помощью коэффициента вариации.

x

 

x

73,5 %;

Sx

x

x

2

4,1 %;

V

4,1

 

100 5,4 %.

n

n

73,5

 

 

 

 

 

 

 

46

V 33%, следовательно, совокупность можно считать однород-

ной.

 

 

Данные для анализа

 

 

Таблица 3.3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Номер

Уровень

Объем

 

Номер

 

 

Уровень

Объем

автоматизации,

продукции,

 

 

автоматизации,

продукции,

линии

 

линии

 

 

%

млн руб.

 

 

 

 

%

млн руб.

1

77,8

18,5

 

11

 

 

69,6

17,5

2

69,0

18,2

 

12

 

 

79,2

21,8

3

76,5

20,4

 

13

 

 

70,8

16,5

4

80,7

21,8

 

14

 

 

72,3

16,8

5

72,0

16,8

 

15

 

 

79,2

21,0

6

77,1

20,8

 

16

 

 

73,5

16,8

7

64,0

14,2

 

17

 

 

71,1

16,5

8

72,0

17,0

 

18

 

 

69,9

17,0

9

75,9

18,4

 

19

 

 

70,5

17,5

10

73,2

19,5

 

Д

75,0

20,9

 

20

 

 

 

Проверка первичной информации на Инормальность

распределе-

ния проводится с помощью правила «трех сигм» (табл. 3.4). Можно считать, что значения фактора подчиняются закону нормального распределения.

 

 

 

 

 

Таблица 3.4

 

Проверка пр знакаА-фактора на нормальность

 

С

б

Удельный вес

Удельный вес

 

 

Ч сло ед н ц,

единиц, входящих

единиц, входящих

Интервалы

 

ивходящих

в интервал,

в интервал, при

значений фактора

в интервал

в общем их числе,

нормальном

 

 

 

 

 

 

%

распределении, %

69,4 – 77,6

 

 

14

70,0

68,3

65,3 – 81,7

 

 

19

95,0

95,4

61,2 – 85,8

 

 

20

100

99,7

Все значения факторного признака попадают в интервал «трех сигм» 61,2 xi 85,8, следовательно, грубых ошибок (промахов) в первичной информации нет.

Для установления наличия связи y x производится аналитическая группировка по факторному признаку. Группировка выполняется при равных интервалах и числе групп m=5. Величина интервала

47

i xmax xmin 80,7 64,0 3,4 %. m 5

Расчеты приведены в табл. 3.5, 3.6. Как видно из данных групповой таблицы, с увеличением уровня автоматизации поточных линий объем выпускаемой на них продукции растет. На рис. 3.3 представлен график связи. Эмпирическая линия связи приближается к прямой линии. Следовательно, можно предполагать наличие прямолинейной корреляции.

Таблица 3.5

Вспомогательная таблица для заполнения групповой таблицы

x, %

 

 

 

64,0 – 67,4

 

67,4 – 70,8

70,8 – 74,2

 

74,2 – 77,6

 

 

77,6 – 81,0

Номер линии

 

 

7

 

2; 11; 18;

5; 8; 10;

 

 

 

 

 

 

 

 

 

 

 

1; 4; 12; 15

 

 

 

 

 

 

И

 

 

 

 

 

 

19

 

 

 

 

13; 14; 16;

 

 

3; 6; 9; 20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18,2; 17,5;

16,8;17,0;

 

 

 

 

 

 

 

 

 

 

 

 

y, млн руб.

 

 

14,2

 

17,0; 17,5

Д

 

 

20,4; 20,8;

 

 

 

18,5; 21,8;

 

 

 

19,5; 16,5;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16,8; 16,8;

 

 

18,4; 20,9

 

 

 

 

21,8; 21,0

 

 

 

 

 

 

 

 

 

 

 

 

16,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А

 

 

i

 

 

 

 

 

 

 

 

 

 

Таблица 3.6

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Групповая таблица

 

 

 

 

 

 

 

 

 

 

 

 

x, %

 

 

 

и

 

 

fj

 

 

 

 

yij

 

 

y

 

 

, млн руб.

 

 

 

x , %

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

64,0 – 67,4

 

 

 

С

 

 

 

 

 

1

 

 

 

 

14,2

 

 

 

 

 

 

14,2

 

 

 

65,7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

67,4 – 70,8

 

 

 

69,1

 

 

 

 

 

4

 

 

 

 

70,2

 

 

 

 

 

 

17,6

70,8 – 74,2

 

 

 

72,5

 

 

 

 

 

7

 

 

 

 

119,9

 

 

 

 

 

 

17,1

74,2 – 77,6

 

 

 

75,9

 

 

 

 

 

4

 

 

 

 

80,5

 

 

 

 

 

 

20,1

77,6 – 81,0

 

 

 

79,3

 

 

 

 

 

4

 

 

 

 

83,1

 

 

 

 

 

 

20,8

Для измерения степени тесноты связи вычисляем линейный ко-

эффициент корреляции (3.16).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для расчета r использована вспомогательная табл. 3.7.

 

 

 

 

 

 

27173,1

1469,3 367,9

 

 

 

 

 

145,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

0,86.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

168,2

 

 

 

1469,3

2

 

 

 

 

367,9

2

 

 

108274,1

 

 

6852,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение линейного коэффициента корреляции свидетельствует о наличии прямой и достаточно тесной связи.

48

 

 

25

 

 

 

 

 

 

 

 

 

 

 

 

y,

 

 

 

 

 

 

 

 

 

 

 

 

млнруб.

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

65,7

69,1

 

72,5

75,9

 

79,3

 

 

 

 

 

 

 

 

 

 

 

 

 

x, %

 

 

 

Рис.3.3. Зависимость объема выпускаемой продукции

 

 

 

 

 

от уровня автоматизации поточных линий

 

 

 

 

 

 

 

 

 

 

 

 

И

Таблица 3.7

 

 

 

 

 

 

 

 

 

 

 

 

Данные для расчета коэффициента корреляции и уравнения связи

 

Номер

x,

 

y,

x

2

 

y

2Д

~

~

~

2

линии

%

 

млн руб.

 

 

 

xy

y

y y

y y

 

 

 

 

 

 

 

 

 

 

 

 

1

77,8

 

18,5

6052,8

342,3

1439,3

20,3

-1,8

3,21

 

2

69,0

 

18,2

 

 

А

1255,8

16,4

1,8

3,17

 

 

4761,0

331,2

 

3

76,5

 

20,4

5852,3

416,2

1560,6

19,7

0,7

0,46

 

4

80,7

 

21,8

б6512,5 475,2

1759,3

21,6

0,2

0,05

 

5

72,0

 

16,8

5184,0

282,2

1209,6

17,7

-0,9

0,88

 

6

77,1

 

20,8

5944,4

432,6

1603,7

20,0

0,8

0,67

 

7

64,0

 

и

 

201,6

908,8

14,2

0,0

0,00

 

 

14,2

4096,0

 

8

72,0

 

17,0

5184,0

289,0

1224,0

17,7

-0,7

0,55

 

9

75,9

 

18,4

5760,8

338,6

1396,6

19,5

-1,1

1,12

 

10

73,2

С

5358,2

380,3

1427,4

18,3

1,2

1,52

 

 

19,5

 

11

69,6

 

17,5

4844,2

306,3

1218,0

16,7

0,8

0,67

 

12

79,2

 

21,8

6272,6

475,2

1726,6

20,9

0,9

0,80

 

13

70,8

 

16,5

5012,6

272,3

1168,2

17,2

-0,7

0,51

 

14

72,3

 

16,8

5227,3

282,2

1214,6

17,9

-1,1

1,15

 

15

79,2

 

21,0

6272,6

441,0

1663,2

20,9

0,1

0,01

 

16

73,5

 

16,8

5402,3

282,2

1234,8

18,4

-1,6

2,56

 

17

71,1

 

16,5

5055,2

272,3

1173,2

17,3

-0,8

0,71

 

18

69,9

 

17,0

4886,0

289,0

1188,3

16,8

0,2

0,03

 

19

70,5

 

17,5

4970,3

306,3

1233,8

17,1

0,4

0,18

 

20

75,0

 

20,9

5625,0

436,8

1567,5

19,1

1,8

3,39

 

 

1469,3

367,9

108274

6852,8

27173,1

21,62

 

 

 

 

,1

 

 

 

 

 

 

 

 

49

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]