Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Компьютерные технологии статистической обработки данных.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
3.92 Mб
Скачать

4.7. Компьютерные технологии корреляционного анализа

ИСПОЛЬЗОВАНИЕ ВСТРОЕНЫХ СТАТИСТИЧЕСКИХ ФУНКЦИЙ И ПАКЕТА АНАЛИЗА Microsoft Excel..

Для проведения корреляционного анализа могут быть использованы функции:

КОВАР - возвращает значение ковариации, то есть среднее произведений отклонений для каждой пары точек данных. Ковариация используется для определения связи между двумя множествами данных.

КОРРЕЛ - возвращает коэффициент корреляции. Коэффициент корреляции используется для определения наличия взаимосвязи между двумя выборками.

Средства статистического анализа доступны через команду Анализ данных меню Сервис. В окне Анализ данных для корреляционного анализа используются следующие инструменты.

Корреляция для количественной оценки взаимосвязи двух наборов данных.. Коэффициент корреляции выборки представляет отношение ковариации двух наборов

Ковариация дает возможность установить, ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная ковариация), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная ковариация), или данные двух диапазонов никак не связаны (ковариация близка к нулю).

Пример 4.7.1. В таблице 4.7.1 даны два набора данных

Таблица 4.7.1.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

2,0

3,7

1,4

0,8

0,8

1,7

3,7

2,0

1,2

1,6

-0,9

-1,1

3,8

1,1

2,4

-0,3

-0,3

1,1

4,2

-0,9

2,1

9,4

1,9

-1,6

2,7

2,8

5,8

3,2

4,2

4,7

5,7

-3,1

7,0

4,3

5,1

-1,8

6,1

3,4

4,1

-1,9


В результате обработки данных таблицы 4.7.1с помощью инструмента Корреляция получим.

 

Строка 1

Строка 2

Строка 1

1

Строка 2

0,750144

1


Следовательно, коэффициент корреляции равен 0,75.

корреляционный анализ в пакете STATISTICA

Шаг 1. Ввести или импортировать (например, из Excel) исходные данные в рабочую книгу (Workbook) системы STATISTICA, выделить их, ввести название таблицы исходных данных и названия переменных.

Шаг 2. Щелкнуть по кнопке Start menu …, расположенной в левом нижнем углу окна приложения и в появившемся меню выбрать Statistics ® Basic Statistics and Tables ® Correlation matrices.

Шаг 3. В появившемся окне Product-Moment and Partial Correlations - Quick Tab

выбрать кнопку Summary: Correlation matrix, после чего появляется окно с корреляционной матрицей по выбранным переменным.

Пример 4.7.2. При изготовлении биполярных интегральных микросхем одной из важнейших технологических операций является «диффузия фосфора». Данная операция характеризуется следующими переменными.

Выходная переменная:

y - глубина диффузии фосфора, мкм.

Входные переменные:

x1время диффузии 1-ой стадии, мин.;

x2 время диффузии 2-ой стадии, мин.;

x3поверхностное сопротивление (ом/ٱ) после 1-ой стадии диффузии;

x4поверхностное сопротивление (ом/ٱ) после 2-ой стадии диффузии;

x5температура диффузии;

Результаты измерений входных и выходных переменных по данным 30 партий приведены в таблице 4.7.2.

Таблица 4.7.2.

y

x1

x2

x3

x4

x5

1

2,9

40

338

41,5

250,4

1044

2

3,5

34

334

44,7

244,3

1059

3

1,4

22

292

41,5

246,1

1051

4

3,7

51

352

48,5

241,8

1060

5

1,7

32

290

48,9

242,4

1044

6

2,1

34

292

39,2

237,8

1042

7

3,0

45

348

47,0

246,7

1055

8

2,9

31

324

47,8

239,7

1059

9

3,1

46

335

45,0

237,0

1053

10

2,6

44

326

45,1

247,2

1054

11

2,3

45

336

33,7

255,6

1047

12

2,7

43

304

45,8

248,4

1054

13

3,0

46

344

46,0

244,1

1064

14

1,6

20

308

40,4

231,8

1044

15

2,3

49

288

41,7

246,1

1045

16

1,4

24

315

41,8

244,0

1057

17

2,9

45

330

43,0

250,2

1046

18

2,6

42

316

46,9

250,5

1049

19

1,9

37

325

42,5

242,7

1051

20

1,9

36

319

43,0

238,6

1053

21

1,6

33

284

35,2

235,1

1037

22

1,8

33

275

36,3

248,0

1048

23

4,4

50

351

42,0

224,7

1043

24

1,6

28

289

44,9

229,4

1034

25

3,8

58

353

39,9

231,2

1044

26

2,1

37

318

33,2

229,5

1055

27

2,5

36

323

46,3

232,4

1044

28

0,4

33

260

41,1

240,0

1056

29

3,4

55

349

50,4

234,5

1059

30

3,6

43

352

42,2

229,3

1053

Необходимо: оценить наличие и силу (тесноту) корреляционных связей между выходной и входными переменными.

Решение. Для решения поставленной задачи может быть использована технология корреляционного анализа статистического пакет statistica. Подготовим исходные данные приведеные в таблице 4.7.2 по технологии, изложенной в п.1.2.

Выполнив команду Statistics ® Basic Statistics and Tables ® Correlation matrices.

шаги 1-4, получим корреляционную матрицу

из которой видно, что между y - глубиной диффузии фосфора и переменными x1диффузии 1-ой стадии; x2 временем диффузии 2-ой стадии существует довольно сильная корреляционная связь. Также, наблюдается незначительные корреляции между входными переменными. Корреляционноеполе y - x2 указывает на линейный характер связи между этими переменными.