- •Томашевский а.В., Рысиков в.П. Учебное пособие компьютерные технологии статистической обработки данных
- •Введение
- •1.Краткая характеристика основных пакетов статистической обработки
- •1.1. Общие представления
- •1.2. Ввод данных в пакете statistica
- •1.3.Контрольные вопросы и задания
- •1.3.1.Вопросы
- •1.3.2. Задания
- •2. Начальная статистическая обработка данных
- •2.1. Понятие о генеральной совокупности и выборке
- •2.2. Случайные величины и их характеристики
- •2.3. Распределения случайных величин
- •2.4. Компьютерные технологии начальной статистической обработки
- •2.5. Контрольные вопросы и задания
- •2.5.1.Вопросы
- •2.5.2. Задание
- •3. Проверка статистических гипотез
- •3.1. Основные положения
- •3.2. Проверка гипотезы о законе распределения
- •3.3. Проверка гипотез о равенстве дисперсий и математических ожиданий
- •3.4. Компьютерные технологии проверки статистических гипотез
- •3.5. Контрольные вопросы и задания
- •3.5.1.Вопросы
- •3.5.2. Задания
- •4. Корреляционный анализ
- •4.1. Основные положения
- •4.2. Корреляционное поле
- •4.3. Выборочный коэффициент корреляции.
- •4.4. Корреляционное отношение
- •4.5. Частные коэффициенты корреляции.
- •4.6. Ранговая корреляция.
- •4.7. Компьютерные технологии корреляционного анализа
- •4.8. Контрольные вопросы и задания
- •4.8.1.Вопросы
- •4.8.2. Задания
- •5. Регрессионный анализ
- •5.1. Основные положения
- •5.2. Компьютерные технологии регрессионного анализа
- •5.3. Контрольные вопросы и задания
- •5.3.1.Вопросы
- •5.3.2. Задания
- •6. Дисперсионный анализ
- •6.1. Основные положения
- •6.2. Однофакторный дисперсионный анализ
- •6.3 Двухфакторный дисперсионный анализ
- •6.5. Контрольные вопросы и задания
- •6.5.1.Вопросы
- •5.3.2. Задания
- •7. Планирование эксперимента
- •7.1. Основные положения
- •7.2. Полный факторный эксперимент
- •7.3 Центральное композиционное планирование
- •7.5. Контрольные вопросы и задания
- •7.5.1.Вопросы
- •7.5.2. Задания
- •Приложение статистические таблицы Функция стандартного нормального распределения
- •Критические точки распределения Стьюдента
- •Критические точки распределения 2
- •Рекомендована література
4.7. Компьютерные технологии корреляционного анализа
ИСПОЛЬЗОВАНИЕ ВСТРОЕНЫХ СТАТИСТИЧЕСКИХ ФУНКЦИЙ И ПАКЕТА АНАЛИЗА Microsoft Excel..
Для проведения корреляционного анализа могут быть использованы функции:
КОВАР - возвращает значение ковариации, то есть среднее произведений отклонений для каждой пары точек данных. Ковариация используется для определения связи между двумя множествами данных.
КОРРЕЛ - возвращает коэффициент корреляции. Коэффициент корреляции используется для определения наличия взаимосвязи между двумя выборками.
Средства статистического анализа доступны через команду Анализ данных меню Сервис. В окне Анализ данных для корреляционного анализа используются следующие инструменты.
Корреляция для количественной оценки взаимосвязи двух наборов данных.. Коэффициент корреляции выборки представляет отношение ковариации двух наборов
Ковариация дает возможность установить, ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная ковариация), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная ковариация), или данные двух диапазонов никак не связаны (ковариация близка к нулю).
Пример 4.7.1. В таблице 4.7.1 даны два набора данных
Таблица 4.7.1.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
2,0 |
3,7 |
1,4 |
0,8 |
0,8 |
1,7 |
3,7 |
2,0 |
1,2 |
1,6 |
-0,9 |
-1,1 |
3,8 |
1,1 |
2,4 |
-0,3 |
-0,3 |
1,1 |
4,2 |
-0,9 |
2,1 |
9,4 |
1,9 |
-1,6 |
2,7 |
2,8 |
5,8 |
3,2 |
4,2 |
4,7 |
5,7 |
-3,1 |
7,0 |
4,3 |
5,1 |
-1,8 |
6,1 |
3,4 |
4,1 |
-1,9 |
В результате обработки данных таблицы 4.7.1с помощью инструмента Корреляция получим.
|
Строка 1 |
Строка 2 |
Строка 1 |
1 |
|
Строка 2 |
0,750144 |
1 |
Следовательно, коэффициент корреляции равен 0,75.
корреляционный анализ в пакете STATISTICA
Шаг 1. Ввести или импортировать (например, из Excel) исходные данные в рабочую книгу (Workbook) системы STATISTICA, выделить их, ввести название таблицы исходных данных и названия переменных.
Шаг 2. Щелкнуть по кнопке Start menu …, расположенной в левом нижнем углу окна приложения и в появившемся меню выбрать Statistics ® Basic Statistics and Tables ® Correlation matrices.
Шаг 3. В появившемся окне Product-Moment and Partial Correlations - Quick Tab
выбрать кнопку Summary: Correlation matrix, после чего появляется окно с корреляционной матрицей по выбранным переменным.
Пример 4.7.2. При изготовлении биполярных интегральных микросхем одной из важнейших технологических операций является «диффузия фосфора». Данная операция характеризуется следующими переменными.
Выходная переменная:
y - глубина диффузии фосфора, мкм.
Входные переменные:
x1 − время диффузии 1-ой стадии, мин.;
x2 − время диффузии 2-ой стадии, мин.;
x3 − поверхностное сопротивление (ом/ٱ) после 1-ой стадии диффузии;
x4 − поверхностное сопротивление (ом/ٱ) после 2-ой стадии диффузии;
x5 − температура диффузии;
Результаты измерений входных и выходных переменных по данным 30 партий приведены в таблице 4.7.2.
Таблица 4.7.2.
-
y
x1
x2
x3
x4
x5
1
2,9
40
338
41,5
250,4
1044
2
3,5
34
334
44,7
244,3
1059
3
1,4
22
292
41,5
246,1
1051
4
3,7
51
352
48,5
241,8
1060
5
1,7
32
290
48,9
242,4
1044
6
2,1
34
292
39,2
237,8
1042
7
3,0
45
348
47,0
246,7
1055
8
2,9
31
324
47,8
239,7
1059
9
3,1
46
335
45,0
237,0
1053
10
2,6
44
326
45,1
247,2
1054
11
2,3
45
336
33,7
255,6
1047
12
2,7
43
304
45,8
248,4
1054
13
3,0
46
344
46,0
244,1
1064
14
1,6
20
308
40,4
231,8
1044
15
2,3
49
288
41,7
246,1
1045
16
1,4
24
315
41,8
244,0
1057
17
2,9
45
330
43,0
250,2
1046
18
2,6
42
316
46,9
250,5
1049
19
1,9
37
325
42,5
242,7
1051
20
1,9
36
319
43,0
238,6
1053
21
1,6
33
284
35,2
235,1
1037
22
1,8
33
275
36,3
248,0
1048
23
4,4
50
351
42,0
224,7
1043
24
1,6
28
289
44,9
229,4
1034
25
3,8
58
353
39,9
231,2
1044
26
2,1
37
318
33,2
229,5
1055
27
2,5
36
323
46,3
232,4
1044
28
0,4
33
260
41,1
240,0
1056
29
3,4
55
349
50,4
234,5
1059
30
3,6
43
352
42,2
229,3
1053
Необходимо: оценить наличие и силу (тесноту) корреляционных связей между выходной и входными переменными.
Решение. Для решения поставленной задачи может быть использована технология корреляционного анализа статистического пакет statistica. Подготовим исходные данные приведеные в таблице 4.7.2 по технологии, изложенной в п.1.2.
Выполнив команду Statistics ® Basic Statistics and Tables ® Correlation matrices.
шаги 1-4, получим корреляционную матрицу
из которой видно, что между y - глубиной диффузии фосфора и переменными x1 − диффузии 1-ой стадии; x2 − временем диффузии 2-ой стадии существует довольно сильная корреляционная связь. Также, наблюдается незначительные корреляции между входными переменными. Корреляционноеполе y - x2 указывает на линейный характер связи между этими переменными.
