Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
107
Добавлен:
12.02.2015
Размер:
2.47 Mб
Скачать

3.2. Регрессионный анализ

Если корреляционный анализ на основе диаграмм разброса позволяет установить наличие и оценить степень тесноты взаимосвязи двух и более параметров, то регрессионный анализ позволяет выразить установленную взаимосвязь в виде уравнения регрессии, которое кроме возможности рассчитывать характеристику (или результат)упо одному или многим факторам (или причинам)х, даёт тоже достаточно много информации о характере и степени тесноты между исследуемыми параметрами.

В производстве стекла имеются весьма широкие возможности использования регрессионного анализа, например. для оценки взаимосвязи параметров качества или свойств стекла (как материала) с химическим составом; параметров качества выпускаемой продукции (свойств, например, ленты стекла) с технологическими параметрами приготовления шихты, варки стекла, формования, отжига ленты и т.д.

Для регрессионного анализа используют данные а к т и в н ы х экспериментов, в ходе которых «раскачивают» технологический процесс, и данныеп а с с и в н ы х экспериментов, т.е. результаты текущих наблюдений за процессом. При этом в первом случае возможна «порча» продукции; во втором случае в процесс не вмешиваются, за ним только наблюдают.

Ход регрессионного анализа рассмотрим на конкретном примере. Хотя расчёт можно вести с помощью компьютеров, предлагаем для понимания процесса расчёта подробное изложение его.

Найдем уравнение регрессии между содержанием в стекле оксида Fe 2O 3(F) и светопропусканием стекла в ИК-области спектра (D) по экспериментальным данным (пассивный эксперимент !), представленным в табл. 10. В предыдущем примере мы установили, что связь между этими параметрами существует. Но какая: линейная или криволинейная? – неизвестно.

Задаёмся самой простой формой связи – линейной и будем рассчиты-

вать уравнение регрессии 1-ой степени, которое имеет следующий вид:

D=a 0+a 1F.

Cоставим систему уравнений на основе экспериментальных данных:

a 0 · n + a 1 · Σ F = Σ D ,

a 0 · Σ F + a 1 · Σ F 2 = Σ D*F .

Подсчитаем соответствующие суммы и подставим их в уравнения. При этом следует иметь в виду: Σ F 2не равна (Σ F) 2и соответственно Σ D*F не равна (Σ D)*(Σ F).

26 a 0+ 7,41 а 1= 16,557 ;

7,41 а 0+ 2,114 а 1= 4,716625 .

При расчёте уравнений регрессии (если он ведётся не на компьютере, а с помощью калькулятора) рекомендуем считать до 5-6 знака за запятой. Это обеспечит необходимую точность уравнения регрессии.

Разделим каждое из уравнений на коэффициент при а 0:

а 0+ 0,28500 а 1= 0,63681 ;

а 0+ 0,28529 а 1= 0,63652 .

Для исключения из системы одного неизвестного вычитаем одно уравнение из другого. Лучше из уравнения с самым большим коэффициентом при а 1.

В нашем случае из второго вычтем первое уравнение. Получим

0,00029 а 1= - 0,00029 .

а 1= - 1,0 .

Для определения а 0 усредним последнюю систему уравнений (сложим коэффициенты и разделим пополам):

а 0+ 0,285145 а 1= 0,636665 .

Из этого уравнения находим а 0, подставив в него ранее найденное значение а 1: а 0= 0,636665 – 0,285145 * (- 1,0 ) ,

а 0= 0,92181

В результате можно представить уравнение регрессии 1-ой степени:

D = 0,92181 – 1,0 F .

Используя это уравнение и экспериментальные значения F, рассчитаем значенияD'расч(см. табл. 9 ), образующие прямую линию регрессии.

Таблица 9.

Экспериментальные и расчётные данные

rорреляционно-регрессионного анализа взаимосвязи

cветопропускания стекла (D) и содержания в нём оксида железа (F)

F

D эксп

D 'расч

D''расч

D'''расч

1

0,28

0,647

0,64181

0,64173

0,64176

2

0,28

0,659

0,64181

0,64173

0,64176

3

0,295

0,643

0,62681

0,62697

0,62696

4

0,29

0,629

0,63181

0,63189

0,63192

5

0,28

0,636

0,64181

0,64173

0,64176

6

0,3

0,618

0,62181

0,62205

0,62196

7

0,3

0,615

0,62181

0,62205

0,62196

8

0,29

0,628

0,63181

0,63189

0,63192

9

0,29

0,632

0,63181

0,63189

0,63192

10

0,29

0,635

0,63181

0,63189

0,63192

11

0,3

0,629

0,62181

0,62205

0,62196

12

0,29

0,641

0,63181

0,63189

0,63192

13

0,28

0,635

0,64181

0,64173

0,64176

14

0,28

0,635

0,64181

0,64173

0,64176

15

0,28

0,629

0,64181

0,64173

0,64176

16

0,27

0,649

0,65181

0,65156

0,65147

17

0,28

0,643

0,64181

0,64173

0,64176

18

0,27

0,644

0,65181

0,65156

0,65147

19

0,275

0,645

0,64681

0,64664

0,64663

20

0,285

0,631

0,63681

0,63681

0,63686

21

0,295

0,626

0,62681

0,62697

0,62696

22

0,27

0,662

0,65181

0,65156

0,65147

23

0,285

0,629

0,63681

0,63681

0,63686

24

0,295

0,618

0,62681

0,62697

0,62696

25

0,285

0,644

0,63681

0,63681

0,63686

26

0,275

0,655

0,64681

0,64664

0,64663

σЭ

0,00015

σ р

0,000114

0,0000831

0,0000833

R

0,4899

0,6678

0,6668

Теперь необходимо оценить, насколько полученное уравнение адекватно экспериментальным данным. Для этого используют критерий, тоже называемый коэффициентом корреляции, но определяемый иначе:

_____________

R= √ 1 –σ расч/ σ эксп,

___________________

где σ расч= √ Σ ( D i-эксп- D'расч ) 2/ n - дисперсия расчётных данных отно-

сительно экспериментальных,

________________

σ эксп= √ Σ (D i-эксп-) 2/n- дисперсия экспериментальных данных

относительно своей средней арифметической.

n- число данных в выборке.

Рассчитав дисперсии, получим коэффициент корреляции для линейной взаимосвязи параметров __________________

R= √ 1- 0,000114 / 0,00015 = 0,4899..

Как и следовало ожидать, судя по диаграмме разброса, адекватность расчётных и экспериментальных данных мала, а поэтому необходимо продолжить анализ и рассчитать уравнение регрессии 2-ой степени вида:

D=a 0+a 1*F+a 2*F 2.

Составим систему необходимых уравнений:

a 0 * n + a 1 * Σ F + a 2 * Σ F 2 = Σ D ,

a 0 * Σ F + a 1 * Σ F 2 + a 2 * Σ F 3 = Σ D * F ,

a 0 * Σ F 2 + a 1 * Σ F 3 + a 2 * Σ F 4 = Σ D * F 2 .

26 a 0 + 7.41 a 1 + 2.114 a 2 = 16.557 ;

7.41 a 0 + 2.114 a 1 + 0.603716 a 2 = 4.716625 ;

2.114 a 0 + 0.603716 a 1 + 0.172584 a 2 = 1.345003 .

a 0 + 0.285 a 1 + 0.081308 a 2 = 0.636808 ,

a 0+ 0.28529a 1+ 0.08147a 2= 0.63652 ,

a 0+ 0.28558a 1+ 0.081638a 2= 0.636236 .

Из третьего уравнения по-очерёдно вычитаем первое и второе:

0.00058 a 1+ 0.000385a 2= - 0.000574 ,

0.00029 a 1+ 0.000168a 2= - 0.000284 .

a 1+ 0,663793 а 2= - 0,989655 ,

а 1+ 0,57931 а 2= - 0,97931 .

Из первого уравнения вычтем второе:

0,084483 а 2= - 0,010345 ; а 2= - 0,012245 .

Из предыдущих двух уравнений, усредняя их находим:

а 1 = - 0,6215515 а 2– 0,9844825 ; а 1= - 0,976872.

Систему из трёх уравнений, где коэффициенты при а 0равны единице, усредняем и определяем а 0:

а 0= - 0,28529 а 1– 0,081472 а 2+ 0,636522 ; откуда а 0= 0,916211 .

Теперь запишем уравнение регрессии 2-ой степени :

D = 0.916211 – 0.976872 F – 0.012245 F 2.

Рассчитав по этому уравнению значения D"расчи занеся их в таблицу 9, определим дисперсию расчётных данных относительно экспериментальных : σ" расч= 0,0000831 . Теперь коэффициент корреляцииR= 0,6678 .

Одно из правил оценки адекватности линий регрессии гласит, что дисперсия расчётных по уравнению регрессии данных относительно экспериментальных должна быть на порядок меньше дисперсии экспериментальных данных относительно их средней арифметической (или коэффициент корреляции должен быть больше 0,9 - при хорошо коррелированных параметрах).

Если бы мы таким же образом рассчитали уравнение регрессии 3-ей степени (кубическая парабола) вида :

D=a 0+a 1 * F+a 2 * F 2+a 3 *F 3,

то получили бы следующее уравнение:

D = 0.866938 – 0.64025 F – 0.553823 F 2 – 0.113272 F 3 .

Рассчитав по этому уравнению значения D"'расч(см. табл. 13 ), определим дисперсию σ"'расч= 0,0000833 ; тогда коэффициент корреляцииR= 0,6668. Делаем вывод, что уравнение 3-ей степени в нашем случае менее адекватно, чем уравнения 2-ой степени, будучи и более сложным в использовании. А поэтому результатом регрессионного анализа принимаем уравнение 2-ой степени.

На рис. 22 можно увидеть соотношение экспериментальных данных по светопропусканию стекла с расчётными по разным уравнениям регрессии. Самые близкие к экспериментальным точкам точки линий уравнений 2-ой и 3-ой степени.

При использовании разных методов расчёта, разной степени округления данных расчёта для одних и тех же выборок могут быть получены несколько отличные уравнения регрессии, но при этом достаточно адекватные экспериментальным данным.

Так если систему уравнений из предыдущего расчёта

26 a 0+ 7.41a 1+ 2.114a 2= 16.557 ;

7.41 a 0+ 2.114a 1+ 0.603716a 2= 4.716625 ;

2.114 a 0+ 0.603716a 1+ 0.172584a 2= 1.345003 .

решить с помощью компьютерной программы Solver, то получим следующее уравнение 2-ой степени:

D = 0,99869 – 1,55383 F + 0,995707 F 2.

Для этого уравнения расчётная дисперсия σ = 0,0000836 и соответственно коэффициент корреляции R= 0,6656. Что тоже свидетельствует о достаточной адекватности уравнения регрессии экспериментальным данным.

Криволинейные зависимости целесообразно иногда оценить на возможность замены их на 2-3 прямолинейные зависимости. Например, квадратичную параболу можно сопоставить с двумя пересекающимися прямыми (см. рис. 19 Д и Е); кубическую – с двумя, почти параллельными общему направлению распределения точек, прямыми; и т.д. И главным критерием при этом должен оставаться коэффициент корреляции R.

Таким образом, результатом корреляционно-регрессионного анализа является выбор из разных (по форме линии регрессии) рассчитанных уравнений наиболее адекватного из них, т.е. чьи расчётные данные менее разбросаны относительно экспериментальных данных.

Рис. 22. Сопоставление рассчитанных уравнений регрессии

В заключение приведём пример (по Ремезову Н.И.) метода решения производственных задач, который напрямую не связан с выше перечисленными методами статистики, но может быть интересен для заводчан.

На заводе изготавливаются изделия А и Б. Цех 1 может изготовить за смену 8 изделий А или 4 изделия Б; цех 2 – соответственно 3 изделия А или 3 изделия Б; цех 3 – 1 изделие А или 3 изделия Б. Необходимо составить оптимальный план производства, чтобы

  1. выпуск заводом в смену составлял 1 изделие А и максимальное количество изделий Б;

  2. выпуск в смену должен составлять 1 изделие Б и максимальное количество изделий А.

Возможности цехов представим в виде следующей таблицы:

Возможности цехов по выпуску

Только изд. А

Только изд.Б

Одновременно и А, и Б

Цех 1

8

4

7 А + 0,5 Б; 3 А + 2,5 Б;

6 А + 1 Б; 2 А + 3 Б;

5 А + 1,5 Б; 1 А + 3,5 Б

4 А + 2 Б;

Цех 2

3

3

2 А + 1 Б; 1 А + 2 Б

Цех 3

1

2

0,5 А + 1 Б

На первый взгляд – самое эффективное производство в цехе 1, и оба

задания надо поручать этому цеху Однако: в цехе 1 - самое дешёвое изготовление изделия А, но дешёвое производство изделия Б – в цехе 3. Поэтому общую стоимость производства следует оценивать с учётом альтернативы – если не это изделие, а другое, то сколько (т.е. во что это обойдётся).

  1. Условие: 1 А + макс. Б Оценим ситуации, когда выпуск изделия А был бы поручен одному из цехов:

Вариант 1

Вариант 2

Вариант 3

Цех 1 – 1 А + 3,5 Б

Цех 1 - 4 Б

Цех 1 - 4 Б

Цех 2 - 3 Б

Цех 2 – 1 А + 2 Б

Цех 2 - 3 Б

Цех 3 - 2 Б

Цех 3 - 2 Б

Цех 3 – 1 А + -

Итого - 1 А + 8,5 Б

Итого – 1 А + 8 Б

Итого – 1 А + 7 Б

Из таблицы очевиден наилучший вариант (1).

  1. Условие: макс. А + 1 Б. Составим таблицу как и в 1 случае:

Вариант 1

Вариант 2

Вариант 3

Цех 1 – 1 Б + 6 А

Цех 1 - 8 А

Цех 1 - 8 А

Цех 2 - 3 А

Цех 2 – 1 Б + 2 А

Цех 2 - 3 А

Цех 3 - 1 А

Цех 3 - 1 А

Цех 3 – 1 Б + 0,5 А

Итого – 1 Б + 10 А

Итого – 1 Б + 11 А

Итого – 1 Б + 11,5 А

В этом случае лучший вариант 3.

Вывод:каждый должен заниматься тем, что у него лучше получается !