Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методология научных исследований в машиностроении.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
4.56 Mб
Скачать

12. Основные положения корреляционного и регрессионного анализа

Задачи, решаемые в технологии машиностроения, в основном связаны с установлением взаимосвязей между входными и выходными параметрами технологического процесса.

Все технологические факторы можно разделить на три группы:

  1. не допускающие или трудно допускающие целенаправленное изменение (например, физико-механические и технологические свойства заготовки: прочность, величина припуска, свойства припуска и т.п.);

  2. управляемые факторы (режимы обработки, точность и жесткость технологического оборудования, оснастка, инструмент и др.);

  3. неконтролируемые факторы, которые приводят к колебаниям (дрейфу) выходных параметров технологического процесса и объекта.

Существуют два вида связей между входными и выходными параметрами – функциональная (детерминированная) и стохастическая.

При функциональной связи каждому значению входного параметра (аргумента) соответствует строго определенное значение выходного параметра (функции). Это значение может быть одно или их может быть несколько, когда функция имеет несколько корней. Если же с изменением независимой величины (аргумента) происходит изменение закона распределения зависимой величины, то такая связь называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменяется математическое ожидание и среднее значение выходного параметра. В реальных условиях в стохастической зависимости двух величин «x» и «y», как правило, присутствуют и функциональная и случайная компоненты

y

Если отсутствует функциональная составляющая, то говорят, что величины х и у независимы. При отсутствии случайной составляющей (yсл = 0) х и у связаны жесткой функциональной зависимостью. Если же присутствует и функциональная и случайная составляющие, то соотношение между ними определяет силу связи между величинами yф и yсл.

Рассмотренные случаи можно проиллюстрировать примером однофакторной линейной зависимости (рис.11).

y

y

y

0

0

0

x

x

x

a) yсл≠0

уф=0

б) yсл=0

уф≠0

a) yсл≠0

уф≠0

Рис.11 Соотношение случайной и функциональной составляющих в зависимостях величин х и у:

а) отсутствует функциональная составляющая, т.е. величины х и у независимы;

б) отсутствует случайная составляющая, т.е. зависимость между х и у строго функциональна;

в) присутствуют обе составляющие, т.е. связь между х и у стохастическая.

Количественной мерой соотношения между случайной и функциональной составляющей cлужит коэффициент корреляции, который больше всего применим для оценки линейной связи между x и y. Методы корреляционного и регрессионного анализа используются только для взаимосвязанных входных и выходных параметров.

При исследовании технологических процессов возникает необходимость решать две основные задачи:

1-я задача: установить форму и оценить силу взаимосвязи между входными и выходными параметрами;

2-я задача: установить экспериментальную зависимость между входными и выходными параметрами.

Первая задача решается на основе корреляционного анализа, вторая –методом регрессионного анализа.

Аналитически корреляционную связь между х и у можно представить в виде уравнения

,

где х – значение аргумента (например, погрешность размеров заготовки);

– среднее арифметическое значение выходного параметра (например, погрешности размера готовой детали).

Для оценки формы и силы взаимосвязи значения выходного параметра у (функции отклика) и независимой переменной х (аргумента) используют коэффициент парной корреляции rxy, который служит мерой линейной зависимости между х и у

,

где σху - смешанный момент 2-го порядка,

,

n – количество пар точек с координатами xi, yi, т.е. объем выборки (обычно n > 50); , – средние арифметические значения xi и yi в выборке, xi, yi – значение параметров в i-м эксперименте, σх, σу - средние квадратические (стандартные) отклонения значений хi и yi. Тогда

.

При строго линейной зависимости все экспериментальные точки хi, yi лежат на прямой

.

Средние арифметические значения и также будут лежать на этой прямой

.

Вычтя одно уравнение из другого, получим

Подставляя последнее выражение в формулу для rxy, получим

.

Таким образом, если зависимость строго линейна, т.е. все экспериментальные точки ложатся на прямую линию, то коэффициент парной корреляции имеет значение rxy = ±1.

Некоторые свойства коэффициента парной корреляции.

  1. Значение rxy  находится в пределах –l ≤ rxy  ≤ +1.

  2. Если rxy  существенно отличается от нуля, то между исследуемыми факторами существует линейная корреляционная зависимость; при этом, чем ближе rxy  к ±1, тем сильнее эта связь.

3) Если rxy  = 0 или близок к 0, то между х и у линейная зависимость отсутствует, или она существенно не линейна.

4) Если rxy  = ±1, то между х и у существует линейная функциональная связь .

Знак при rxy  указывает на прямой (+) или обратный (-) характер этой связи (рис. 12), т.е. rxy  = +1 для b1 > 0, rxy  = -1 для b1 < 0.

0

х

у

a) rxy >0

0

х

у

б) rxy <0

Рис.12. Качественная зависимость коэффициента линейной корреляции rxy  от характера расположения экспериментальных точек на графике

: а – положительная корреляция; б – отрицательная корреляция

Найденное значение коэффициента корреляции необходимо проверить на значимость. Для этого существует несколько методов. Наиболее широко применяется проверка с помощью критерия Стьюдента, который рассчитывается по формуле

.

Расчетное значение сравнивается с табличным его значением при заданной доверительной вероятности PD (например, PD = 0,95) и m = – 1 (m – параметр таблицы). Коэффициент корреляции rxy  считается статистически значимым, если

После установления взаимосвязи между исследуемыми факторами с помощью регрессионного анализа, выбирается математическая модель, которая в наилучшей форме описывает эти взаимосвязи.

Однако перед этим необходимо проанализировать природу установленной взаимосвязи и убедиться в том, что действительно существует причинно-следственная зависимость между исследованными факторами (явлениями). Если такого анализа не сделать, а рассматривать исследуемые процессы и связи факторов формально, то можно построить вполне адекватную эмпирическую матмодель между факторами, на основании которой считать причину следствием, например, пение петуха считать причиной восхода солнца.

Уравнение, по которому могут быть найдены числовые значения выбранных средних функций отклика при соответствующих значениях независимых переменных, называется уравнением регрессии. В качестве этих уравнений чаще всего используются полиномы, степень которых определяется максимальной степенью входящих в них переменных.

Для двух переменных факторов (x1; x2) полиномы имеют следующий вид:

– полином нулевой степени;

– полином 1-й степени;

– полином 2-й степени;

– полином 3-й степени.

Уравнения регрессии 0-й и 1-й степени называют линейными, а 2-й и более степеней – нелинейными.