- •Методология научных исследований и словарь машиностроителя
- •1.Введение
- •1. Научные исследования и инновации
- •2. Методологические основы научного познания и творчества
- •2.1. Основные понятия и определения
- •2.2. Методы познания, теоретических и экспериментальных исследований
- •3. Направления научных исследований и этапы научно-исследовательских работ
- •4. Научно-техническая информация
- •5. Патентная информация
- •6. Тема и объект исследований
- •7. Методика исследований
- •8. Теоретические исследования
- •9. Экспериментальные исследования
- •10. Исследование методом моделирования
- •10.1. Физическое моделирование
- •10.2. Математическое моделирование
- •10.3. Другие методы моделирования
- •10.4. Вычислительный эксперимент
- •10.5. Основные положения теории подобия
- •11. Обработка результатов экспериментальных исследований.
- •11.1. Основные положения теории случайных погрешностей.
- •11.2. Представление результатов параллельных измерений.
- •11.3. Доверительный интервал и доверительная вероятность.
- •11.4. Минимальное количество измерений
- •11.5. Исключение грубых ошибок.
- •12. Основные положения корреляционного и регрессионного анализа
- •13. Графическая обработка результатов эксперимента
- •13.1. Общие положения
- •13.2. Методы подбора эмпирических формул
- •13.3. Метод средних отклонений
- •13.4. Метод наименьших квадратов
- •14. Планирование и обработка результатов многофакторного эксперимента
- •14.1. Общие положения и основные понятия.
- •X1, x2, x3, …, xn – входные основные факторы;
- •14.2. Построение линейных планов полного и дробного факторного экспериментов
- •14.2.1. Полный факторный эксперимент (пфэ)
- •14.2.2. Дробный факторный эксперимент (дфэ)
- •14.2.3. Свойства матриц пфэ и дфэ
- •14.2.4. Проведение и обработка результатов эксперимента.
- •14.3. Поиск оптимума
- •14.3.1. Метод Гаусса-Зайделя
- •14.3.2. Метод градиента
- •14.3.3. Метод крутого восхождения
- •14.3.4. Симплексный метод
- •14.3.5. Оптимизация при наличии ограничений.
- •Литература.
- •Приложение 2
- •2.1. Задание
- •2.2. Критерий грубых ошибок Груббса βmax
- •2.3. Значения коэффициента Стьюдента
- •2.4. Значения Fm – критерия Фишера при 5% уровне значимости
- •2.5. Критерий Кохрена
12. Основные положения корреляционного и регрессионного анализа
Задачи, решаемые в технологии машиностроения, в основном связаны с установлением взаимосвязей между входными и выходными параметрами технологического процесса.
Все технологические факторы можно разделить на три группы:
не допускающие или трудно допускающие целенаправленное изменение (например, физико-механические и технологические свойства заготовки: прочность, величина припуска, свойства припуска и т.п.);
управляемые факторы (режимы обработки, точность и жесткость технологического оборудования, оснастка, инструмент и др.);
неконтролируемые факторы, которые приводят к колебаниям (дрейфу) выходных параметров технологического процесса и объекта.
Существуют два вида связей между входными и выходными параметрами – функциональная (детерминированная) и стохастическая.
При функциональной связи каждому значению входного параметра (аргумента) соответствует строго определенное значение выходного параметра (функции). Это значение может быть одно или их может быть несколько, когда функция имеет несколько корней. Если же с изменением независимой величины (аргумента) происходит изменение закона распределения зависимой величины, то такая связь называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменяется математическое ожидание и среднее значение выходного параметра. В реальных условиях в стохастической зависимости двух величин «x» и «y», как правило, присутствуют и функциональная и случайная компоненты
y |
|
|
Если отсутствует функциональная составляющая, то говорят, что величины х и у независимы. При отсутствии случайной составляющей (yсл = 0) х и у связаны жесткой функциональной зависимостью. Если же присутствует и функциональная и случайная составляющие, то соотношение между ними определяет силу связи между величинами yф и yсл.
Рассмотренные случаи можно проиллюстрировать примером однофакторной линейной зависимости (рис.11).
y
y
y
0
0
0
x
x
x
a) yсл≠0
уф=0
б) yсл=0
уф≠0
a) yсл≠0
уф≠0
Рис.11 Соотношение случайной и функциональной составляющих в зависимостях величин х и у:
а) отсутствует функциональная составляющая, т.е. величины х и у независимы;
б) отсутствует случайная составляющая, т.е. зависимость между х и у строго функциональна;
в) присутствуют обе составляющие, т.е. связь между х и у стохастическая.
Количественной мерой соотношения между случайной и функциональной составляющей cлужит коэффициент корреляции, который больше всего применим для оценки линейной связи между x и y. Методы корреляционного и регрессионного анализа используются только для взаимосвязанных входных и выходных параметров.
При исследовании технологических процессов возникает необходимость решать две основные задачи:
1-я задача: установить форму и оценить силу взаимосвязи между входными и выходными параметрами;
2-я задача: установить экспериментальную зависимость между входными и выходными параметрами.
Первая задача решается на основе корреляционного анализа, вторая –методом регрессионного анализа.
Аналитически корреляционную связь между х и у можно представить в виде уравнения
,
где х – значение аргумента (например, погрешность размеров заготовки);
–
среднее
арифметическое значение выходного
параметра (например, погрешности размера
готовой детали).
Для оценки формы и силы взаимосвязи значения выходного параметра у (функции отклика) и независимой переменной х (аргумента) используют коэффициент парной корреляции rxy, который служит мерой линейной зависимости между х и у
,
где σху - смешанный момент 2-го порядка,
,
n
– количество пар точек с координатами
xi,
yi,
т.е.
объем выборки (обычно n > 50);
,
– средние
арифметические значения xi
и yi
в
выборке, xi,
yi
–
значение параметров в i-м
эксперименте, σх,
σу
-
средние квадратические (стандартные)
отклонения значений хi
и
yi.
Тогда
.
При строго линейной зависимости все экспериментальные точки хi, yi лежат на прямой
.
Средние арифметические значения и также будут лежать на этой прямой
.
Вычтя одно уравнение из другого, получим
Подставляя последнее выражение в формулу для rxy, получим
.
Таким образом, если зависимость строго линейна, т.е. все экспериментальные точки ложатся на прямую линию, то коэффициент парной корреляции имеет значение rxy = ±1.
Некоторые свойства коэффициента парной корреляции.
Значение rxy находится в пределах –l ≤ rxy ≤ +1.
Если rxy существенно отличается от нуля, то между исследуемыми факторами существует линейная корреляционная зависимость; при этом, чем ближе rxy к ±1, тем сильнее эта связь.
3) Если rxy = 0 или близок к 0, то между х и у линейная зависимость отсутствует, или она существенно не линейна.
4)
Если rxy = ±1,
то между х
и
у
существует
линейная функциональная связь
.
Знак при rxy указывает на прямой (+) или обратный (-) характер этой связи (рис. 12), т.е. rxy = +1 для b1 > 0, rxy = -1 для b1 < 0.
0
х
у
a) rxy >0
0
х
у
б) rxy <0
Рис.12. Качественная зависимость коэффициента линейной корреляции rxy от характера расположения экспериментальных точек на графике
: а – положительная корреляция; б – отрицательная корреляция
Найденное значение коэффициента корреляции необходимо проверить на значимость. Для этого существует несколько методов. Наиболее широко применяется проверка с помощью критерия Стьюдента, который рассчитывается по формуле
.
Расчетное
значение
сравнивается
с табличным его значением
при
заданной доверительной вероятности
PD
(например,
PD = 0,95)
и
m =
n – 1
(m
–
параметр таблицы). Коэффициент корреляции
rxy
считается статистически значимым, если
После установления взаимосвязи между исследуемыми факторами с помощью регрессионного анализа, выбирается математическая модель, которая в наилучшей форме описывает эти взаимосвязи.
Однако перед этим необходимо проанализировать природу установленной взаимосвязи и убедиться в том, что действительно существует причинно-следственная зависимость между исследованными факторами (явлениями). Если такого анализа не сделать, а рассматривать исследуемые процессы и связи факторов формально, то можно построить вполне адекватную эмпирическую матмодель между факторами, на основании которой считать причину следствием, например, пение петуха считать причиной восхода солнца.
Уравнение, по которому могут быть найдены числовые значения выбранных средних функций отклика при соответствующих значениях независимых переменных, называется уравнением регрессии. В качестве этих уравнений чаще всего используются полиномы, степень которых определяется максимальной степенью входящих в них переменных.
Для двух переменных факторов (x1; x2) полиномы имеют следующий вид:
– полином
нулевой степени;
– полином
1-й степени;
– полином
2-й степени;
– полином 3-й степени.
Уравнения регрессии 0-й и 1-й степени называют линейными, а 2-й и более степеней – нелинейными.
