- •1. Таблицы
- •2. Графики
- •7.2. Основы статистических методов анализа и расчета
- •7.3. Закон нормального распределения
- •7.3. Распределение Стьюдента
- •Контроль стабильности
- •Определение стабильности по колебанию значения среднего арифметического
- •Определение стабильности по характеру графика наблюдений параметра по времени
- •Статистические методы прогнозирования
- •Корреляционный анализ
- •8. Теория эксперимента
- •8.1. Планирование эксперимента
- •8.2. Пример проведения простейшего эксперимента
- •8.3. Регрессионный анализ
- •8.4. Разработка экспериментов
Корреляционный анализ
В производственном процессе очень часто необходимо определить зависимость между разными факторами. Причем необходимо отметить, что если эта связь и существует, ее трудно выявить , так как на процесс влияют и другие, неучтенные нами факторы. В производственной практике очень часто связь между процессами имеет стохастический (случайный или если выразиться более точно не выявленный ) характер, а не функциональный ( детерминированный). Статистическая стохастическая зависимость называется корреляционной. Эта зависимость возникает тогда, когда один из признаков зависит не только от одного определенного нами фактора, но и от ряда других случайных неучтенных факторов. Виды корреляционных связей могут быть разными, это линейная и нелинейная, положительная и отрицательная. С целью выявления характеристики корреляционной зависимости применяют корреляционный анализ. Термин «корреляция» был введен в теорию статистики английским ученым Ф. Гальтоном.
Корреляционный анализ представляет собой совокупность основанных на математической теории корреляции методов обнаружения корреляционной зависимости между двумя случайными признаками или факторами. При этом две случайные величины считаются корреляционно связанными, если математическое ожидание одной из них меняется в зависимости от изменения другой.
Корреляционный анализ обычно применяется для оценки зависимости качества конечной продукции от определенных свойств сырья или исходных материалов либо режимов работы. Этот вид анализа требует от исполнителя тщательности, так как при изменении условий эксперимента вместе с изменением исследуемого показателя качества сырья или материала могут изменяться и другие показатели их качества. Если не учитывать эти изменения, то могут возникнуть значительные ошибки в оценке окончательного качества.
Пример. В цехе ведется обработка изделия на токарном станке. Имеется входной параметр процесса точения – момент затяжки болтов резцедержателя станка, который определяет жесткость системы резания металла. Технолог хочет определить имеется ли зависимость между этим входным параметром и выходными параметрами процесса, влияющими на качество, а именно точность обработки, силой резания, временем стойкости резца (время между двумя заточками) и расходом электроэнергии. В течение некоторого времени проводились опытные обработки на станке. Вводилось некоторое значение входного параметра и определялись значения выходных параметров. Значения заносились в таблицу 7.20.
Таблица 7.20 – Данные замера
|
Входной параметр |
Выходные параметры |
|||
|
Момент затяжки резца, Нм |
% годных изделий |
Сила резания, КН |
Стойкость резца, мин |
Расход э/энергии, кВт/час |
1 |
60 |
96 |
15,5 |
44 |
2,5 |
2 |
80 |
96,5 |
14 |
45 |
4 |
3 |
100 |
97 |
14,1 |
50 |
3,5 |
4 |
120 |
98 |
12,2 |
55 |
2,9 |
5 |
140 |
99 |
11 |
68 |
4 |
6 |
160 |
99 |
8,5 |
75 |
3,4 |
7 |
180 |
98,5 |
9,6 |
80 |
4,1 |
8 |
200 |
97 |
9,1 |
94 |
2,8 |
Рисунок 7.15 – График % годных
Рисунок 7.16- - График силы резания
Рисунок 7.17 – График стойкости
Рисунок 7.18 – График расхода энергии
Чтобы легче было видеть корреляцию необходимо построить график, лучше всего диаграмму разброса. Диаграммы разброса удобно строить с помощью пакета EXCEL. В мастере построения диаграмм имеется тип графика «точечный». Это и есть диаграмма разброса. Более того пакет позволяет, кроме нанесения точек, построить линию тренда. Тренд- это график какой либо функции, максимально близко описывающей положение точек эмпирических данных, которую можно выразить аналитически в виде формулы. С помощью тренда мы можем видеть закономерность развития процесса в будущем, а с помощью аналитического выражения производить прогнозные расчеты. EXCEL позволяет сразу получить аналитическую формулу максимально , описывающую траекторию тренда и коэффициент детерминации. Для получения линии тренда необходимо установить курсор на любую точку на графике и нажать правую кнопку «мыши», появится афиша, в которой есть фраза «добавить линию тренда», с учетом расположения точек необходимо выбрать тип зависимости и значит вид графика. Это может быть зависимость линейная ( Y=ax+b), логарифмическая ( Y=a Ln(x)+b), полиноминальная (Y= ax2 + cx + b ) , степенная (Y = axc ), экспоненциальная ( Y =aecx), линейная фильтрация. Для получения коэффициента детерминации ( величина достоверности аппроксимации) в разделе «параметры» необходимо поставить метки в соответствующие квадратики.
Одной из основных задач анализа является выявление входных факторов Х, максимально влияющих на выходной параметр Y. Наиболее часто встречается линейная корреляции, то есть определение линейной зависимости между двумя факторами- входным и выходным. На диаграммах 7.16 и 7.17 видны линейные обратно пропорциональная ( отрицательная) зависимость между факторами и прямо пропорциональная ( положительная) зависимость между факторами. Корреляция позволяет количественно выразить эту зависимость. Количественно оценить, насколько линейна зависимость между двумя переменными, позволяет коэффициент корреляции r.
(7.13.)
Формулу расчета коэффициента корреляции разработал К.Пирсон, ученик Ф.Гальтона. Расчетный коэффициент корреляции всегда находится в пределах от -1 до +1. Знак коэффициента говорит о зависимости. Если знак (+) зависимость положительная при возрастании Х возрастает и Y. Если знак (-) зависимость отрицательная, при возрастании Х , значение Y уменьшается. Приближение коэффициента к /1/ показывает величину приближения зависимости к линейной, если коэффициент равен 1, независимо от знака, линейная зависимость полная.
При пользовании пакетом EXCEL и построении точечных диаграмм приближение корреляции к линейности или зависимости другого вида можно быстро определять по коэффициенту детерминации R2 (величина достоверности аппроксимации). В дальнейшем для определения уровня приближенности корреляции к линейности или кривой лучше пользоваться коэффициентом детерминации.
Коэффициент детерминации R2 – это отношение регрессивной квадратичной ошибки (РКО) к полной квадратичной ошибке ( ПКО).
(7.14.)
Где YТi – теоретическое значение выходного параметра ( по формуле), Yсрф - средне арифметическое значение реального показателя выходного параметра, Y рi – реальное ( опытное) значение выходного параметра .
Определим
коэффициент R2
для нашего примера – зависимости -
момент затяжки и стойкость резца. На
рисунке 7.19. EXCEL определил
формулу аналитической зависимости как
и R2
= 0.9596. Проверим этот результат.
Как видно результат практически совпал (Таблица 7.21.)
Таблица 7.21 - Результаты расчета
Х |
Yр |
(Yр-Yсрф)2 |
YТ |
(YТ-Yсрф)2 |
60 |
44 |
395,015625 |
38,334 |
652,342681 |
80 |
45 |
356,265625 |
45,632 |
332,807049 |
100 |
50 |
192,515625 |
52,93 |
119,793025 |
120 |
55 |
78,765625 |
60,228 |
13,300609 |
140 |
68 |
17,015625 |
67,526 |
13,329801 |
160 |
75 |
123,765625 |
74,824 |
119,880601 |
180 |
80 |
260,015625 |
82,122 |
332,953009 |
200 |
94 |
907,515625 |
89,42 |
652,547025 |
|
|
ПКО |
|
РКО |
сумма |
511 |
2330,875 |
|
2236,9538 |
Yсрф |
63,875 |
|
|
|
|
R2 |
0,959705604 |
|
|
Коэффициент R2 показывает, какая часть полной наблюдаемой вариации соответствует нашему аналитическому выражению (формуле). Чем ближе коэффициент к 1, тем более достоверна формула, при R2 = 1, формула полностью описывает закономерность появления данных, все точки находятся на линии аналитического графика ( тренда). Если в случае построения линейной зависимости R2 = 1, линейная зависимость полная. Характер зависимости можно определить по графику. Угол наклона прямой на графике показывает силу зависимости. Чем более круто наклонена прямая тем, больше зависимость.
Корреляция может иметь и не линейный характер. На диаграмме – рисунке 7.15. корреляция не линейная, причем график имеет экстремальную точку- пик. На диаграмме-рисунке 7.18. корреляции нет, точки расставлены без всякой системы, то есть зависимости этих двух факторов нет.
В примере с моментом затяжки резца, мы определили три фактора влияющие на качество продукции, видим общую закономерность влияния, но для определения точной функциональной зависимости необходимо получить аналитическую форму этой зависимости( формулу функции, максимально полно отражающей данную зависимость. Для этого необходимо провести регрессионный анализ. Данный анализ подробно рассмотрен в разделе……
Подготовка эксперимента |
|
Проведение эксперимента |
|
|
|
|
|
Планирование эксперимента |
|
