Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 700471.doc
Скачиваний:
2
Добавлен:
01.05.2022
Размер:
10.34 Mб
Скачать

ФГБОУ ВПО «Воронежский государственный

технический университет»

Кафедра технологии машиностроения

- 2014

Методические указания

к выполнению лабораторных и практических работ

по дисциплине

" Методология научных исследований

в машиностроении"

для студентов направления подготовки магистров

151900.68 «Конструкторско-технологическое

обеспечение машиностроительных производств»

всех форм обучения

Воронеж 2014

Составитель канд. техн. наук А.В. Перова

УДК 51.74+621.01

Методические указания к выполнению лабораторных и практических работ по дисциплине "Методология научных исследований в машиностроении" для студентов направления подготовки магистров 151900.68 «Конструкторско-технологическое обеспечение машиностроительных производств» всех форм обучения / ФГБОУ ВПО "Воронежский государственный технический университет"; сост. А.В. Перова. Воронеж, 2014. 38 с.

Методические указания включают краткие теоретические сведения по основам научных исследований, методику и порядок выполнения лабораторных и практических работ, снабжены перечнем рекомендуемой литературы и конкретными примерами методов принятия решений.

Методические указания подготовлены в электронном виде в текстовом редакторе MS Word XP и содержится в файле Практика_МНИ.doc.

Табл. 10. Ил. 6. Библиогр.: 2 назв.

Рецензент д-р. техн. наук, проф. А.И. Болдырев

Ответственный за выпуск

зав. кафедрой канд.техн.наук И.Т. Коптев

© ФГБОУ ВПО

"Воронежский государственный

технический университет", 2014

ЛАБОРАТОРНАЯ РАБОТА № 1

ЭКСТРАПОЛЯЦИОННЫЙ МЕТОД

ПРОГНОЗИРОВАНИЯ

Цель работы: изучить основные причинно-следственные методы прогнозирования в машиностроении, средства MS Excel для построения регрессионных моделей.

Теоретические сведения

Причинно-следственные модели прогнозирования

В причинно-следственных моделях прогнозирование изменения значения какой-то величины осуществляется на основе известных значений другой величины или набора величин. Другими словами, зная значение одной переменной (или, возможно, нескольких переменных), можно предсказать значение другой. Математически это выражается следующим образом. Пусть y – действительное значение некоторой интересующей нас переменной, а – предсказанное или спрогнозированное ее значение. Тогда = (x1, x2,…, xn), где  - функция прогнозирования, x1, x2,…, xn - набор переменных.

В этом представлении переменные x называются независимыми переменными, а – зависимой (или переменной отклика). Таким образом, зная значения независимых переменных, можно предсказать значение зависимой.

Подбор кривой по точкам

Основную идею метода подбора кривой можно проще показать на примере, где для прогнозирования значения зависимой переменной используется одна независимая переменная. Рассмотрим модель обработки некоторого материала, с целью повысить предел прочности деталей. В этой модели используются две величины: температура (измеряется как среднее значение в час) и предел прочности некоторого материала (измеряется как средний предел в час).

В цехе шла обработка пяти видов деталей. Данные за год по этим цехам представлены на рис. 1. Необходим создать точечный график в Excel, нужно выполнить следующие действия:

Материал

Температура

в час

Предел прочности

1

150

220,00

2

55

75,00

3

220

250,00

4

130

145,00

5

95

200,00


Рис. 1. Данные по температуре и пределу прочности

  1. Выделить диапазон данных B2:C6, затем щелкните на кнопке Мастер диаграмм стандартной панели инструментов.

  2. В первом диалоговом окне Мастер диаграмм выберите тип диаграммы Точечная без соединяющих линий.

  3. Второе диалоговое окно Мастера диаграмм можно пропустить, щелкну на кнопке Далее, поскольку в данном случае подходят все параметры, установленные по умолчанию.

  4. В третьем диалоговом окне Мастера диаграмм введите названия осей и затем щелкните на кнопке Далее.

  5. В последнем диалоговом окне Мастера диаграмм установите переключатель отдельном, чтобы разместить диаграмму на отдельном листе, который будет называться Диаграмма 1; после этого щелкните на кнопке Готово.

Далее нужно использовать эти данные для построения функции, которая отражала бы зависимость предела прочности материала от температуры.

Подбор кривой методом наименьших квадратов

Метод наименьших квадратов – это формальная процедура для подбора кривой по точкам, которая выполняется в два этапа:

  1. Задается вид функции (линейная функция, квадратная или какая-либо другая).

  2. Среди функций выбранного вида нужно выбрать функцию, для которой сумма квадратов разностей между точками данных и значениями функции была бы минимальна.

Сначала выбираем линейный тип функции, т. е. функцию вида y= a + bx. Определяем значения коэффициентов a и b (далее опишем, как можно быстро найти эти значения в Excel). Строим прямую линию y = a + bx и определяем разности между точками данных и функцией. Например, d1 = y1 – (a + bx1) = 220 – (a + 150b), где y1 – фактический (измеренный) предел прочности некоторого материала 1, x1 - фактическая (измеренная) температура, a – длина отрезка вертикальной оси, отсекаемый прямой линией, b – угловой коэффициент прямой.

Значение d12 показывает, насколько близки значения функции a + 150b и измеренное значение y1: другими словами, оно показывает, насколько выбранная функция подходит в данной точке.

Затем нужно определить, насколько выбранная функция подходит для всех точек данных. Чтобы это сделать, следует найти сумму квадратов отклонений в каждой точке . Теперь рассмотрим общий случай, когда количество измеренных значений n не обязательно равно пяти. Тогда сумма квадратов отклонений может быть записана так:

. (1)

В методе наименьших квадратов коэффициенты a и b выбираются так, чтобы минимизировать сумму (1). Существуют формулы для вычисления значений a и b, минимизирующих эту сумму. Чтобы получить эти формулы, найдем частную производную по a суммы (1) и полученное выражение приравняем к нулю. Это будет первое уравнение. Второе уравнение получается аналогично, но частная производная берется по b. В результате получим систему уравнений относительно a и b:

и

Решение этой системы запишется следующим образом:

(2)

Теперь можно найти значения a и b, вычислив значения сумм, входящих в эти выражения, и выполнив обычные арифметические операции.

Вычисление коэффициентов a и b можно поручить Excel, поскольку в этой программе есть необходимые средства. Для этого нужно выполнить такие действия:

  1. Выберите СервисАнализ данных. (Если у вас нет этого пункта меню, то вам необходимо выполнить команду СервисНадстройки и в открывшемся диалоговом окне установить надстройку Пакет анализа.)

  2. В диалоговом окне Анализ данных в списке Инструменты анализа выберите Регрессия, в результате появится одноименное диалоговое окно, показанное на рис.2. В поле Входной интервал Y введите $C$2:$C$6, а в поле Входной интервал X - $B$2:$B$6.

  3. Укажите, что результаты надо вывести на отдельном рабочем листе, и задайте имя листа, например, Результаты. Щелкните на кнопке OK.

Результаты вычислений показаны на рис. 3.

В полученном отчете приведено много информации, но данные, которые нас интересуют, находятся в ячейках B17:B18. Они называются Y-пересечение (коэффициент a) и Переменная X1 (коэффициент b). Имеем a=57, 104 и b=0,92997.

Р ис. 2. Диалоговое окно Регрессия

Рис. 3. Результаты вычислений

Чтобы построить по исходным данным прямую, соответствующую линейной функции, найденной методом наименьших квадратов, выполните такие действия.

  1. Щелкните на ярлыке Диаграмма 1 листа с точечной диаграммой.

  2. Щелкните на любой точке данных на диаграмме, все точки данных будут выделены.

  3. Выполните команду ДиаграммаДобавить линию тренда.

  4. В открывшемся диалоговом окне Линия тренда по умолчанию будет выбран линейный тип функции.

  5. Щелкните на кнопке OK.

Итак, построена линейная функция, которая минимизирует сумму (300), и которую можно использовать для прогнозирования. Такая функция (не обязательно линейная, как в нашем случае) называется функцией регрессии. Теперь разберемся с тем, какую еще мы получили информацию, использовав средство Регрессии (рис. 3). Значение R-квадрат в ячейке В5 равно 0,694 (69,4 %). Это мера адекватности между исходными данными и построенной функцией, как и сумма квадратов отклонений. Это статистика R2, которая известна всем, кто изучал хотя бы начальный курс математической статистики. Она принимает значения от 0 до 1 и показывает, насколько велико общее отклонение по оси Y построенной линии от фактических знаний величины у.

С другой стороны, статистики любят говорить о трех различных суммах погрешностей: общая сумма квадратов (ОСК), сумма квадратов отклонений (СКО) и сумма квадратов регрессии (СКР), Зави­симость между ними следующая: ОСК= СКО + СКР, Эти величины вычисляются по та­ким формулам:

(3)

С помощью средства Регрессия минимизировано значение суммы квадратов отклонений СКО. Величину R2 можно найти, используя формулу Если найдена идеальная линия регрессии (точка СКО=0), то СКР=ОСК и R2=1 (максимальное зна­чение). В нашем случае R2 = 0,694. Это значит, что только при6лизительно 70% всех зна­чений у можно выразить через переменную x.

Вернемся к первоначальным данным и рассмотрим вопрос, следует ли поддерживать температуру 183 градуса? Лучшее, что можно сейчас сделать — это найти прогнозируемый предел прочности некоторого материала, подставив значение 183 на место переменной x в полученное уравнение регрессии:

Предел прочности = 57,104 + 0,92997 * 183 температура.

Находим, что предел прочности будет равен 227,29, Но насколько можно быть уве­ренным в правильности этого прогноза? Для этого надо построить доверительный интер­вал, который бы с вероятностью 95% содержал фактическое значение предела прочности. Необходимые для этого данные имеются на рабочем листе Результаты (рис. 3). В ячейке B7 записано значение стандартной ошибки Se, равное 44,18. Эта величина пока­зывает величину разброса исходных данных относительно линии регрессии, что похоже на сумму квадратов отклонений. Стандартная ошибка вычисляется по формуле

(4)

где n – число точек данных (5 в нашем примере), k- количество независимых переменных (1 в данном примере). Очевидно, что формулу (4) можно записать как

Если известно значение стандартной ошибка Se, можно воспользоваться эмпириче­ским правилом (основанным на свойствах нормального распределения), которое гласит, что с вероятностью 68% (или 95%) можно утверждать, что фактическое значение прогнозируемой величины будет находиться в окрестности найденного значения прогноза (значение $227,29)с разбросом ±Sе; (или ±2Se). В нашем случае получим 95% доверитель­ный интервал 227,19 – 2*44,18; 227,29 + 2*44,18] или [$138,93;$315,65.

Чтобы убедиться в том, насколько правильно и точно был определен доверительный интервал, требуется вычислить значение Sp, стандартной ошибки прогнозирования, значение которой всегда больше значения Se. Но вывод формулы для определения Sp достаточно сложен и выходит за рамки данной книги. Отметим только, что, чем меньше разброс значений независимой переменной x относительно своего среднего, тем Sp будет ближе к Sе.

Теперь рассмотрим другие данные, приведенные в отчете средства Регрессия и относящиеся к коэффициенту b (ячейки D11:G18), и прежде всего i-статистику (ячейки D18) и P-значение (ячейка Е18), поскольку посредством этих величин строится доверительный интервал для коэффициента b. В данном случае P-значение равно 0,0798. Но желательно, чтобы P-значение в данном случае было меньше 0,05. Тогда с вероятностью, по крайней мере, 95% можно было бы утверждать, что коэффициент b статистически значимо отличается от нуля. Если коэффициент b равен нулю, это указывает на отсутствие статистической зависимости между y и x. Средство Регрессия уже построило 95%-ный доверительный интервал для коэффициента b. Границы этого интервала – 0,205 и 2,064 записаны в ячейках F18 и G18 соответственно. Этот интервал показывает, что в данном случае нельзя исключать того, что истинное значение b может быть равно нулю.

Обратите внимание на то, что можно получить те же самые значения коэффициентов a и b с помощью средства Поиск решения (для этого нужно задать целевую функцию как сумму квадратов отклонений, а коэффициенты a и b – искомыми переменными).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]