Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Аппроксимация данных СРС

.pdf
Скачиваний:
18
Добавлен:
12.03.2015
Размер:
794 Кб
Скачать

Аппроксимация экспериментальных данных

математическими зависимостями

Методические указания для самостоятельной работы студентов

1

1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

На практике часто ставятся задачи описания экспериментальных данных математическими зависимостями или задачи аппроксимации.

Постановка задачи. Пусть имеются данные, полученные практическим путем (в ходе эксперимента или наблюдений), которые представле-

ны матрицей чисел ( хiэ ; yiэ,1 yiэ,m ), где имеется m параллельных испыта-

ний. На основе этих данных требуется подобрать такую функцию y p a, x) , которая наилучшим образом сглаживала бы экспериментальную зависимость между переменными и по возможности точно отражала бы общую тенденцию зависимости между хiэ и yiэ , где хiэ - экспериментальные значения переменных, yiэ - экспериментальные значения функции, y p - расчетные значения эмпирической функции, ā - коэффициенты функции.

Наличие параллельных испытаний требует выполнения предварительных статистических расчетов с определение средних строчных значений y и ошибок их определения. Затем можно провести проверку воспроизводимости строк через критерий Кохрена (см. приложение).

Построение эмпирической функции сводится к вычислению входящих в нее параметров ā, таких чтобы из всех функций выбрать ту, которая лучше других описывает зависимость между изучаемыми величинами. В качестве критерия оценки используется сумма квадратов разности между экспериментальными значениями и значениями, вычисленными по аппроксимирующей зависимости. Критерий должен стремиться к минимальному значению:

n

 

R yip yiэ 2 min .

(1)

i 1

Для построения аппроксимирующей функции предварительно строится график экспериментальной зависимости, причем можно использовать как конкретные значения хiэ , так и другие значения, например, номера точек. Затем проводится подбор аппроксимирующей функции. В зависимости от вида экспериментальной кривой выбираются возможные функции, описывающие данный вид и потом подбираются входящие в нее параметры ā.

Близость аппроксимации экспериментальных данных выбранной

2

функцией оценивается критерием Пирсона (X2). Если есть несколько подходящих вариантов аппроксимирующих функций, то выбираем функцию с наибольшим коэффициентом Пирсона, который стремящимся к 1. Наличие статистических расчетов позволяет провести анализ полученного уравнения и определить его статистические характеристики, в первую очередь погрешность коэффициентов.

2. ВЫПОЛНЕНИЕ ЗАДАНИЯ

Постановка задачи: Необходимо провести статистический анализ полученных данных и описать их с помощью одной из пяти предлагаемых функций. По результатам расчетов сделать статистический анализ полученной математической зависимости.

Файл с задание для СРС находится у вас в папке с именем «СРС_Фамилия.xlsx». С этим файлом можно работать на любом компьютере, в том числе и дома. Все расчеты и описания должны быть сделаны в этом файле и представлены для сдачи преподавателю.

 

На листе1 в верхней строке указывается фа-

 

милия студента, дата и время создания задание и

 

номер задания

Рис.1. Заголовок

(рис.1). Ниже

находятся сге-

 

нерированные

экспериментальные

данные (рис.2) – значения X и Y с

 

числом строк N=10 и числом парал-

 

лельных испытаний m=4. По этим

 

данным надо провести их статистиче-

 

ский анализ, сделать заключение о

 

воспроизводимости строк, выбрать

Рис.2. Таблица данных

вид зависимости для их аппроксима-

 

ции и найти неизвестные коэффициенты в этих уравнениях. Построить график зависимости Y от X с набором экспериментальных данных (только маркеры), расчетной линией (только сглаженная линия) и разбросом данных от экспериментальных точек (отклонение по строкам и общее отклонение по всем точкам эксперимента).

Сначала вычисляем статистические характеристики для строк с параллельными испытаниями с использование стандартных функций Excel:

СРЗНАЧ() – определение среднего значения (Yi )из набора параллельных испытаний;

3

ДИСП() – определение стандартного отклонения ( Si2 );

в следующих столбцах таблицы, потом проверяем воспроизводимость результатов испытаний по строкам, используя критерий Кохрена вычисленный по формулу (2), сравниваем его с табличным значением критерия (Приложение 1) используя указанные ниже степени свободы (f1, f2):

Gрас max Si2 Gтаб , f1 m 1 4 1 3, f2 N 10 (2)

N

Si2

i 1

Делаем заключение по воспроизводимости результатов (если есть выпадающие строки, приводится анализ их данных и делается общее заключение по результатам всего эксперимента, корректировка данных не проводится).

Определяются дисперсия, стандартное отклонение, общий и строчные интервалы результатов для всех экспериментальных данных по следующим формулам или средствами «Анализа данных».

 

1

N

 

 

 

 

 

 

Sв2ос

Si2 ,

Sв ос Sв2ос ,

Y Sв ос 1,96 2,

Yi Si 1,96 2

(3)

 

 

N i 1

 

 

 

 

 

 

Можно использовать более сложные формулы для нахождения

Y и

использованием обратного нормального распределения и выбранного уровня достоверности отличного от 95%.

По виду вашей экспериментальной зависимости надо выбрать одну или несколько функций, которыми она может быть описана. Для облегчения выбора аппроксимирующей функции предлагается таблица 1 возможных функций и соответствующие им виды кривых в зависимости от значений коэффициентов.

Таблица 1 Таблица типовых кривых и соответствующих им формул,

которые могут быть используемы для описания данных

6

 

12

 

 

a<0; b>0

 

a<0; b>0

 

 

 

5

a>0; b>0

10

a>0; b>0

 

a>0; b<0

 

a>0; b<0

4

 

 

 

8

 

3

 

 

 

1

а bx

6

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

у

4

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

2

 

 

 

 

0

 

 

 

 

 

0

 

 

 

 

1

3

5

7

9

 

1

3

5

7

9

1у а bx

4

Рис.3 Таблица коэффициентов

7

 

 

 

 

 

 

 

8

 

 

 

 

 

 

a>0; b>0

 

 

 

 

 

7

 

a>0; b>0

 

 

6

 

a>0; b<0

 

 

 

 

 

 

a>0; b<0

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

x

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

а

bx

5

 

 

 

y а xb

 

 

 

 

у

4

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

0

 

 

 

 

1

3

5

7

9

 

 

 

1

3

5

7

9

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

6

a>0; b>0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

y а bx

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

1

3

5

7

 

9

 

 

 

Используя эту таблицу, нужно выбрать одну или несколько функций, которые могут описать вашу экспериментальную кривую, а затем с помощью надстройки Поиск решения подобрать неизвестные параметры, входящие в эти функции. Как видно из таблицы некоторые функции могут иметь разного вида кривые в зависимости от знаков и значений параметров, поэтому однозначный выбор функции, соответствующий данной кривой довольно сложен. Всегда можно найти несколько функций, которые в равной степени смогут описать данную экспериментальную кривую. В этом случае для описания следует выбирать несколько подходящих функций и по степени близости аппроксимации экспериментальных данных выбранной функцией остановиться на одной из них.

После выбора функции задаем начальные приближения для нахождения ее параметры (коэффициенты). Например, строим таблицу коэффициентов и критерии для поиска решения (рис.3).

Вводим столбец имен параметров (чтобы помнить, что здесь за числа) и справа, соответствующие им начальные приближения, которые надо выбрать согласно принятых к использованию графиков. Хотя начальные приближения могут быть любыми и самый простой вариант это 1, но при подборе коэффициентов в этом случае могут быть ошибки и корректного решения можно и не достичь. Так же можно попробовать решать

задачу с использованием различных начальных приближений, при корректной её постановке результат должен быть одинаковым.

Теперь к имеющимся данным таблицы (рис.4) добавляем столбцы с расчетными значений YY(их должно быть 4 как и число параллель-

5

ных опытов, что упростит расчет критерия оптимизации критерия Пирсона).

Рис.4. Фрагмент таблицы Вводим в первую ячейку расчетных данных формулу выбранной

функции, используя для подбираемых параметров функции адреса ячеек со значениями начальных приближений коэффициентов (см. рис.3), которые задаются с абсолютной адресацией и аргумента Х из соответствующей ячейки таблицы в текущей строке, адрес которой должен быть привязан с столбцу. Копируем формулу на остальные ячейки столбцов Yрасч. Получаем расчетные значения функции для заданных начальных приближений параметров (коэффициентов). Конечно, значения вычисленной функции далеки от наших экспериментальных значений. Подбирая значения параметров можно получить хорошую сходимость между экспериментальными и расчетными данными, но выполнить эту операцию вручную достаточно сложно. Для её реализации можно воспользоваться надстройкой Поиск решения.

В качестве критерия оценки качества описания экспериментальных данных используемой функцией используется метод наименьших квадратов (1). В Excel он реализуется через функцию суммы квадратов разности экспериментальных и расчетных значений Y. Для критерия качества описания экспериментальных данных соответствующей функцией можно использовать критерий Пирсона. Под таблицей коэффициентов (см. рис.3) вводим соответствующие комментарии «Минимум» и «Пирсон», а правее и сами функции СУММКВРАЗН() и КВПИРСОН(), аргументами которых

являются

 

диапазоны

экспери-

 

ментальных и расчетных значе-

 

ний Y. На рис.5 представлено

 

диалоговое

окно

 

функции

 

СУММКВРАЗН().

 

 

 

Чтобы

выполнить

поиска

 

решения

следует

выбрать во

 

вкладке

ДанныеПоиск реше-

Рис.5. Диалоговое окно функции

ния. Если

данной

надстройки

СУММКВРАЗН().

нет, то её надо активировать че-

 

 

 

 

 

 

6

Рис.6. Окно Поиска решения

рез «Параметры» Excel в разделе «Надстройки».

В открывшемся диалоговом окне (рис.6) в ячейке Оптимизировать целевую функцию должна стоять ссылка на ячейку с формулой СУМ-

МКВРАЗН(), в следующей строке «До» - Минимум, Изменяя ячейки пере-

менных – указываем ссылки на начальные приближения параметров. Снимаем галочку с по-

зиции Сделать переменные без ограничений неотрицательными

и нажимаем кнопку Найти ре-

шение.

Следует отметить, что метод, заложенный в Поиске решения, является итерационным, то есть точность достигнутого решения увеличивается от итерации к итерации. Поэтому поиск решения необходимо проводить несколько раз до прекращения изменений в целевой ячейке. Снова открываем вкладку Поиск

решения и, ничего не изменяя, нажимаем Найти решение. Если значение в целевой ячейке после второго поиска не изменилось, значит, поиск решения можно считать завершенным.

По результатам поиска расчетов строим графики с экспериментальными и расчетными данными (рис.7).

 

График зависимости 1/Y=a+bX - планки по средней погрешности

 

3,5

 

 

 

 

 

3,5

 

 

 

 

 

 

 

 

 

 

Y1р

 

 

3

 

 

 

Ycp

 

3

 

 

 

 

 

2,5

 

 

 

 

 

2,5

 

 

 

 

 

 

2

 

 

 

 

 

2

Ось Y

 

 

 

 

 

Ось Y

1,5

 

 

 

 

 

1,5

1

 

 

 

 

 

1

0,5

 

 

 

 

 

0,5

0

 

 

 

 

 

0

0

2

4

6

8

10

12

 

 

 

Ось Х

 

 

 

 

График зависимости 1/Y=a+bX - планки по строчным погрешностям

 

 

 

 

 

Y1р

 

 

 

 

 

 

Ycp

 

 

0

2

4

6

8

10

12

 

 

 

Ось Х

 

 

 

Рис.7. Графики найденной функции а) с планками общей погрешности, б) с планками строчных погрешностей.

Используя команду «Планки погрешностей» на ленте «Макет» в разделе «Работа с диаграммами, наносим планки погрешностей, исполь-

7

зуя найденные интервалы погрешностей для каждой из строк и потом общую погрешность для всего графика. Данные задаются для экспериментальных данных с использованием «Величина погрешности – пользовательская» с последующим выбором данных для положительных и отрицательных отклонений, задавая Y в одном случае среднее для всех данных и в другом для каждой строки таблицы.

В случае выбора нескольких функций строится соответствующее количество табличек для приближенных значений параметров и столбцов расчетных значений Y для этих функций. Далее для каждой функции проводится поиск значений коэффициентов. Следует отметить, что не все функции, выбранные вами, смогут близко описать ваши экспериментальные данные, поэтому после расчетов выбирается функция с наилучшим критерием Пирсона. Причем он должен приближаться к единице и быть не менее 0,95, поскольку допустимая погрешность для инженерных вычислений должна составлять 5%. Окончательный вид листа с расчетом представлен на рис.11 (в конце документа).

С целью углубления знаний по статистическому анализу данных можно провести оценку интервальных зависимостей исследуемой функции. Для решения данной задачи расширяем таблицу коэффициентов и критериев (рис.8) с установкой начальных приближений для расчета коэффициентов интервальных кривых. Строим верхнюю и нижнюю границы для среднего значения исследуемой функции (рис.9) по формуле Yср ±

Y и для них находят описания по принятой

для эксперимента функции Y=F(X) с использованием той же процедуры поиска решения (столбцы S и U на рис.9).

Используя надстройку «Поиск решения

для каждого из наборов коэффициентов полу-

Рис.8. Коэффициенты для расчета чаем еще две

кривых, определяющих интервальные оценки нашей функции

Используя эти данные, можно построить графики границ допусков для данной функции (рис.10).

В этом случае интервальные границы для параметров оказываются уже не симметричными:

Рис.9. Таблица с данными

8

 

 

 

а 0,09

0,030;

в 0,22 0,039

 

 

 

 

 

0,023

 

0,032

 

График зависимости 1/Y=a+bX - интервальные погрешности

 

 

Причем влияния границ на

3,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оценки параметров противопо-

 

 

 

 

 

Ycp

 

 

3,0

 

 

 

 

 

 

 

ложны.

 

 

 

 

 

Y1р

 

 

 

 

 

 

 

Ycp-

Y

 

2,5

 

 

 

 

 

 

 

 

 

 

 

 

 

Отчет может быть выпол-

 

 

 

 

 

Ycp-

Y

 

 

 

 

 

 

 

 

 

2,0

 

 

 

 

 

 

 

нен в редакторе MS Word или

Y

 

 

 

 

 

 

 

Ось

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отдельный лист MS Excel и со-

1,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,0

 

 

 

 

 

 

 

держать краткое описание вы-

 

 

 

 

 

 

 

 

0,5

 

 

 

 

 

 

 

полненных операций, объясне-

 

 

 

 

 

 

 

 

0,0

 

 

 

 

 

 

 

ния при анализе статистических

0

2

4

6

8

10

 

12

результатов, обоснование выбо-

 

 

 

Ось Х

 

 

 

 

Рис.10. График и интервальными границами.

ра функции и выводов по про-

 

 

 

 

 

 

 

 

деланной работе. Пример расчета показан ниже. Справой стороны внизу

вспомогательная информация для подписей на графиках.

Рис.11. Окончательный вид полученного листа Excel.

9

Приложение 1 Критические значения коэффициента Кохрена (G-критерия)

для доверительной вероятности p = 95%

 

 

 

 

 

Число степеней свободы, f1

 

 

 

 

 

1

2

3

4

5

6

8

10

16

36

 

2

9985

9750

9392

9057

8772

8534

8159

7880

7341

6602

5000

 

3

9669

8709

0797

7454

7071

6771

6333

6025

5466

4748

3333

 

4

9065

7679

6841

6287

5895

5598

5175

4884

4366

3720

2500

 

5

8412

6838

5981

5441

5065

4783

4387

4118

3645

3066

2000

2

6

7808

6161

5321

4803

4447

4184

3817

3568

3135

2612

1667

 

 

 

 

 

 

 

 

 

 

 

 

, f

7

7271

5612

4800

4307

3974

3726

3384

3154

2756

2278

1429

измерений

 

 

 

 

 

 

 

 

 

 

 

 

8

6798

5157

4377

3910

3595

3362

3043

2829

2462

2022

1250

9

6385

4775

4027

3584

7276

3067

2768

2568

2226

1820

1111

10

6020

4450

3733

3311

3029

2823

2541

2353

2032

1655

1000

12

5410

3924

3264

2880

2624

2439

2187

2020

1737

1403

0833

15

4709

3346

2758

2419

2195

2034

1815

1671

1429

1144

0667

Число

20

3894

2705

2205

1921

1735

1602

1422

1303

1108

0879

0500

24

3434

2354

1907

1656

1493

1374

1216

1113

0942

0743

0417

30

2929

1980

1593

1377

1237

1137

1001

0921

0771

0604

0333

 

 

40

2370

1576

1259

1082

0968

0887

5950

0713

0595

0462

0250

 

60

1737

1131

0895

0765

0682

0623

0552

0497

0411

0316

0167

 

120

0998

0632

0495

0419

0371

0337

0292

0266

0218

0165

0083

 

0000

0000

0000

0000

0000

0000

0000

0000

0000

0000

0000

Все значения G-критерия меньше единицы, поэтому в таблице приведены лишь десятичные знаки, следующие после запятой, перед которой при пользовании таблицей нужно ставить ноль целых. Например, при k = 6, ν = 3 имеем G0,95 = 0,5321.

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]