- •Аппроксимация методом наименьших квадратов и методом линейной регрессии
- •070500 «Ядерные реакторы и энергетические установки»
- •Цель работы
- •Сведения из теории
- •Предмет теории аппроксимации
- •Метод наименьших квадратов
- •Метод линейной регрессии
- •Методы подбора эмпирических формул
- •Описание лабораторной установки
- •Блок детектирования бдза-2-01
- •Измеритель скорости счета с автоматическим переключателем поддиапазонов уим-2
- •Техника безопасности
- •Порядок выполнения работы
- •Требование к отчету
- •Контрольные вопросы
- •Список литературы
Метод наименьших квадратов
Один из наилучших методов аппроксимации - это способ (метод) наименьших квадратов, который был развит усилиями Лежандра и Гаусса более 150 лет назад.
В результате эксперимента получается набор значений функций (у1, у2, ..., уn) для значений аргумента (х1, х2, ..., хn).
Если соединить последовательно точки у1, у2, ..., уn ломаной линией, она не является графическим изображением функции у=f(х), так как при повторении данной серии опытов мы получим ломаную линию, отличную от первой. Значит, измеренные значения у будут отклоняться от истинной кривой у=f(х) вследствие статистического разброса. Задача состоит в том, чтобы аппроксимировать экспериментальные данные гладкой (не ломаной) кривой, которая проходила бы как можно ближе к истинной зависимости у= f(х).
Теория вероятности показывает, что наилучшим приближением будет такая кривая (или прямая) линия, для которой сумма квадратов отклонений между измеренной и расчетной точкой будет минимальной. Метод нахождения кривой, соответствующей этому условию, и называется методом наименьших квадратов (МНК). Фактически это условие минимума соответствует предположению, что разброс точек уi относительно кривой у=f(х) подчиняется закону нормального распределения.
Требуется установить зависимость между двумя величинами х и y.
Б
удем
рассматриватьx
и y
как прямоугольные координаты точек на
плоскости.
Предположим, что точки с соответствующими координатами почти лежат на прямой линии (рис.1) вида y=А+Вx, где В=tg.
N– число точек на плоскости (число измерений).
Определим параметры А и В.
. (1)
.(2)
.(3)
Метод линейной регрессии
Под регрессионным анализом понимают исследование закономерностей связи между явлениями (процессами), которые зависят от многих, иногда неизвестных, факторов. Часто между переменными x и y существует связь, но не вполне определенная, при которой одному значению x соответствует несколько значений (совокупность) y. В таких случаях связь называют регрессионной. Таким образом, функция y=f(x) является регрессионной (корреляционной), если каждому значению аргумента соответствует статистический ряд распределения y. Установление регрессионных зависимостей между величинами x и y возможно лишь тогда, когда выполнимы статистические измерения.
Статистические зависимости описываются математическими моделями процесса. Модель по возможности должна быть простой и адекватной.
Суть регрессионного анализа сводится к установлению уравнения регрессии, т.е. вида кривой между случайными величинами, оценке тесноты связи между ними, достоверности и адекватности результатов измерений.
Чтобы предварительно
определить наличие такой связи между
x
и y,
наносят точки на графики, строят так
называемое корреляционное поле.
Корреляционное поле характеризует вид
связи между x
и y.
По форме поля можно ориентировочно
судить о форме графика, характеризующего
прямолинейную или криволинейную
зависимости.
Если на корреляционном поле усреднить точки, то можно получить ломаную линию, называемую экспериментальной регрессионной зависимостью. Наличие ломаной линии объясняется погрешностями измерений, недостаточным количеством измерений, физической сущностью исследуемого явления и др.
Различают однофакторные (парные) и многофакторные регрессионные зависимости. Парная регрессия при парной зависимости может быть аппроксимирована прямой линией, параболой, гиперболой, логарифмической, степенной или показательной функцией, полиномом и др. Двухфакторное поле можно аппроксимировать плоскостью, параболоидом второго порядка, гиперболоидом. Для переменных факторов связь может быть установлена с помощью n-мерного пространства уравнения второго порядка:
, (4)
где y – функция цели многофакторных переменных;
bi – коэффициенты регрессии, характеризующие влияние фактора xi на функцию цели;
bij – коэффициенты, характеризующие двойное влияние факторов xi и xj на функцию цели.
xi – независимые факторы;
При построении
теоретической регрессионной зависимости
оптимальной является такая функция, в
которой соблюдаются условия наименьших
квадратов
,
где
yi – фактические ординаты поля;
y – среднее значение ординаты с абсциссой x.
Поле корреляции аппроксимируется уравнением прямой y=a+bx. Линию регрессии определяют из условия наименьших квадратов.
. (5)
. (6)
Критерием близости корреляционной зависимости между x и y к линейной функциональной зависимости является коэффициент корреляции r, показывающий степень тесноты связи x и y и определяемый отношением
. (7)
Значение корреляции всегда меньше единицы. При r=1 x и y связаны функциональной связью. При r=0 линейная корреляционная связь между x и y отсутствует, но может существовать нелинейная прогрессия.
Как правило, прежде чем находить аналитическую зависимость между величинами х и у, определяют, существует ли связь между этими двумя параметрами. Для этого необходимо рассчитать выборочный коэффициент корреляции r. Полученные значения r сравнивают с табличными значениями (см. приложение) для заданной доверительной вероятности и числа экспериментальных данных N. Обычно доверительную вероятность () выбирают 0,95, что подходит для большинства экспериментальных исследований. Если рассчитанный r больше соответствующего (для заданных N и ) значения коэффициента корреляции, то связь между величинами х и у значима с вероятностью .
Для определения процента разброса (изменчивости) искомой функции y относительно ее среднего значения, определяемого изменчивостью фактора x, вычисляют коэффициент детерминации:
kд=r2 (8)
