Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МНИ / МНИ / МНИ_лекции_1 часть_2009.doc
Скачиваний:
468
Добавлен:
28.03.2015
Размер:
1.18 Mб
Скачать

Регрессионный анализ

Регрессионный анализ применяют для получения зависимостей в процессах, в которых параметры зависят от многих факторов.

Часто между переменными x и y существует связь, но не вполне определенная. В самом простом случае одному значению x соответствует несколько значений (совокупность) y. В таких случаях связь называют регрессионной. Таким образом, функция y=f(x) является регрессионной (корреляционной), если каждому значению аргумента соответствует статистический ряд распределения y. Установление регрессионных зависимостей между величинами x и y возможно лишь тогда, когда выполнимы статистические измерения.

Статистические зависимости описываются математическими моделями процесса. Модель по возможности должна быть простой и адекватной.

Задача регрессионного анализа - установление уравнения регрессии, т.е. вида кривой между случайными величинами, и оценка тесноты связи между ними, достоверности и адекватности результатов измерений.

Чтобы предварительно определить наличие такой связи между x и y, наносят точки на графики строят так называемое корреляционное поле. Корреляционное поле характеризует вид связи между x и y. По форме поля можно ориентировочно судить о форме графика, характеризующего прямолинейную или криволинейную зависимости.

Если на корреляционном поле усреднить точки, то можно получить ломаную линию, называемую экспериментальной регрессионной зависимостью. Наличие ломаной линии объясняется погрешностями измерений, недостаточным количеством измерений, физической сущностью исследуемого явления и др.

Имеется некое регрессионное поле.

I случай II случай

Рис. 19

Для второго случая можно получить аналитические кривые, но мы не можем ответить на вопрос: «Правильно ли они описывают данное регрессионное поле?». Для этого существует коэффициент корреляции:

(59)

Коэффициент корреляциипоказывает степень тесноты связии;

Значение корреляции всегда меньше единицы. При r=1 x и y связаны функциональной связью. При r=0 линейная корреляционная связь между x и y отсутствует, но может существовать нелинейная прогрессия. Регрессия считается хорошей при r≈0,9.

Как правило, прежде чем находить аналитическую зависимость между величинами х и у, определяют, существует ли связь между этими двумя параметрами. Для этого необходимо рассчитать выборочный коэффициент корреляции r. Полученные значения r сравнивают с табличными значениями (см. Приложение) для заданной доверительной вероятности и числа экспериментальных данных N. Обычно доверительную вероятность () выбирают 0,95, что подходит для большинства экспериментальных исследований. Если рассчитанный r больше соответствующего (для заданных N и ) значения коэффициента корреляции, то связь между величинами х и у значима с вероятностью .

Для определения процента разброса (изменчивости) искомой функции y относительно ее среднего значения, определяемого изменчивостью фактора x, вычисляют коэффициент детерминации (см. рис. 17).

Коэффициент детерминации

(60)

Рассмотрим, как можно описать эти выражения, то есть получить регрессионные зависимости на примере линейных функций.

Рис. 20

Если относительно некого среднего значения разбросано так, что они подчиняются распределению Гаусса, то в этом регрессионном поле есть вероятность получения некоторого значения.

(61)

(62)

(63)

(64)

- сумма квадратов ошибок отнесенная с степени погрешности,

нужно минимизировать; для этого найдем производную по коэффициентам и.

(65)

(66)

(67)

(68)

Соседние файлы в папке МНИ