Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
36
Добавлен:
03.03.2016
Размер:
560.13 Кб
Скачать

Задачи корреляционно-регрессионного анализа:

  1. Установление формы связимежду переменными и получение уравнения регрессиив явном виде.

  2. Оценка тесноты связимежду переменными.

Задача 1. Установление формы связи и получение уравнения регрессии в явном виде

Первоочередная задача регрессионного анализа – установление формысвязи, т.е.подбор такой функции, которая как можно лучше характеризовала быосредненноемассовое течение явления.

Выбор формы связи осуществляется на основе знания характера поведенияисследуемогопроцесса, а в крайнем случае –на основе построения (если возможно) по экспериментально полученным данным эмпирических графиков.

Рассмотрим абстрактный пример.

Пусть в результате эксперимента получен ряд из "n" пар чисел, характеризующих (описывающих) некоторый процесс (табл.2.1).

Таблица 2.1 – Массив экспериментально полученных данных

X

1,0

1,5

3,0

4,5

5,0

Y

1,25

1,4

1,5

1,75

2,25

Поскольку переменных две, а характер поведения рассматриваемого процесса неизвестен – построим корреляционное поле в декартовой системе координат (рис.2.9).

Корреляционное поле(точечный график) – это графическое изображение совокупности экспериментально полученных данных в виде точек в системе координат.

Если соединить все точки в порядке возрастания Хотрезками прямой получимэмпирическую (наблюдаемую) линию регрессии. Причем, если в серии экспериментов некоторому значениюXсоответствует несколько значенийY, то перед построением эмпирической линии регрессии для каждого такогоХдолжно быть определеновыборочное среднее. Поэтому в общем случае эмпирическая линия регрессии строится по выборочным средним, определенным при имеющих место в эксперименте значенияхХ.

Характер линии (в общем случае – поверхности) регрессии дает представление об ожидаемом поведении среднегозначенияYпод влиянием учтенных факторов (в рассматриваемом примере –X).

Рис.2.9. Корреляционное поле, эмпирическая и теоретическая линии регрессии

Статистические данные, представленные в числовом виде, не всегда удобны и наглядны. Они значительно лучше воспринимаются, если представлены в аналитическом виде, т.е. в виде функций.

Но поскольку эмпирические данные по Хи поYне являются достаточно точными (ошибки измерений, влияние других факторов, ограниченный объем экспериментальных данных), представляет интерес выбор такой аппроксимирующей функцииf(X), чтобы значения ее находились достаточно близко от известных значений, но не обязательно совпадали с ними в точках.

Например, по расположению эмпирической линии регрессии на рис.2.9 можно предположить, что форма корреляционной связи – линейная.

Уравнение линейной регрессии:

,

где

- параметры уравнения регрессии.

Линия регрессии, построенная по уравнению регрессии, называется теоретической линией регрессии.

В качестве меры «близости» часто принимается квадрат расстояния между эмпирической функцией, заданной таблицей значений, и аналитическим аналогом. Такое приближение функции решается методом наименьших квадратов.

Оценка параметров линейного уравнения регрессии методом наименьших квадратов (мнк)

Суть метода в том, чтобы сумма квадратов отклонений расчетных значений (определенных по теоретической линии регрессии) от экспериментально полученных значений была наименьшей.

Метод построения аппроксимирующей функции из этого условия называется методом наименьших квадратов.

В соответствии с идеей МНК необходимо минимизировать функционал

,

где

- значения переменных в i-той точке (наблюдаемые в эксперименте значения);

- теоретические (расчетные) значения Yпри наблюдаемых в эксперименте значениях;

n- количество экспериментально полученных точек.

Минимум функционала Qдостигается в той точке, в которой первые частные производные отQпо параметрамb0иb1обращаются в ноль:

;

.

В результате получаем систему нормальных линейных уравнений относительно неизвестных параметров b0иb1:

;

.

Решив систему, получим:

  • коэффициент регрессии

;

  • свободный член

,

где

- средние значения соответственно XиYдля данного массива экспериментальных данных.

Данные для расчета параметров уравнения регрессии представлены в табл.2.2.

Таблица 2.2 - Данные для расчета параметров уравнения регрессии

i

X

Y

1

2

3

4

5

1,0

1,5

3,0

4,5

5,0

1,25

1,40

1,50

1,75

2,25

1,00

2,25

9,00

20,25

25,00

1,250

2,100

4,500

7,875

11,250

1,5625

1,9600

2,2500

3,0625

5,0625

15,0

8,15

57,50

26,975

13,8975

∑/5

3,0

1,63

11,50

5,395

2,7795

;

.

Тогда оцененное уравнение парной линейной регрессии в явном виде:

.

Если бы между YиXсуществовала чисто функциональная связь, то все значенияYлежали бы на теоретической линии регрессии.

Соседние файлы в папке орг.пр