Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ГМУ Документ Microsoft Word.doc
Скачиваний:
218
Добавлен:
14.05.2015
Размер:
1.64 Mб
Скачать

Тема 7. Парная линейная регрессия

1. Линейное уравнение регрессии

Регрессией называется односторонняя вероятностная зависимость между случайными величинами. Эта зависимость выражается с помощью функции, которая называется регрессией. Регрессии различают по числу переменных (между двумя переменными – простая, или несколькими – множественная); по форме зависимости (линейная, выражаемая линейной функцией, нелинейная).

Результаты измерений или наблюдений величин и(случайных) фиксируют в таблице наблюдений, если данные наблюдаются по одному разу.

Эти результаты можно изобразить на координатной плоскости в виде точек, координатами которых являются значения признака и одного объекта= 1, 2, …,n. В итоге получаем корреляционное поле. Пусть представление выборки на корреляционном поле следующие (рис. 2).

Рис. 2. Представление выборки

В случае а) видно, что следует искать линейную зависимость, в случае б) – нелинейную зависимость, а в случае в) вряд ли зависимость существует.

Конкретный вид функциональной зависимости между величинами и называется эмпирической функцией. Простейшим видом эмпирической функции является линейная функция. Для получения линейной эмпирической формулы самым простейшим является метод «натянутой нити». В этом методе на корреляционном поле надо так провести прямую, чтобы по обе стороны ее оставалось примерно одинаковое количество точек. Выбираем на этой прямой две точкии(они могут и не принадлежать выборке). Подставляем эти координаты в формулу, получаем систему линейных уравнений:

Решив эту систему относительно аиb, получаем эмпирическую формулу.

Условным средним называется среднее арифметическое наблюдений значений, при фиксированном значении переменной. Корреляционной зависимостью отназывается функциональная зависимость условной среднейотх, в случае линейной корреляционной зависимости уравнение прямой линии регрессии имеет вид:=kx+c, где угловой коэффициентkназывается выборочным коэффициентом регрессииY наXи обозначается.

Параметры инаходятся из системы уравнений (метод наименьших квадратов):

где n – число наблюдений значения параметра.

Уравнение регрессии принято записывать в виде , где.

Коэффициенты иможно также найти по формулам:

,

Уравнение регрессии наимеет вид:

,

где

,

.

Если выборка многочисленна, то одно и то же значение может встретитьсяраз, одно и то же значениесоответственно раз. Одна и та же пара значенийможет наблюдатьсяраз.

Поэтому наблюдаемые значения могут быть сгруппированы и записаны в корреляционной таблице:

Y

Х

16

18

20

25

10

1

4

20

9

10

25

6

6

2

30

1

18

6

Здесь Х– количество удобрений,Y– урожайность, на пересечении строки и столбца указано количество участков, в которых при вносимом количестве удобрений получен соответствующий урожай.