Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции (для печати).docx
Скачиваний:
179
Добавлен:
06.03.2016
Размер:
2.47 Mб
Скачать

. (1)

Подберём параметры итак, чтобы точки,построенные по данным наблюдений, на плоскостилежали как можно ближе к прямой (1). Уточним смысл этого требования. Назовём отклонением разность, где- вычисленная по уравнению (1) ордината, соответствующая наблюдаемому значению;- наблюдаемая ордината, соответствующая.

Подберём параметры итак, чтобы сумма квадратов отклонений была минимальной. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция этих параметров

Для отыскания минимума приравняем нулю соответствующие частные производные:

(2)

Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно и :

(3)

Решив эту систему, найдём искомые параметры:

(4) . (5) Корреляционная таблица

При большом числе наблюдений одно и то же значение может встретитьсяраз, одно и то же значение-раз, одна и та же пара чиселможет наблюдатьсяраз. Поэтому данные наблюдений группируют, т.е. подсчитывают частоты,. Все сгруппированные данные записывают в виде таблицы, которая называетсякорреляционной.

Y

X

10

20

30

40

0,4

5

-

7

14

26

0,6

-

2

6

4

12

0,8

3

19

-

-

22

8

21

13

18

Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным

Для определения параметров уравнения прямой линии регрессии YнаXбыла получена система уравнений

(3)

Для простоты записи опустим индексы

(3a)

При выводе этой системы предполагалось, что значения Xи соответствующие им значенияYвстречались по одному разу. Если дана корреляционная таблица, то до применения системы (3а) предварительно заметим, что из раннее выведенных формул

=

(учтено, что пара чисел наблюда- ласьраз).

Подставив правые части тождеств в систему (3а) получим:

(4)

Из второго уравнения найдём , предварительно сократив на, и подставим в уравнение, получим

. (5)

Для определения второе уравнение умножим на и вычтем из первого:

.

Учитывая, что , получим. Умножим обе части равенства на дробь :(6).

Обозначим правую часть равенства (6) через , тогда равенство (6) примет вид. Откуда. Подставив значениев (5), окончательно получим выборочное уравнение прямой линии регрессииYнаX:

,

где - выборочный коэффициент корреляции .

Если величины YиXнезависимы, то =0; если связаны линейной функциональной зависимостью, то . Отсюда следует, чтоизмеряет тесноту линейной связи междуYиX.

Методика вычисления выборочного коэффициента корреляции

Найти выборочное уравнение прямой линии регрессии YнаXпо данным, приведённым в корреляционной табл.1.

Таблица 1

Y

X

20

25

30

35

40

16

4

6

10

26

8

10

18

36

32

3

9

44

46

4

12

6

22

56

1

5

6

4

14

46

16

20

При определении выборочного уравнения прямой линии регрессии основная задача сводится к определению . Для упрощения расчётов на практике переходят к условным вариантам .

Составим корреляционную табл. 2 в условных вариантах, выбрав в качестве ложных нулей

Таблица 2

-2

-1

0

1

2

-2

4

6

10

-1

8

10

18

0

32

3

9

44

1

4

12

6

22

2

1

5

6

4

14

46

16

20

В этом случае выборочный коэффициент корреляции вычисляют по формуле (при этом величина не изменится)

.

Величины можно найти методом произведений или вычислить непосредственно исходя из определений этих величин:

Для определения найдём предварительнои:

тогда =1,07;=1,02.

Остаётся указать способ вычисления , где- частота пары условных вариант. Можно доказать, что справедливы формулы:

,

.

Для контроля целесообразно выполнить расчёты по обеим формулам и сравнить результаты; их совпадение свидетельствует о правильности вычислений.

Для вычисления составим расчётную табл. 3.

Пояснения к составлению табл.3:

В каждой клетке, в которой частота , записывают в правом верхнем углу произведение частотына варианту. Например, в правых верхних углах клеток первой строки записаны произведения: 4.

Складывают все числа, помещённые в правых верхних углах клеток одной строки и их сумму записывают в клетку этой же строки столба . Например, для первой строки

Умножают варианту наи полученное произведение записывают в последнюю клетку той же строки. Например, в первой строке таблицыследовательно.

Сложив все числа столбца , получают сумму, которая равна искомой сумме. Например, в нашем случае, следовательно

Для контроля аналогичные вычисления производят по столбцам: произведения записывают в левый нижний угол клетки, содержащей частоту; все числа, помещённые в левых нижних углах клеток одного столбца, складывают и их сумму записывают в строкеV; далее умножают каждую варианту наV и результат записывают в клетках последней строки.

Сложив все числа последней строки, получают сумму , которая также равна

Найдём выборочный коэффициент корреляции:

.

Найдём шаги

Найдём

.

Подставив найденные величины в уравнение , получим искомое уравнение прямой линии регрессии Y на X:

или