Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika_4.doc
Скачиваний:
13
Добавлен:
11.09.2019
Размер:
451.07 Кб
Скачать

4.3. Отыскание параметров выборочного уравнения прямой линии среднеквадратичной регрессии по несгруппированным данным

Пусть изучается система количественных признаков (X, Y). В результате п независимых опытов получены п пар чисел (x1 y1), (х2 y2), ..., (хп, уn).

Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии. Для определенности будем искать уравнение регрессии Y на X: =kx + b.

Поскольку различные значения х признака X и соответствующие им значения у признака Y наблюдались по одному разу, то группировать данные нет необходимости. Также нет надобности использовать понятие условной средней, поэтому искомое уравнение можно записать так:

y = kx + b.

Угловой коэффициент прямой линии регрессии Y на X называют выборочным коэффициентом регрессии Y на X и обозначают через ух; Итак, будем искать выборочное уравнение прямой линии регрессии Y на X вида

Y = ух x + b. (1)

Подберем параметры ух и b так, чтобы точки (x1 y1), (х2 y2), ..., (хп, уn), построенные по данным наблюдений, на плоскости Оху лежали как можно ближе к прямой (1). Назовем отклонением разность Yiyi (i=l, 2, ..., n), где Yiвычисленная по уравнению (1) ордината, соответствующая наблюдаемому значению хi; уiнаблюдаемая ордината, соответствующая хi.

Подберем параметры ух и b так, чтобы сумма квадратов отклонений была минимальной (в этом состоит сущность метода наименьших квадратов). Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция этих параметров (временно вместо ух будем писать ):

,

или

Для отыскания минимума приравняем нулю соответствующие частные производные:

Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно  и b:

. (2)

Решив эту систему, найдем искомые параметры:

(3)

Аналогично можно найти выборочное уравнение прямой линии регрессии X на Y: = xyx + C, где хувыборочный коэффициент регрессии X на Y.

4.4. Корреляционная таблица

При большом числе наблюдений одно и то же значение х может встретиться пх раз, одно и то же значение у – пу раз, одна и та же пара чисел (х, у) может наблюдаться пху раз. Поэтому данные наблюдений группируют, т. е. подсчитывают частоты пх, пу, пху. Все сгруппированные данные записывают в виде таблицы, которую называют корреляционной.

Пример.

Y

X

10

20

30

40

0.4

0.6

0.8

5

3

2

19

7

6

14

4

26

12

22

8

21

13

18

n=60

В первой строке таблицы указаны наблюдаемые значения (10; 20; 30; 40) признака X, а в первом столбце – наблюдаемые значения (0,4; 0,6; 0,8) признака Y. На пересечении строк и столбцов находятся частоты пху наблюдаемых пар значений признаков. Например, частота 5 указывает, что пара чисел (10; 0,4) наблюдалась 5 раз. Все частоты помещены в прямоугольнике, стороны которого проведены жирными отрезками. Черточка означает, что соответственная пара чисел, например (20; 0,4), не наблюдалась.

В последнем столбце записаны суммы частот строк. Например, сумма частот первой строки «жирного» прямоугольника равна пу = 5 + 7 + .14 = 26; это число указывает, что значение признака Y, равное 0,4 (в сочетании с различными значениями признака X), наблюдалось 26 раз.

В последней строке записаны суммы частот столбцов. Например, число 8 указывает, что значение призрака X, равное 10 (в сочетании с различными значениями признака Y), наблюдалось 8 раз.

В клетке, расположенной в нижнем правом углу таблицы, помещена сумма всех частот (общее число всех наблюдений n). Очевидно, . В нашем примере

и .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]