Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии

.pdf
Скачиваний:
77
Добавлен:
22.10.2023
Размер:
14.87 Mб
Скачать

Опираясь на указанные измерения, необходимо найти линейную зависимость между у и Xi, х2, . . хп, которая согласно принципу

наименьших квадратов, наилучшим образом соответствует этим материалам. Решение получается более простым, если рассматри­ ваются не исходные величины у и ли, х2, ..., хп, а отклонения их

от своих средних значений:

о

_

о

_

у « = У /-у ;

х ^ х ц - x f ,

j =

1.

2, . .

п,

i = 1,

2, . .

т.

В таком случае уравнение множественной линейной регрессии

У =У -И 1 (х и — ^ )-Ь &2 (х2i — лг2)-{- . . . +

 

-\-kj (Xji Xj)~f- . . . -\-kn{xni x ni) . . .

(6.26)

величины у относительно ее аргументов xi,

х2, ..., хп записывается

о

_

как уравнение регрессии величин г/г = г/г — У относительно отклоне-

 

 

 

о ' о

о

ний аргументов от их средних значений хи х2, . .

хп

0

0

0

о

(6.27)

y x= k lx {Jr k2X2 Jr

. . . -\-knx n.

Таких уравнений, очевидно, будет т в соответствии с числом

наблюдений над величинами у, Xi, х2, ..., хп- При этом т^>п. При

т < п задача определения параметров становится неразрешимой;

при т = п получается решение, в точности

удовлетворяющее ис­

ходным данным, однако это решение имеет

смысл лишь для точ­

ных функциональных связей.

Случай системы уравнений с числом их, большим числа неиз­ вестных входящих в них параметров, является основным при по­ строении уравнений регрессии. Вопрос о наилучшем решении си­ стемы с избыточным числом уравнений сводится к нахождению таких значений неизвестных величин, связанных между собой уравнениями, составляющими рассматриваемую систему, при под­ становке которых в данные уравнения будем иметь наименьшее уклонение рассчитанных величин от наблюденных. Принимая в ка­ честве оценки указанных отклонений их сумму, можно встретиться с такой ситуацией, когда большие отклонения, но имеющие раз­ ные знаки, могут компенсировать друг друга, в то время как абсо­ лютные значения отдельно рассматриваемых отклонений могут быть значительными.

Поэтому за наилучшее решение системы уравнений принима­ ется такое, при котором сумма квадратов всех отклонений (или ошибок расчета с использованием уравнения регрессии) будет иметь

332

минимальную величину, вследствие чего и способ, дающий такое решение, носит название способа наименьших квадратов.

Как указано в

§ 2 настоящей главы, коэффициент регрессии

в корреляционном

уравнении, связывающем две переменные, ра­

вен - 2 у. Гху. В уравнении множественной регрессии величина коэф-

фициента корреляции между х и у заменяется комбинацией этих

коэффициентов, вычисленных между каждыми двумя входящими в уравнение регрессии п величинами. Так, в частности, для случая трех переменных у, xi, х2 уравнение регрессии примет вид

о

Г

г

г

О

Г — г г

о

У=

УХ\

 

УХ 2 X j X 2

Хх

УХ2 yXj Х хХ 2

(6.28)

1

Г2

' Х \ Х 2

 

 

 

х хх 2

 

 

Для случая четырех переменных имеем

о

У-

1_

Г Х , У О

Г Х 2Х з )

Г Х 2 У Г Х 2 Х ,

Г

Г Х , Х г

■+

Х 2Х з

_ /*^

_!_ O’*

Г

 

1

Х :х 2

X i X 3 ~

А Х хХ 2 ' Х хХ з ' Х 2Х г

 

Г х 2х 3 ( г у х / х , х , Т г у х / х , х 2)

 

о

 

 

 

Х \

-

 

 

 

х,Хъ

 

 

 

 

 

х 2х 3

x t x 2

 

Х хХ 2

XiXz

х 2х 3

 

 

Г у х 2 О

r x , x i )

r y x , r x , x 2

Г у х Т х 2х 3

 

х 2

1

' Х 2Хз

__ г^

-L 9 Г

Г

Г

 

 

1

Х хХ 2

Х хХ 3 >

Х хХ 2 Х хХ л Х 2Х3

 

ГХ, Хз ( г у х , г Х 2Х, +

г у х / х 2х , )

 

 

 

 

 

■r\_r - r l г. - г ХхХг1

+ 2гх

 

 

 

 

 

X i X 'i

х , х г

 

 

 

 

 

 

 

 

Г у х 3 ( ^

г х , х 2)

г у х , г х 3х ,

г у х / . Х з Х 2

Хг

г х 2х 3

Г х , х 2

г Х хХ ъ Т " <^ г х 1х 2Г х , х 3г х 2х 3

 

Г х , х 2 ( г у

х / х , х 7 Т

г у х 2г ХзХ,)

 

о

Л3. (6.29)

1 — Г *

Г ^

Г *

-I- 9/*

Г

Г

' Х 2Хз

' Х \ Х 2

1 Х 1Х 3~

Х }х 2

Х хХз Х 2Хз

Приведенная система записи уравнений (6.28) и (6.29) может быть существенно упрощена и обобщена на общий случай пере­ менных с использованием детерминантов или определителей. В та­ ком случае общее выражение для коэффициента регрессии (k,)

можно записать в форме

D yxj

D

(6.30)

У У

333

где о у — среднее квадратическое отклонение зависимой перемен­

ной (функции);

о х .— среднее квадратическое отклонение независп-

 

 

VXj и D у у — миноры определителя

 

 

1

Г ух ,

г у х 2 ■ • •

r y x j

.

r vV

 

 

 

 

Ух п

 

 

Гх , у

1

ГХ,Х2

• • •

 

• ■• Г х . х

 

 

 

 

 

 

 

 

х Iх п

 

 

Г«-

ГХ 2Х,

1

 

. . .

Г х 2x j ' ' ■ Г х 2х п

 

 

 

 

 

 

D

=

 

 

 

 

 

 

 

(6.31)

 

 

Г х ]У

Г х ; х 1

ГХ]Х2 ■ ■

1

. . ' T x j x n

 

 

r * n y

Г х пх 1

Г х п х2 ■■■Г * п * Г

.

1

 

 

 

 

 

Минор

представляет

собой

часть исходного

определителя (D ),

у которого

в рассматриваемом

случае

вычеркнута первая строка

и столбец, соответствующий переменной, указанной в обозначе­ нии минора.

В частности, первый минор

D v y

означает исходный

определи­

тель D , у которого вычеркнута

первая строка и первый столбец.

 

1

Г г V • r x i x J

■ ■ Г х Хх п

 

 

Г х 2х ,

1

 

 

Г х 2х п

 

 

 

 

 

 

D y y =

ГГ .Г,

 

. . 1

Г х . х

п

 

 

 

 

 

х Г 1 Г х ] х 2

 

х г

 

 

Г х п х \

Г х п х 2

. .

Г х х

. . 1

 

 

 

'

Х п х j

 

 

 

Минор D Vx , представляет исходный определитель D ,

у которого

вычеркнута первая строка и второй столбец. Это второй минор. Третий минор ( D y x i ) получается вычеркиванием в определителе D

первой строки и треть «го столбца, четвертый (D yx3) — первой

строки и четвертого столбца и т. д. Указанные пояснения отно­ сятся к рассматриваемому случаю определения коэффициентов регрессии. В общем виде минор определителя D i j получается вы­

черкиванием i-той строки и /-того столбца.

Рассмотрим связь системы определителей с формой записи, представленной уравнением (6.28). В соответствии с выражением

334

(6.30) коэффициенты регрессии для уравнения с тремя переменными

0

 

0

0

(6.32)

у --- - k\X\ —j—коХ2

будут:

 

 

 

 

£ ____

С У

 

° У Х ,

 

 

СХ,

 

D y y

 

k

Су

® у х 2

 

 

°Х,

 

D y y

 

 

 

 

 

Применительно к рассматриваемому случаю определитель имеет вид

 

1

УХх

\ ' Х 2

 

 

 

 

D =

г.

1

Х гХ 2

(6.33)

УХх

 

 

у х 2

х ,х 2

1

 

Миноры этого определителя, входящие в выражение коэффици­ ента регрессии, равны:

 

 

 

= Г

ух,

г

г

х ,х 2*

 

 

 

ух 2

 

 

у х 2

 

 

 

 

 

 

 

 

 

D

У * \

= — Гг г

—г 1 = /* „ —г _ г

 

ух 2

I ух, х,х2

y*aj

У * 2

У*1

 

У Х г

Х , Х 2

 

 

 

 

 

 

 

DУУ

X \ Х 2

 

1

Г*1*2*

 

 

 

1

=

 

 

 

 

 

 

 

 

 

 

Уравнение регрессии примет вид (6.28). Элементами опреде­ лителя (6.33) являются коэффициенты парной корреляции между рассматриваемыми переменными, определяемые по уравнению

 

2

( X J — x i ) (■** ~

■**)

ГИ<= '

Г т

 

т

(6.34)

у

2

(xj ~

2

— jr*)2

Полный, или сводный, коэффициент корреляции между зави­ симой переменной и всеми независимыми переменными определя­ ется по выражению

r = VГ \

U y y

(б-35>

Если парные коэффициенты корреляции, характеризующие сте­ пень линейной связанности между двумя переменными, изменя­ ются от —1 до 1, то полный коэффициент корреляции имеет пре­ делы изменения от 0 до 1.

335

Линейная (а не всякая) зависимость между двумя перемен­ ными отсутствует при г = Опри R = Омежду п переменными. В слу­

чае наличия функциональной зависимости между переменными r = ± i , o , /г= 1,0 .

Полный коэффициент корреляции R при п> 1 всегда больше

любого парного коэффициента корреляции, входящего в опреде­

литель D,

кроме диагональной линии, где г

= г

=••• =

= г

=

УУ

Х\Х\

 

Х 2Х 2

1.

 

 

 

х п х п

Заметим, что полный коэффициент корреляции может быть рассчитан как парный коэффициент корреляции между наблюден­ ными величинами зависимой переменной и рассчитанными по урав­ нению регрессии.

Среднее квадратическое отклонение наблюденных величин (ум) от рассчитанных по уравнению регрессии (г/р), характери­

зующее точность используемого уравнения регрессии, может быть рассчитано по формуле

У (>'н — Ур) 2

j_____

(6.36)

т

 

или

 

Оу= а 0] / Ь = Ж

(6.37)

При R = 1 cTy = 0, что свидетельствует о полном совпадении на­ блюденных и вычисленных по уравнению (6.30) величин. При R = 0 оу= а0 и, следовательно, использование уравнения регрессии не

имеет смысла.

Для оценки средней

квадратической ошибки коэффициента ре­

грессии ( k j ) используется формула

 

 

ЧГ Y-

п) Р к.

У = 1,

(6.38)

 

 

где т — число членов ряда, использованных при составлении урав­ нения регрессии; п — число независимых переменных;

/ 4 =

л/7

А — определитель, равный

/газ*, п г с х Р х Т х 2х,

■ ■ fn a XiaXnr XnXl

n i l x p x 2г х ,х 2 т - х 2

■ •

• т а х р Хпг х пх 2

mox aXnrXlXn maXtoXnrXtXa . . . т с 2Хп

Ал — минор определителя А, полученный в рассматриваемом слу­

чае вычеркиванием в определителе А /-той строки и /-того столбца.

336

Из уравнения (6.38) следует, что ошибки коэффициентов ре­ грессии (при прочих равных условиях) возрастают с увеличением числа переменных. Учитывая сравнительно небольшую длитель­ ность рядов гидрологических величин, использование для построе­ ния уравнений множественной регрессии более четырех перемен­ ных приводит к получению малонадежных коэффициентов регрес­ сии и менее статистически устойчивых решений.

Общее выражение средней квадратической ошибки коэффици­ ента регрессии (kj) применительно к случаю трех переменных за­

пишется в виде:

 

 

3/;,=

 

 

 

r2XiXi)

 

 

(6.39)

 

 

 

axt У (т -

2 ) (1

-

 

 

 

 

 

°к2

°х2V ^ ~ 2 ) 0 -

 

 

 

(6.40)

 

 

 

' U

 

 

 

Для случая четырех переменных имеем:

 

 

 

t v

 

 

 

1 -

Гх*хг

 

 

 

( т

3 ) ( 1

г х - х 2

г х . х

 

Г Х 2Х 2 У ^ Г х , Х 2Г Х 2х / х 2Х ^ )

 

А

 

 

 

1_

,2

 

 

 

_____ У

1 / __________________________________ ____________

 

Х , Х з ____________________________________________

° - г 2

'

( / Я — 3 ) (l

Г х , Х 2 ~

r X t X 3 ~ ~ Г Х 2Х 3 "V^ Г Х 2Х 2Г Х , Х гГ Х 2Х г )

 

V

 

 

 

1 — гх,х2

 

 

г

х2

( т -

3)(1

1 Х\Х%

1 Х хХ г

-4- 9 г

х хХг

г

 

 

 

' Х 2Х 3 О

 

Х гх / Х 2Х у )

Возможность использования аппарата множественной линей­ ной корреляции в практике гидрологических исследований появи­ лась в связи с применением ЭВМ. В частности, программа, со­ ставленная на языке АЛГОЛ’-бО, применяется в ГГИ для исследо­ вания зависимостей между многими переменными применительно к задаче приведения коротких гидрологических рядов к длитель­ ному периоду и для решения других задач, опирающихся на стати­ стические связи многих переменных.

Учитывая, что ряды наблюдений за характеристиками гидро­ логического режима обычно имеют разную длительность и пропу­ ски наблюдений, программой предусматривается задание исходной информации в такой ситуации путем заполнения отсутствующих данных нулями. Программой предусматривается автоматический поиск наиболее эффективных независимых переменных и вос­ становление по этим переменным отсутствующих данных наблю­ дений.

1 Программа составлена М. В. Зориным.

2 2 Зак . № 88

337

§4

применение метода множественной линейной корреляции для приведения коротких гидрологических рядов

к длительному периоду

Рассмотрим порядок приведения к многолетнему периоду ве­ личин годового стока с использованием рек-аналогов на примере р. Свири у с. Мятусово. В качестве аналогов принимаем р. Вуоксу — X ГЭС (xi) и р. Неву у г. Петрокрепости (х2).

На р. Свири у с. Мятусово имеются наблюдения за периоды 1881—1940 и 1945—1951 гг. Для иллюстрации методики построе: ния уравнения регрессии полагаем, что в этом пункте имеются све­ дения о годовом стоке лишь за 20 лет (1928—1940 и 1945—1951 гг.) совместных наблюдений по всем трем рассматриваемым рекам. Опираясь на данные совместных наблюдений за указанные 20 лет, находим следующие значения парных коэффициентов корреляции: гух, = 0,74; гУх2= 0,88; гж,х.г= 0,55. В таком случае определитель (D)

и его миноры будут равны:

1

0,74

0,88

= 1 -

 

 

 

D-- 0,74

1

0,55

 

 

Х 0,55=0,1,

0,88

0,55

1

 

 

 

 

= --

0,74

0,55

= -

(0,74 - 0,88 • 0 ,5 5 )= -0 ,2 6 ,

 

0,88

1

 

 

 

 

 

 

о уя =

0,74

1

= 0,74 • 0,55 —0 ,8 8 = —0,47,

 

0,88

0,55

 

D уу

1

0,55

= 1 -0 ,5 5 2= 0,70 .

 

0,55

1

Полный коэффициент корреляции равен

 

 

r

= Y

\

 

0,10

0,93.

 

 

0,70

 

 

 

 

 

 

Подсчет средних значений и средних квадратических отклоне­ ний исходных рядов дает следующие оценки:

у=8,76,

=9,79,

лг2=8,57,

зу= 1,71,

а*,= 1,96,

0^=1,58.

Коэффициенты регрессии уравнения связи равны:

1,71 • 0,26 = 0,32,

1,96 • 0,70

1,71 • 0,47

k-i= 1,58 • 0,70 = 0,73.

338

Имея указанные исходные данные, строим уравнение регрессии в виде

У— y = k \ (-*1 — X\)-\-k-2 ( х 2х 2),

 

или

 

у _ 8,76=0,32 (jc, - 9,79)—j—0,73 (х 2- 8,57),

 

т. е.

 

y = 0 ,3 2 x ,+ 0,73 л;2-0 ,6 3 .

(6.41)

Среднее квадратическое отклонение полученной связи

равно

а_= зу +1 _ ^ 2 =1>71 Y 1 — 0,932= 0,63.

 

Средние квадратические отклонения коэффициентов регрессии k\ и k2 по формулам (6.39) и (6.40) равны:

0,63

=0,09,

1,96 Y (20 — 2) (1 - 0.552)

1 ,5 8 /(2 0 - 2) (1 -0,552)

Полученные значения а , ок свидетельствуют о достаточной

надежности коэффициентов регрессии.

Уравнение регрессии (6.41) использовано для расчета величин годового стока р. Свири у с. Мятусово за период 1859— 1958 гг., т. е. за весь период, по которому имеются наблюдения в пунктаханалогах. Из восстановленного за указанный период ряда величин годового стока произведены выборки для отдельных отрезков вре­ мени. Средние значения и коэффициенты вариации наблюденных и восстановленных отрезков рядов приведены в табл. 6.2. Приве­ денное в табл. 6.2 сопоставление рассчитанных значений с наблю­ денными выполнено с целью оценить точность уравнения, исполь­ зуемого для приводки. В практических задачах приведения, очевидно, такое сопоставление не может быть выполнено. Сопостав­

ление рассчитанных и

наблюденных

величин годового стока

р. Свири у с. Мятусово

(рис. 6.4) показывает достаточно хорошее

их соответствие.

Таблица

6.2

 

Наблюденные и рассчитанные с использованием корреляционного уравнения средние значения и коэффициенты вариации годового стока р. Свири

у г. Мятусово за различные периоды

 

Н аблю денны й ряд

В осстановленны й ряд

П ериод , годы

среднее

коэф ф и ц и ен т

среднее

коэф ф и циент

 

зн ачен ие,

вариации

зн ачен ие,

вариац ии

 

л / с • км 2

л /с * к м 2

 

 

 

1928-1940, 1945-1951

8,76

0,19

8,76

0,19

1881-1927

9,38

0,16

9,25

0,18

1881-1940, 1945-1951

9,31

0,16

9,11

0,18

1859-1958

9,16

0,18

 

 

 

 

2 2 *

3 3 9

Более полную форму использования множественной линейной корреляции рассмотрим на примере приведения годового стока р. Сож у г. Славгорода с использованием 8 аналогов, представлен­ ных в табл. 6.3.

Отметим, что фактически наблюдения за годовым стоком р. Сож у г. Славгорода велись в течение длительного периода (1897— 1968 гг.), и поэтому излагаемая ниже схема приводки примени­ тельно к этому створу имеет лишь методическое значение. Изла­ гаемые ниже расчеты, и в том числе выбор эффективных аналогов,

м л /с км2

Рис. 6.4. Многолетние колебания годового стока р. Свири у с. Мятусово.

I—наблюденные данные; 2—восстановленные по уравнению регрес­

сии.

Т а б л и ц а 6.3

Сведения о реках-аналогах, использованных для выполнения операции приведения годового стока р. Сож у г. Славгорода к многолетнему периоду

п /п

0

1

2

3

4

5

6

7

8

 

П лощ адь

Число

 

П ар ам етр

 

 

 

 

 

Р ока — пункт

водосбора,

лет

X

 

 

н аб лю де­

cv

 

 

к м 2

ний

л /с км 2

 

Сож — г. Славгород

17 700

68

6,10 ■

0,29

1,11

Днепр — г. Смоленск

14 100

81

6,88

0,27

0,91

Сож — г. Гомель

38 900

66

5,26

0,30

0,87

Березина — г. Бобруйск

20 200

79

5,89

0,20

0,99

Десна — г. Брянск

12 400

70

5,47

0,30

0,94

Десна — г. Чернигов

81 400

75

3,97

0,29

0,79

Днепр — г. Речица

58 200

68

6,34

0,23

0,52

Днепр — г. Орша

18 000

81

6,96

0,27

0,92

Припять — г. Мозырь

97 200

83

3,78

0,30

0,30

340

выполнены на электронной вычислительной машине М-220. При выполнении излагаемого ниже методического исследования при­ нято, что период совместных наблюдений на р. Сож и на рекаханалогах составляет 12 лет (1957—1968 гг.).

Программой предусматривается составление уравнений мно­ жественной линейной регрессии зависимой переменной (пункт при­ ведения) со всеми независимыми переменными (пункты-аналоги). При этом осуществляется перебор всех возможных сочетаний пунк­ тов-аналогов, что приводит к построению Ch уравнений, где п

общее число пунктов-аналогов, использованных при построении уравнений, k ■— число аналогов, использованных для построения от­

дельных уравнений. В рассматриваемом случае число аналогов

Следовательно, число уравнений с одним аналогом равно С*= 8, с двумя аналогами — С28—28, с тремя аналогами — С| = 56, с че­ тырьмя аналогами — С*=70, с пятью — С^=56, с шестью — С®=

= 28 и семью аналогами — С^=8. Из построенных указанным об-

разом уравнений для непосредственного использования отбирались

k

те, у которых — —7=j2, т. е. уравнение регрессии признается надеж-

0,13

ным, если средняя квадратическая ошибка коэффициента рег­

рессии в 2 раза меньше абсолютной величины коэффициента рег­ рессии.

Если в каком-либо уравнении хотя бы в отношении одного ко-

эффициента регрессии имеет место

kj

то такое

уравнение

—J-< 2 ,

 

%

из этого

условия,

регрессии в расчетах не используется. Исходя

в рассматриваемом примере приведения годового стока к длитель­ ному периоду не прошло ни одно уравнение регрессии с четырьмя и более аналогами. Из 56 уравнений с тремя аналогами (4 пере­ менных) по этому признаку прошло лишь три уравнения; из 28 урав­ нений с двумя аналогами прошло восемь и, наконец, с одним анало­ гом прошли все восемь уравнений.

Приведем уравнения регрессии, удовлетворяющие

условию

ft, ct

при переменных соответствует

-^— ^

2

; в этих уравнениях индекс

номеру реки в табл. 6.3:

 

 

 

 

У= 1 ,36*7+0,49*5+

О.бЭх:, - 0,50,

(1)

 

 

у =0,28*7+0,88*2 -

0,28*8+ 0,51,

(2>

 

 

у = 0,71*2+0,53*6 —0,38*8+0,29,

(3)

 

 

у = 0 ,3 7 * ,+ 0 ,6 1 * з-0 ,72,

(4)

 

 

у=0,34*7+ 0 ,62*2+0,35,

(5)

 

 

у =0,46*7+0,50*з —0,56,

(б>

341

Соседние файлы в папке книги из ГПНТБ