Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
синоптика.pdf
Скачиваний:
1052
Добавлен:
13.03.2016
Размер:
13.13 Mб
Скачать

17. Математическая статистика в синоптической метеорологии

31

При t ts предположение (гипотеза) об отсутствии корреляционной связи меж-

ду переменными X и Y отвергается. При достаточном объеме выборки значимыми коэффициентами парной корреляции считаются r 0.3.

В случае значимого коэффициента корреляции целесообразно построить доверительный интервал для истинного коэффициента корреляции Q(x,y). Но поскольку для этого необходимо знать закон распределения выборочного парного коэффициента корреляции r(x,y), для подбора функции принимается преобразование Фишера:

Z = thr( X,Y) , откуда истинное значение коэффициента корреляции Q(x,y) с доверитель-

ной вероятностью (1-q) заключено в пределах thZ1 Q(X, Y) thZ 2 , где thZ - гипер-

болический тангенс от аргумента Z, определяемый с помощью соотношения:

exp Z exp(Z) thZ = exp Z + exp(Z) .

Кроме того, рассчитывается вероятная ошибка коэффициента корреляции:

E[r( X,Y)] = ±0.67 1 r 2n( X,Y) = ±0.67σ[r( X,Y)] ,

где σ[r( X,Y)] – средняя ошибка коэффициента корреляции.

При r( X,Y) > 4E[r( X,Y)] или r( X,Y) > 3σ[r( X,Y)] коэффициент корреляции надежен и отображает искомую связь.

17.6.5. Отбор информативных предикторов

Важным моментом является отбор наиболее информативных предикторов, т.е.

переменных, имеющих наиболее высокие значимые связи с предиктором, которые затем могут быть включены в соответствующие линейные схемы прогноза.

В этой связи возникает вопрос анализа мультиколлинеарности, под которым понимается наличие тесных статистических связей между объясняющими переменными (предикторами). Включение таких переменных в схему прогноза одновременно затушевывает имеющиеся связи и приводит к неустойчивости вычислительных схем.

Явление мультиколлинеарности затрудняет решение регрессии, что требует либо исключения из схемы одного из взаимосвязанных предикторов, либо новых способов обработки и дополнительной информации. Например, если необходимо получить прогностическую схему из имеющейся совокупности наблюдений, обойти возникающие трудности можно, используя в качестве новых переменных некоторые линейные

Н.А. Дашко Курс лекций по синоптической метеорологии

17. Математическая статистика в синоптической метеорологии

32

комбинации исходных переменных, выбранные так, чтобы корреляции между ними были малы, либо вообще отсутствовали.

Таким образом, в линейные схемы прогноза должны включаться переменные, имеющие наиболее тесную связь с предиктором, и не имели связи между собой, либо эта связь должна быть незначимой.

17.7.Построение схем прогноза

спомощью регрессионного анализа

После исследования наличия или отсутствия связей между переменными, а также структуры этих связей выбиралась наилучшая аппроксимация зависимости Y=f(X), т.е. решались задачи прогноза (восстановления) основных метеорологических величин по значениям соответствующих объясняющих переменных (предикторов).

Величину Y можно аппроксимировать посредством построения уравнения регрессии, содержащего неизвестные параметры. Если построение зависимости ограничивается двумя переменными Y и X, то имеет место простая линейная регрессия:

Y = b0 + bX .

Если же в рассмотрение включаются более, чем два признака Y и X1, X2, ..., Xn, то регрессия множественная:

 

Y = b0 + b1 X1 + b 2 X2 +. ..+bn Xn ,

где b1,b2, ...,bn,

– неизвестные параметры (коэффициенты при предикторах

X1, X2, ..., Xn, ), b0

– ошибки аппроксимации Y посредством функции регрессии (сво-

бодный член).

Различают линейную и нелинейную регрессию.

В случае нормального распределения изучаемых величин используется линейная регрессия. Число данных точек обычно превосходит число неизвестных коэффици-

ентов b0, ,b1,b2, ...,bn, , поэтому для подбора коэффициентов может быть использован метод наименьших квадратов.

В основе метода наименьших квадратов лежит минимизация суммы квадратов отклонений исследуемых метеорологических величин. Для случая двух переменных коэффициенты b 1 и b 0 уравнение Y = b0 + b1 X решается следующим образом

Н.А. Дашко Курс лекций по синоптической метеорологии