Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
синоптика.pdf
Скачиваний:
1051
Добавлен:
13.03.2016
Размер:
13.13 Mб
Скачать

17. Математическая статистика в синоптической метеорологии

26

Проверка полученных закономерностей на независимом и оперативном материале.

17.6.1. Выбор предикторов

Одним из главных вопросов статистического направления является вопрос о выборе предикторов для диагноза и прогноза того или иного метеорологического элемента или явления погоды.

Выбор предикторов – это сложный и трудоемкий процесс, основывающийся на качественно-физических заключениях и требующий знаний

Общих физических закономерностей развития атмосферных процессов;

Общих физических закономерностей формирования того или иного метеорологического элемента или явления погоды;

Возможной изменчивости метеорологических величин во времени и простран-

стве;

Возможных средних и крайних пределов значений метеорологических величин;

Точности измерений и случайных ошибок в измерении метеорологических ве-

личин;

Местных физико-географических и климатических особенностей района исследования и времени года.

Например, основой для прогноза скорости и направления ветра у поверхности Земли являются поля давления. Скорость ветра определяется действием нескольких сил

силы барического градиента, силы Кориолиса, силы трения, центробежной силы. Таким образом, при определении потенциальных предикторов при разработке

способа прогноза ветра в их число необходимо включить барический градиент, учесть кривизну изобар, условия шероховатости, широту места и т.д. Кроме того, при прогнозе необходимо принимать во внимание условия стратификации атмосферы, возможность обмена энергией с вышележащими слоями атмосферы, суточный ход и др.

Некоторые потенциальные предикторы можно учесть достаточно легко (барический градиент, учесть кривизну изобар, широту места и др.), другие (например, параметр шероховатости) – учесть практически невозможно, ввиду их значительной изменчивости в зависимости от характера подстилающей поверхности, сезона года, орографических неровностей и т.д.

Н.А. Дашко Курс лекций по синоптической метеорологии

17. Математическая статистика в синоптической метеорологии

27

Аналогично, при выборе предикторов для прогноза температуры воздуха – формирование термического режима происходит под влиянием многих факторов, основным из которых является солнечная радиация. В свою очередь, распределение солнечной радиации в большой степени определяется состоянием неба, а состояние неба зависит от особенностей атмосферной циркуляции.

При прогнозе температуры воздуха необходимо учесть термическую адвекцию (горизонтальный перенос), трансформацию воздушной массы, суточный ход, на высотах или в условиях горного рельефа – влияние вертикальных перемещений воздушных масс.

На первый взгляд, наиболее просто решается вопрос учёта термической адвек-

ции.

С другой стороны, при горизонтальном перемещении воздушной частицы на нее оказывает влияние множество факторов – скорость переноса, влияние окружающих воздушных масс, условия подстилающей поверхности, над которой движется воздух (тип подстилающей поверхности, условия увлажнения, условия растительного покрова, наличие водных пространств и др.). Таким образом, температура воздуха в начале траектории может существенно отличаться от температуры в конце пути.

Учёт трансформационных изменений воздушной массы непосредственно в пункте прогноза также сложен, поскольку воздух у поверхности Земли может нагреваться или охлаждаться путем молекулярного и турбулентного обмена с подстилающей поверхностью, а также путем поглощения тепла от Солнца, нагревания или охлаждения от Земной поверхности, теплообмена с вышележащими слоями атмосферы. Причём, важно учесть, происходит нагрев или охлаждение в спокойном или движущемся воздухе, при каком состоянии неба – наличие сплошной облачности может значительно уменьшить поступление солнечной радиации днем и уменьшить потери тепла при длинноволновом излучении ночью.

Учёт суточного хода, на первый взгляд, также не представляет затруднений: от восхода Солнца до местного полудня температура воздуха должна повышаться, а затем до следующего восхода – понижаться. Но на «нормальный» суточный ход метеорологических величин существенное влияние оказывают условия стратификации атмосферы, состояние неба (ясно, облачно и т.д.), условия подстилающей поверхности. Кроме того, нормальный суточный ход температуры воздуха, в виде простого колебания с максимумом около полудня и минимумом перед восходом Солнца, может существенно

Н.А. Дашко Курс лекций по синоптической метеорологии

17. Математическая статистика в синоптической метеорологии

28

нарушаться под влиянием перемещения воздушных масс, и в некоторых случаях оказывается даже противоположным «нормальному» (непериодические изменения). Редко, но всё же встречаются аномалии суточного хода с наступлением максимума в утренние часы и даже перед восходом Солнца. Например, для Владивостока такие нарушения наблюдаются в 5% и 2% случаев, соответственно.

Таким образом, формирование потенциального набора предикторов требует знаний условий формирования прогнозируемого объекта, возможностей их учёта, наличия архивных материалов.

Кроме того, необходимо знакомство с литературными источниками, позволяющими оценить различные подходы к прогнозированию той или иной метеорологической величины или явления погоды.

17.6.2. Формирование обучающей выборки

После того, как намечен список потенциальных предикторов, формируется первоначальная выборка метеорологических величин в соответствии с возможностями учёта того или иного влияющего фактора. При формировании выборок каждая ситуация может быть охарактеризована некоторым числом признаков, т.е., массивы формируются в виде синхронной временной последовательности матриц наблюдений:

Y

,

Y

, ...,

Y

 

t(1)

 

t( 2)

 

t(k )

 

 

 

 

 

 

X(1)t(1) , X(1) t( 2) , ... , X(1) t(k )

X(2) t(1) , X(2) t( 2) , ..., X(2) t(k )

 

 

 

 

 

 

 

...,

 

...,

 

..., ...

 

 

 

 

 

 

 

 

 

 

 

, ..., X(n)t(k )

X(n)t(1) , X(n) t( 2)

,

где Y(tj) – значение предиктанта в момент времени tj (j=1, ..., k), Xi(tj) – значение i-того (i=1, ..., n) признака (предиктора), характеризующего состояние объекта в момент вре-

мени tj (j=1, ..., k).

Например, содержанием матриц для прогноза ветра, являются ситуации, описы-

вающие состояние атмосферы в моменты времени tj:

 

 

 

Скорость ветра у земной поверхности Y(tj);

 

 

 

Градиент давления X(1)t(1) , X(1)t( 2) , ..., X(1)t(k )

у поверхности земли;

 

Градиент

геопотенциала

на

различных

уровнях

атмосферы

X(1)t(1) , X(1)t( 2) , ..., X(1)t(k ) – на АТ850,

X(2)t(1) , X(2)t( 2) , ..., X(2)t(k )

– на АТ700 и т.д.,

Н.А. Дашко Курс лекций по синоптической метеорологии

17. Математическая статистика в синоптической метеорологии

 

29

скорости

ветра

на

АТ850,

АТ700

X(3) t(1) , X(3) t( 2) , . . . , X(3) t(k ) ,

X(4) t(1) , X(4) t( 2) , .. . , X(4) t(k ) и др.

 

 

В качестве предикторов нередко используются переменные, полученные на основе асинхронных связей. Например, для прогноза температуры воздуха можно использовать величины температуры со сдвигом по времени (12 часов назад, сутки назад и т.п.), т.е., матрица формируется следующим образом

Y

 

,

 

Y

 

,

 

t(1)

 

 

t( 2)

 

Y

 

 

 

, Y

 

 

 

t12(1)

t12( 2)

Y

 

 

 

, Y

 

 

 

t24(1)

t

24( 2)

...,

 

 

 

...,

 

 

 

 

 

 

 

 

 

Y

τ(1)

,

Y

 

 

 

t

 

t−τ( 2)

где Yt(1) , Yt( 2) , . . . , Yt( k )

предиктант,

..., Yt(k )

,..., Yt12(k )

,..., Yt24(k )

..., ...

,..., Yt−τ(k )

например,

,

температура воздуха в 16 ч.,

Yt12(1) , Yt12( 2) , ..., Yt12(k ) , Yt24(1) , Yt24( 2) , ..., Yt24(k ) , Yt−τ(1) , Yt−τ( 2) , ..., Yt−τ(k ) – те же

величины температуры, но выступающие в роли предикторов, поскольку берутся со сдвигом от исходного значения времени, соответственно, на 12, 24, τ часов назад, где τ

– временной сдвиг. Такие связи называются авторокорреляционными.

Следующим шагом является формирование так называемой обучающей выбор-

ки на основе оценок связи предиктанта и предикторов.

Составляющие обучающей выборки используются в дальнейшем для построения уравнений регрессии между предиктантом и предикторами. По данным обучающей выборки необходимо построить зависимость, с помощью которой оптимальным образом можно восстановить значения Y по заданным значениям X, например вида

Y = α1 X1 + α2 X2 +. ..n Xn + C ,

где α1 , α2 , ...αn – коэффициенты, X1 , X 2 , . .. Xn – предикторы, Y – предиктант.

17.6.3. Корреляционный анализ

Выбор предикторов осуществляется на основе исследования связей между предиктором и объясняющими переменными (предикторами). Здесь широко используется парный корреляционный анализ. При корреляционном анализе изучается теснота связи между двумя случайными переменными – рассчитываются парные коэффициенты корреляции между предиктантом Y и предикторами Xi.

Н.А. Дашко Курс лекций по синоптической метеорологии

17. Математическая статистика в синоптической метеорологии

30

Для расчета используют коэффициенты корреляции Бравайса-Пирсона:

 

n

_

_

 

 

(x x)(y y)

 

r( X,Y) =

1

 

 

.

n

_

n

 

_

 

(x x)2

(y y)2

 

1

 

1

 

Значения коэффициента корреляции r изменяются в пределах от -1 до +1. При r=0 линейная связь отсутствует.

Квадрат коэффициента корреляции Бравайса-Пирсона задаёт так называемую меру обусловленности, показывая, какая часть значений X и Y коррелируют в одном и том же направлении.

Хотя коэффициенты корреляции можно вычислять для любой пары случайных величин, особенно полезно использовать его для гауссовских случайных величин, совместные распределения которых подчиняются нормальному закону.

17.6.4. Проверка гипотезы о значимости коэффициентов корреляции

Какую величину выборочного парного коэффициента корреляции следует считать достаточной для статистически обоснованного вывода о наличии корреляционной связи между исследуемыми переменными?

Проверка гипотезы о значимости коэффициента корреляции осуществляется на основе предположении о наличии двумерного нормального распределения случайных переменных

f (X, Y) = [2πσx σy

 

 

2 )]

1

 

 

1

 

 

 

 

 

 

 

 

(1 r( X,Y)

 

exp

 

 

(1 r( X,Y)

2 )

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

_

 

_

 

 

 

_

_

 

 

 

/ σ

 

 

 

 

 

(x x) / σ2

+ (y y) / σ2

2(x x)(y y)r

 

x

σ

 

 

 

 

x

 

y

 

 

 

 

 

 

( X,Y)

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Предположение о значимости коэффициента корреляции определяется с использованием статистики Стьюдента с k=n-2 степенями свободы:

t = r

(n 2 / (1 r

2 ) .

( X,Y)

 

( X,Y)

По уровню значимости α и числу степеней свободы k по таблицам распределе-

ния Стьюдента находится критическое значение статистики ts, удовлетворяющее условию

P( t ts ) = α ,

где Р – вероятность осуществления события.

Н.А. Дашко Курс лекций по синоптической метеорологии