Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Methodical Documents ЗОВР / Методички / Климатология и метеорология / Обработка гидрометеоинформации

.pdf
Скачиваний:
59
Добавлен:
15.05.2015
Размер:
445.46 Кб
Скачать

Для задач оценки эмпирической связи двух характеристик со сдвигом во времени изучить взаимнокорреляционный анализ: способ расчета взаимнокорреляционной функции (ВКФ), ее свойства, место коэффициента корреляции в ВКФ, определение временного сдвига в эмпирической связи двух характеристик.

Изучить методы исследования периодичности исследуемого процесса: гармонический анализ и периодограмманализ.

Литература

[1] – гл.9; [3] –гл.1; [4] – гл.12, 13.

Вопросы для самопроверки

1.Привести общую схему исследования временной изменчивости.

2.Привести на графиках примеры временных рядов с трендом по мат. ожиданию (по дисперсии).

3.Сформулировать уравнения линейного и нелинейного тренда.

4.Что такое радиус корреляции? Как он определяется и что показывает?

5.Привести примеры АКФ для «белого шума», «красного шума», гармонического процесса.

6.Как определить по ВКФ какой процесс протекает с опережением и каково это опережение?

7.Сформулируйте основной принцип гармонического анализа.

Спектральный анализ

При изучении этого раздела обратить внимание на формулировку спектральной плотности, ее свойства, способы оценки ее значимости по статистическим критериям. Необходимо знать смысл спектральной плотности, а также ее вид для различных типов гидрометеорологических процессов («белый шум», «красный шум», гармонический процесс, наличие тренда и их сочетания, например, тренд плюс гармоника).

Далее нужно познакомиться с понятием частотной весовой функции. Кроме того, получить понятие о взаимной спектральной плотности и

когерентности.

Отдельно нужно рассмотреть задачи фильтрации временных рядов: типичные фильтры, применение фильтрации на разных этапах обработки временных рядов.

11

Литература

[1] – гл.10; [3] – гл.3, 4; [5] – гл.8, стр. 198-209.

Вопросы для самопроверки

1.Сформулируйте понятие и свойства спектральной плотности.

2.Как по спектру определить в исходном временном ряду наличие значимых периодичностей? Как определить их период?

3.Приведите пример спектра для одного из типов гидрометеорологических процессов.

4.Для чего рассчитывается взаимная спектральная плотность?

5.Что такое когерентность?

6.Для чего и как применяется фильтрация временных рядов?

Анализ пространственных полей

При изучении данного раздела необходимо уяснить основные понятия пространственного анализа: однородность, изотропность и эргодичность случайного поля.

Наиболее распространенной характеристикой полей является пространственная корреляционная функция, нужно знать как она рассчитывается и какой физический смысл имеет. Кроме того, некоторые задачи требуют пространственного осреднения пространственных полей (методы изолиний, квадратов, треугольников и полигонов).

Кроме этого, нужно обратить внимание на объективный анализ: его основные задачи и алгоритмы (методы взвешенного среднего и весовой анизотропной интерполяции, полиномиальной интерполяции, оптимальной интерполяции).

Литература

[3] – гл.2, стр.66-73; [7]

Вопросы для самопроверки

1.Дайте определение однородности, изотропности и эргодичности случайного поля.

2.Какой смысл имеет пространственная корреляционная функция?

3.Какими методами можно осреднять пространственные поля?

4.Назовите основные задачи объективного анализа.

12

КОНТРОЛЬНЫЕ РАБОТЫ

Общие указания

К выполнению контрольных работ следует приступить после тщательного изучения рекомендованных глав литературы. Для выполнения заданий полезны сведения о расчетных формулах по каждому из разделов дисциплины,

атакже большой объем справочных данных, которые можно найти в [8].

Врезультате самостоятельного изучения необходимо выполнить две контрольные работы. Первая контрольная работа состоит из 7 заданий, вторая

– из трех.

Ответы на вопросы контрольной работы должны быть сформулированы достаточно подробно, чтобы был ясен смысл излагаемого материала, подтвержденный, где это возможно, математическими формулами.

Расчетные задания можно выполнять как с использованием стандартных статистических пакетов (STATISTICA, SPSS, Мезозавр, EXCEL и др.) с выводом результатов на печать, так и вручную, с помощью калькулятора.

Все вычисления должны быть представлены в таблицах и рисунках, примеры которых приводятся в соответствующих контрольных работах. Остальные результаты и их анализ даются в произвольном виде.

ВПриложении 1 приводятся исходные данные о среднемесячной температуре поверхности в разных точках акватории Атлантического океана с 1957 по 1993 гг. Выбор из восемнадцати вариантов исходных данных производится на основании суммы двух последних номеров зачетной книжки. Например, последние цифры в зачетной книжке – ..38, следовательно, им соответствует вариант 11.

Вкаждый вариант исходных данных включены 3 временных ряда, Для выполнения контрольных работ нужно исследовать или все три ряда, или один из них, что указано в каждом конкретном задании.

ВПриложении 2 находятся необходимые таблицы теоретических распределений для проверки статистических гипотез. Кроме них можно воспользоваться подобными таблицами в [8].

13

КОНТРОЛЬНАЯ РАБОТА № 1

Одномерный статистический анализ температуры воды

Задание 1

Ответить на вопросы:

1. Нормальный закон распределения, его свойства и значение.

2. Коэффициент корреляции, коэффициент детерминации, корреляционное отношение: их связь и различие между ними.

3. Множественный коэффициент корреляции, его свойства.

Задание 2

Построить графики трех исходных рядов температуры воды (рисунок 1). Визуальный анализ графиков позволяет качественно оценить изменчивость рядов, наличие периодических колебаний и тренда.

 

13

 

 

 

октябрь

ноябрь

декабрь

С

12

 

 

 

 

 

о

 

 

 

,

11

 

 

воды

 

 

10

 

 

температура

 

 

9

 

 

8

 

 

7

 

 

 

 

 

 

6

 

 

1957 1960 1963 1966 1969 1972 1975 1978 1981 1984 1987 1990 1993

годы

Рисунок 1 – Временная изменчивость температуры поверхности океана в октябре, ноябре и декабре в точке 9 (55о с.ш. 30о з.д.).

14

Рассчитать основные параметры трех статистических рядов:

а) среднее арифметическое, характеризующее центр тяжести числового

ряда

x= 1n xi , i=1n

где n длина ряда; б) дисперсию

D = n11 n (xi x)2 ; i=1

в) стандартное отклонение

σ = D ;

г) коэффициент вариации

с =σ x .

Параметры D, σ и с характеризуют рассеивание ряда относительно центра тяжести числового ряда и отличаются друг от друга размерностью;

д) коэффициент асимметрии, показывающий степень асимметричности ряда относительно его центра

As =

1

 

n

(xi x)3 ;

nσ

3

 

 

i=1

 

е) коэффициент эксцесса, характеризующий крутость (островершинность и плосковершинность) эмпирической кривой распределения

 

1

 

4

 

 

Ex =

 

 

(xi x)

3 ;

 

4

nσ

 

 

 

 

 

 

 

 

 

 

ж) медиану—центральное значение ранжированного ряда, т. е. расположенного в порядке возрастания или убывания его членов. При четном числе членов ряда (N=2 т) за медиану можно условно принять среднее значение между центральными значениями ранжированного числового ряда, т.е.

Me = 12 (xm + xm+1 );

15

з) моду (или моды), представляющую наиболее вероятное (часто встречающееся) значение исходного ряда. Мода оценивается по эмпирической функции распределения (см. задание 3) как значение характеристики в центре интервала, для которого отмечается локальный максимум вероятности. Мода может быть одна, две или несколько. Соответственно, распределение называют одномодальным, двумодальным или многомодальным.

Пример расчетов приводится в таблице 1.

Таблица 1.

Основные статистистические параметры температуры поверхности океана в октябре, ноябре, декабре (1957-1993 гг.) в точке 9 (55о с.ш. 30о з.д.)

 

октябрь

ноябрь

декабрь

среднее

10.56

9.27

8.60

дисперсия

0.28

0.29

0.39

стандартное

0.53

0.54

0.62

отклонение

 

 

 

коэффициент

0.32

-0.28

-0.47

асимметрии

 

 

 

коэффициент

0.28

0.98

-0.09

эксцесса

 

 

 

моды

10.6

9.0

8.5; 9.4

медиана

10.5

9.3

8.6

Провести анализ полученных результатов: сравнить основные статистические параметры для трех месяцев, указать физический смысл полученных значений асимметрии, эксцесса, моды.

Задание 3

Построить эмпирическую функцию распределения температуры воды для одного из рядов:

1.Произвести ранжирование ряда по возрастанию;

2.Разбить ранжированный ряд на kmax интервалов (классов).

Для оценки числа интервалов можно воспользоваться следующей приближенной формулой kmax 5 lg n; размах интeрвала xk определить как

xk = (хтах– xmin)/ kmax .

3. Определить границы классов (C1, С2), (C2, C3),...,(Ckmax, Ckmax+1), где С2 = С1+ xk и т.д. Причем для минимального (xmin) и максимального (хтах)

членов выборки должно выполняться следующее условие x

min

c ,

x

max

с

k max+1

;

 

1

 

 

 

16

 

 

 

 

 

 

 

4.Рассчитать середину интервала xk .

5.Оценить частоту (повторяемость) тk как число членов выборки, попавших в каждый класс. Гистограмма распределения частоты представляет собой эмпирическую функцию распределения.

Пример вычислений приводится в таблице 2 и на рисунке 2.

Таблица 2.

Расчет эмпирической функции распределения и ее соответствия нормальному закону для температуры поверхности океана в октябре (1957-1993 гг.) в

точке 9 (55о с.ш. 30о з.д.)

Номер

 

 

 

 

 

 

 

2

 

ин-

интервалы

x

частота,

f( x , x ,σ)

nk

nk

 

( mk nk )

 

 

 

терва

 

k

mk

k

 

 

 

nk

 

 

 

 

 

 

 

 

ла

9.50-9.80

9.65

4

0.17

1.93

2

 

2.00

 

1

 

 

2

9.81-10.10

9.95

4

0.39

4.38

4

 

0.00

 

3

10.11-10.40

10.25

8

0.64

7.10

7

 

0.14

 

4

10.41-10.70

10.55

9

0.75

8.36

8

 

0.13

 

5

10.71-11.00

10.85

7

0.64

7.14

7

 

0.00

 

6

11.01-11.30

11.15

3

0.40

4.42

4

 

0.25

 

7

11.31-11.60

11.45

0

0.18

1.99

2

 

2.00

 

8

11.61-11.90

11.75

2

0.06

0.65

1

 

1.00

 

 

 

 

 

 

 

 

 

χ2 = 5.52

 

Задание 4

Проверка гипотезы соответствия эмпирического распределения нормальному закону на основе критерия согласия Пирсона χ2.

1. Рассчитать плотность вероятности нормального закона распределения f( xk , x ,σ) для каждого интервала по формуле:

f( xk , x ,σ)=

1

( xk x )2

 

2σ 2

,

σ 2π

e

 

 

 

 

 

где xk – середина интервала,

x и σ – среднее значение и стандартное

отклонение исходного ряда, соответственно.

17

 

10

 

 

 

 

 

 

ЭФР

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

НЗ

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

частота

6

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

9.65

9.95

10.25

10.55

10.85

11.15

11.45

11.75

 

 

 

температура воды, оС

 

 

Рисунок 2 – Эмпирическая функция распределения (ЭФР) и кривая нормального закона распределения (НЗ) температуры поверхности океана в декабре

(1957-1993 гг.) в точке 9 (55о с.ш. 30о з.д.)

2. Для каждого интервала перевести значения плотности вероятности нормального закона в значения соответствующих частот нормального закона:

nk’ = f( xk , x ,σ) · xk·N,

где xk – размах интервала; N – длина исходного ряда.

3.Частоты нормального закона nkокруглить до целых значений – nk .

4.Рассчитать эмпирический критерий χ2 по формуле:

kmax

nk )

2

 

χ2 =

( mk

 

,

 

n

 

i=1

k

 

 

где mk – частота эмпирической функции распределения в k-том интервале, kmax – количество интервалов, nk – частота нормального закона.

4. Проверить условие χ2 χтабл2 при числе степеней свободы ν = k–3 и уровне значимости α. Если это условие выполняется, то гипотеза о соответст-

18

вии эмпирического и теоретического распределений отвергается; расхождение между ними носит неслучайный характер. Следовательно на исследуемую характеристику влияют некоторые неслучайные факторы.

Примеры расчетов приведены в таблице 2 и на рисунке 2. Указание: значения α взять при двух уровнях значимости: 0.05; 0.10.

Задание 5

1. Оценить взаимосвязь первого (обозначим через х) и второго (обозначим через у) рядов температуры воды путем расчета коэффициента корреляции между ними

r = cov(x, y) =

(xi x)(yi y) .

σxσy

nσxσy

2. Определить значимость коэффициента корреляции r: а) вычислить стандартную случайную погрешность σr, как

σr =(1r 2 ) / n 1;

в) оценить значимость коэффициента корреляции. Для этого выдвинуть нулевую гипотезу H0: r = 0 , для проверки которой рассчитать критерий Стьюдента t*:

t* = r/σr

По статистическим таблицам определить tкр критерий Стьюдента при заданном уровне значимости (α=5%) и числе степеней свободы v=(n—1).

Если |t*|> tкр, то нулевая гипотеза отвергается, отклонение r от нуля носит неслучайный характер, и, следовательно, величина r значима.

Пример расчета представлен в таблице 3.

19

Таблица 3.

Модель линейной регрессии связи температуры воды в декабре и ноябре (1957-1983 гг.) в точке 9 (55о с.ш. 30о з.д.), ее параметры и оценка их значимости

Уравнение модели: ТПО12 = 0.80 ТПО11 + 1.22

Параметр ли-

 

 

Оценка значимости

 

Вывод

нейной регрес-

 

 

 

 

 

 

 

 

сии

 

 

 

 

 

 

 

r

 

0.69

σr

0.087

t*

7.91

tкр(0.05;36)

1.69

значимый

R2

 

0.48

 

 

 

 

 

 

 

a

 

0.80

σa

0.14

ta*

5.65

tкр(0.05;35)

1.69

значимый

b

 

1.21

σb

1.31

tb*

0.93

tкр(0.05;35)

1.69

незначимый

Dy)

 

6.66

 

 

F*

31.87

Fкр(0,05;1;35)

4.12

адекватна

Dε

 

0.21

 

 

 

 

 

 

 

 

 

 

σε

 

0.45

σy

0.62

0,67 σy

0.42

 

 

σε>0.67 σy

 

 

 

 

 

 

 

 

 

 

Модель среднего качества и требует дополнительного уточнения, т.к. несмотря на адекватность и значимость основного коэффициента регрессии, дисперсии, описываемой моделью (45 %) недостаточно, незначим свободный член уравнения регрессии и стандартная ошибка модели (0.45 оС) превышает допустимую (0.42 оС).

Задание 6

Рассчитать уравнение линейной регрессии

y=ax+b,

где a = r(σ y σx ) коэффициент регрессии, представляющий тангенс угла

наклона линии регрессии к оси абсцисс,

b = y ax свободный член, представляющий расстояние от начала координат до пересечения оси ординат уравнением регрессии.

1.Вычислить значения a и b;

2.Построить график связи статистических рядов x и у (рисунок 3). На графике провести уравнение регрессии у=ах+b;

3.Определить коэффициент детерминации R2=r2 , который показывает долю дисперсии исходного ряда, которая описывается моделью регрессии.

20