Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
синоптика.pdf
Скачиваний:
1056
Добавлен:
13.03.2016
Размер:
13.13 Mб
Скачать

17. Математическая статистика в синоптической метеорологии

6

ся на обширных пространствах земного шара. Но в любом случае требуется сопоставимость данных.

17.2. Определение свойств выборки

После того, как определён объём выборки, прежде, чем решать задачи анализа и, в последующем, прогноза условий погоды на основе имеющейся информации, необходима редакция данных (критический контроль), поскольку в них могут содержаться неточности, ошибки, опечатки. Редакция производится по отдельным переменным с использованием частотных таблиц и графиков (гистограмм), что позволяет локализовать грубые ошибки и выбросы. Для выявления ошибок, пропущенных при анализе одномерных гистограмм, можно использовать перекрестные двумерные гистограммы рассеяния и таблицы сопряженности признаков.

iЗадачи математической статистики состоят в том, чтобы на основании

знания некоторых свойств выборки сделать утверждение о свойствах генеральной совокупности в целом

Для этого используются приёмы вычисления выборочных статистических характеристик и их оценок, которые дают в сжатой форме информацию о случайной величине.

Пусть имеется некоторый массив данных метеорологической величины (выборка из генеральной совокупности).

Сначала необходимо упорядочить данные:

Путем определения, сколько раз встретится каждое значение в выборке – опре-

деление абсолютной частоты значений ni (0nin, ni=n – объём выборки),

Путем группирования данных по градациям, классам – определение абсолютной частоты класса (Pi=ni/n, 0Pi1, Pi=100%).

Если разделить абсолютную частоту каждого значения (класса) на общее число наблюдений (объём выборки), то получим относительную частоту числа наблюдений или вероятность данного значения метеорологической величины. Относительная частота может выражаться в процентах или в долях единицы.

Если относительную частоту данного класса (градации) отнести к его ширине, то получим нормированную относительную частоту класса или плотность распределе-

ния вероятности f(x).

Н.А. Дашко Курс лекций по синоптической метеорологии

17. Математическая статистика в синоптической метеорологии

7

Результаты обработки выборки могут быть представлены не только в табличном, но и в графическом виде. На графике вдоль оси X откладываются значения метеорологической величины, по оси Y – частоты их появления. Такие графики называются гистограммами. С помощью гистограмм можно обнаружить грубые ошибки в данных (выбросы). Следует отметить, что выбросы не всегда являются ошибкой в данных. Иногда проверка не позволяет исключить или исправить отмеченный выброс, поскольку он бывает связан с экстремальными значениями метеорологической величины, наблюдающимися 1 раз в большой период лет – 25, 50, 100 лет и более.

17.3. Законы распределения метеорологических величин

Исчерпывающей характеристикой случайной величины является её закон распределения. Зная закон распределения случайной величины, легко определить вероятность любого значения из заданного интервала.

iЗакон распределения – соотношение, устанавливающее связь между воз-

можными значениями метеорологической величины и соответствующими им вероятностями

Первое представление о распределении можно получить, анализируя гистограмму, поскольку гистограмма показывает эмпирическое (частотное) распределение метеорологической величины.

Эмпирический закон распределения в дальнейшем аппроксимируют (приближённо выражают) аналитически. При этом выбирают вид теоретических распределений, наилучшим образом отражающих сущность аппроксимируемого эмпирического распределения.

Распределение вероятностей полностью характеризует случайную величину. Но при решении ряда практических задач нет необходимости знать все возможные значения случайной величины и соответствующие им вероятности, а удобнее пользоваться некоторыми количественными показателями, которые давали бы в сжатой форме достаточную информацию о случайной величине. Основными из них являются матема-

тическое ожидание, дисперсия, асимметрия и эксцесс, мода и медиана.

Н.А. Дашко Курс лекций по синоптической метеорологии

17. Математическая статистика в синоптической метеорологии

8

17.3.1. Моменты распределения

Пусть X есть случайная величина, (x1, x2, …..., xn) – есть возможные значения случайной величины, (p1, p2, …..., pn) – соответствующие им вероятности. Тогда

γκ = i xκi pi , где k=1, 2, …..., n, называется κ-м начальным моментом, а число

µκ = i(xi − ξ)κ pi = κ-м центральным моментом случайной величины X, ξ = M(x)

центр распределения.

Особое значение в математической статистике имеют первый начальный момент

γ1, а также второй, третий и четвёртый центральные моменты µ2, µ3, µ4.

Первый начальный момент называется математическим ожиданием случайной величины и обычно обозначается как М(х):

γ1 = ξ = i xipi = M(x) .

iМатематическое ожидание определяет положение центра распределения

генеральной совокупности – т.е., некоторое среднее значение, около которого сосредоточены все возможные значения случайной величины

На практике, имея дело с ограниченными массивами данных, вместо математического ожидания используют выборочное среднее значение, т. е. приближённо при-

нимают M(x) x .

Второй центральный момент называется дисперсией случайной величины и служит мерой её рассеяния:

µ2 = D = i(xi − ξ)2pi

или для выборки:

µ2 = D = i(xi x)2pi .

iДисперсия характеризует разброс случайной величины около математи-

ческого ожидания.

Дисперсия имеет размерность квадрата размерности случайной величины, например, (°С)2, (гПа)2, (м/с)2 и т.д.

Поэтому, чтобы получить характеристику рассеяния с размерностью случайной величины (°С), (гПа), (м/с) и т.д., часто используют в качестве показателя рассеяния не

Н.А. Дашко Курс лекций по синоптической метеорологии