
- •Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
- •Числовые характеристика рассеивания характеризуют степень и форму рассеивания возможных значений X относительно математического ожидания.
- •Графическое отображение эмпирической функции обеспеченности называется эмпирической кривой обеспеченности.
- •План выполнения задания
- •Примеры расчетов и построений
- •3.2. Расчет координат эмпирической функции обеспеченности и функции распределения по первому и второму ряду.
- •Вопросы для самопроверки
Задание №1
Разведочный (предварительный) анализ данных
Общее описание
Цель работы
Ознакомиться с основными статистическими понятиями, используемыми в гидрологии, и получить общую подготовку для выполнения последующих работ.
Основные задачи
1. На основе элементарных методов преобразования исходных данных и их наглядного представления произвести анализ рассматриваемых процессов по имеющимся рядам наблюдений;
2. Выявить, в первом приближении, особенности данных и внутренние закономерности рассматриваемых процессов, представленных этими данными.
Исходные данные
- два временных ряда данных о гидрологических процессах за совместный период наблюдений, продолжительность периода совместных наблюдений не менее 40 лет.
Содержание
- построить графики изменений рассматриваемых процессов во времени;
- рассчитать и
построить гистограммы, эмпирические
функции распределения и обеспеченности;
- рассчитать оценки
основных числовых характеристик исходных
рядов методом моментов: моды (
), медианы (
),
математического ожидания (
x),
дисперсии (
x),
среднего квадратического отклонения
(
x),
коэффициента вариации (
v),
коэффициента асимметрии (
s)
- оценить погрешности рассчитанных оценок;
- дать анализ полученных характеристик распределения и оценить особенности каждого из рассматриваемых процессов.
Теоретические положения
При гидрологических обобщениях используются различные методы статистического анализа. Выбор этих методов и способов их использования обычно производится на основе предварительного (разведочного) анализа исходных данных, который в свою очередь основывается на простейших формах описания и представления ряда значений случайной величины
В результате этого анализа необходимо ответить на ряд вопросов, а именно:
Вид распределения – одномодальное или полимодальное, симметричное или асимметричное
Вероятность возможных значений рассматриваемого процесса.
Пределы изменения и амплитуда колебаний наблюденных значений рассматриваемого процесса.
Положение центра распределения
Рассеивание возможных значений ряда относительно центра распределения
Возможная погрешность оценки основных числовых характеристик распределения по исходным рядам наблюдений.
Естественно, что на этапе разведочного анализа применяются простейшие методы статистического анализа, учитывающие в той или иной степени выборочность исходных данных. При этом последовательность значений рассматриваемого процесса (ряд наблюдений) представляется обычно в качестве последовательности значений случайной величины. В соответствии с этим для описания гидрологических процессов применяются законы распределения, которые являются наиболее общей и полной формой описания случайной величины.
Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
В гидрологических исследованиях в нашей стране чаще всего используются закон распределения Пирсона Ш–го типа и закон распределения Крицкого-Менкеля (трехпараметрическое гамма-распределение) [ ].
Закон распределения может быть задан в аналитической, табличной и графической форме.
Простейшей формой задания закона распределения дискретной случайной величины является ряд распределения или иначе таблица, в первой строке которой перечислены возможные значения случайной величины X – ζi (I = 1, 2, … , k), где k – число возможных значений случайной величины, а во второй строке - соответствующие им вероятности – pi (табл. 1.1).
Таблица 1.1 - Ряд распределения дискретной случайной величины
ζi |
ζ 1 |
ζ 2 |
ζ 3 |
. . . |
ζ k |
pi |
p1 |
p2 |
p3 |
. . . |
pk |
Более наглядной формой представления закона распределения случайной величины является графическое изображение, при этом по оси абсцисс откладываются возможные значения случайной величины ( ζi ), а по оси ординат – вероятности этих значений (pi). Обычно точки в поле графика соединяются отрезками прямых линий. Полученная фигура (рис.1.1) называется многоугольником или полигоном распределения.
Рис.1.1. Многоугольник распределения
Ряд и многоугольник распределения являются исчерпывающими и достаточно наглядными характеристиками. Однако эти характеристики существуют только для дискретных случайных величин.
Более общей характеристикой закона распределения, пригодной как для дискретных, так и для непрерывных случайных величин, является функция распределения.
Функцией распределения случайной величины X называется функция вида
F(x)= p(X<x), (1.1)
где x – заданное значение случайной величины, X – возможные значения случайной величины.
Функция распределения показывает вероятность получить в результате испытания значения X меньше заданного значения – x.
В гидрологических расчетах обычно вместо функции распределения используется функция обеспеченности:
P(x) = 1 – F(x) = p(X≥ x). (1.2)
Функция обеспеченности показывает вероятность получить в результате испытания значение X, большее или равное заданному значению – x.
Во многих случаях бывает вполне достаточно указать только отдельные параметры, характеризующие какие либо существенные стороны закона распределения исследуемой случайной величины.
Характеристики, назначение которых - выразить в сжатой форме наиболее существенные особенности распределения, называются числовыми характеристиками или параметрами распределения случайной величины.
Обычно числовые характеристики разделяются на две группы: характеристики положения и рассеивания.
Числовые характеристики положения – показывают расположение определенных характеристик распределения на оси абсцисс.
Среди числовых характеристик положения важнейшую роль играют математическое ожидание случайной величины (мx или mx), мода (M), медиана (Me).
Математическое ожидание (центр распределения) определяется по последовательности значений случайной величины X по формуле
N
mx = ∑ xi / N, (1.3)
i=1
где N – объем генеральной совокупности.
Мода – наиболее вероятное значение случайной величины. Определение моды дискретной случайной величины производится по многоугольнику распределения, как значение имеющее наибольшую вероятность. Определение моды непрерывной случайной величины производится по кривой распределения – как значение X, имеющее наибольшую плотность распределения.
Медиана – значение случайной величины, для которого
p(X< Me) = p(X> Me), (1.4)
т.е. вероятность значений X больших и меньших Me одинакова и равна 0,5. Медиана определяется по графику функции распределения или обеспеченности как значение X имеющее обеспеченность, равную 50%.