
- •1.1. Определения и обозначения
- •3.1.2. Дискретные и непрерывные случайные величины
- •3.1.3. Общая характеристика законов распределения
- •3.1.4. Числовые характеристики случайных величин
- •3.1.6. Нормированная (стандартизованная) случайная величина
- •3.3. Математическая статистика в геоэкологических исследованиях
- •3.3.1. Основные задачи математической статистики
- •3.3.2 Генеральная совокупность и выборка
- •3.3. Статистические характеристики
3.1.4. Числовые характеристики случайных величин
Причины применения числовых характеристик:
Во многих случаях бывает вполне достаточно указать только отдельные параметры, характеризующие какие-либо существенные в данном случае черты распределения исследуемой случайной величины.
Законы распределения обычно задают в аналитической форме, для чего необходимы какие-то параметры, иначе числовые характеристики, отражающие те или иные стороны этого закона.
Числовые характеристики или параметры распределения случайной величины – характеристики, назначение которых — выразить в сжатой форме наиболее существенные особенности распределения.
В теории вероятностей и математической статистике используются характеристики, имеющие различное назначение и различные области применения. Большинство из них основано на понятии моментов распределения.
Моменты статистического распределения
Используются моменты двух видов: начальные, определяемые относительно нуля исследуемой величины, и центральные, определяемые относительно среднего значения этой величины.
Начальный момент s-гo порядка дискретной случайной величины X - сумма вида
(3.18)
где ζj — возможные значения X; pj — вероятность появления значения X, равного ζj, k – число возможных значений X;
Начальный момент s-гo порядка непрерывной случайной величины X - интеграл вида
(3.19)
где f(x) —плотность распределения X.
Первый начальный момент, представляющий собой сумму произведений всех возможных значений случайной величины на их вероятности, называется математическим ожиданием (mx). Для дискретных случайных величин
(3.20)
для непрерывных
(3.21)
Для определения центральных моментов необходимо ввести понятие центрированной случайной величины
,
(3.23)
представляющей из себя отклонения от математического ожидания
При анализе графиков центрирование аналогично переносу начала координат в среднюю, «центральную», точку, абсцисса которой равна тx. В гидрометеорологических расчетах центрированные величины часто называют отклонениями от среднего или от нормы.
Моменты центрированной случайной величины называются центральными моментами. Они аналогичны моментам относительно центра тяжести в механике.
Центральный момент порядка s случайной величины X –математическое ожидание (м. о.) s-й степени соответствующей центрированной случайной величины
(3.24)
или, согласно выражению (3.20), для дискретной случайной величины
(3.25)
и с учетом формулы (3.21) для непрерывной случайной величины
(3.26)
Второй центральный момент называется дисперсией.
Легко показать, что первый центральный момент равен нулю. Действительно
=
=
0,
Точно также можно показать, что нулевой центральный момент равен единице.
Для начальных и центральных моментов случайной величины характерны следующие соотношения:
μ0 = 1
μ1 = 0
,
(3.27)
.
Числовые характеристики распределения
Числовые характеристики, используемые в практике расчетов, разделяют на характеристики положения, показывающие расположение определенных характеристик распределения на числовой оси X, и характеристики рассеивания.
Из характеристик положения важнейшую роль во всех расчетах играет математическое ожидание mx. (Еще одно возможное обозначений M[X]). Кроме того, часто используются еще две характеристики положения: мода М и медиана Me.
Мода дискретной случайной величины – значение, имеющее наибольшую вероятность.
Мода непрерывной случайной величины – значение, имеющее наибольшую плотность вероятности
Мода определяется по многоугольнику или соответственно кривой распределения.
Если многоугольник или кривая распределения имеют более одного максимума (рис. 3.4.а), то распределение называется полимодальным. Иногда встречаются распределения, имеющие посредине не максимум, а минимум (рис 3.4.б). Такое распределение называется амодальным.
Рис3.4 Полимодальное распределение
дискретной (а) и непрерывной (б)
случайной величины.
Другая часто применяемая характеристика положения — медиана Me
Медиана случайной величины X – такое ее значение, для которого р(Х < Me) = р(Х > Me), т.е. вероятность значений X, больших и меньших Me, одинакова и, следовательно, равна 0,5.
Геометрически медиана —~ это абсцисса точки, в которой площадь, ограниченная кривой плотности вероятности, делится пополам. Обычно значение Me определяют по функции распределения или обеспеченности.
В общем случае математическое ожидание, мода и медиана не совпадают (рис. 3.5),
Другим классом числовых характеристик являются характеристики рассеивания: дисперсия, среднее квадратическое отклонение, коэффициент вариации, коэффициент асимметрии и реже эксцесс.
Дисперсия (см. выше) представляет собой второй центральный момент
(3.28)
.
Рис. 3.5 Соотношение между математическим ожиданием, медианой и модой для симметричного распределения (а), распределение с положительной (б) и отрицательной (в) асимметрией
Для непосредственного вычисления дисперсии служат следующие формулы: для непрерывных случайных величин
(3.29)
для дискретных случайных величин
(3.30)
Отсюда определение:
Дисперсия случайной величины X –математическое ожидание квадрата соответствующей центрированной величины.
Для характеристики рассеивания часто удобнее пользоваться величиной, размерность которой совпадает с размерностью случайной величины. Это дает возможность сопоставить рассеивание со значениями самих величин X. В качестве такой величины может служить среднее квадратическое отклонение или стандарт.
Среднее квадратическое отклонение или стандарт – корень квадратный из дисперсии.
(3.31)
Для описания заведомо положительных величин большое распространение получила безразмерная характеристика рассеивания — коэффициент вариации
(3.32)
Коэффициент вариации не зависит от среднего значения и может быть использован для сопоставления изменчивости различных процессов.
Для характеристики симметричности рассеивания значений случайной величины относительно математического ожидания применяется безразмерная величина — коэффициент асимметрии
(3.33)
В соответствии с этой формулой для симметричных распределений, когда каждому + х соответствует -х, кубы х при суммировании уничтожаются и Сs = 0. Асимметрия может быть положительной и отрицательной. Знак асимметрии зависит от соотношения числовых характеристик положения: моды и математического ожидания. Если тх > М, то Сs < 0— положительная асимметрия. Если тх < М — отрицательная асимметрия (см. рис. 3.5).
Примером распределений с положительной асимметрией могут служить ряды концентраций химических элементов в речной воде. Примером распределений с отрицательной асимметрией могут служить многие ряды максимальных уровней, особенно на участках рек с поймой. Причиной отрицательной асимметрии в данном случае является резкое возрастание ширины живого сечения при выходе воды на пойму.
Для характеристики крутости (островершинности или плоско-вершинности) распределения используется эксцесс, основанный на учете 4-го центрального момента:
(3.34)
Для нормального закона распределения Ех = 0.
В практических расчетах в формулах математического ожидания (3.20), дисперсии (3.30), среднего квадратического отклонения (3.31), коэффициента вариации(3.32), коэффициента асимметрии (3.33) вместо pj — вероятности появления значения X, равного ζj в N испытаниях – подставляется ее значение по формуле
Pj = m j /N, (3.35)
где mJ число появлений значений X, равных ζj в N испытаниях.
Легко показать, что в этом случае перечисленные формулы принимают следующий вид:
математическое ожидание
N
mx = ∑ xi / N, (3.36)
i=1
дисперсия
n
Dx = ∑ (xi- mx )2/ N, (3.37) i=1
среднее квадратическое отклонение
,
(3.38)
коэффициент вариации
,
(3.39)
коэффициент асимметрии
N
Сs = ∑ (xi- mx)3/N /x 3 . (3.40)
i=1