- •Качественные данные. Шкала классификации (номинальная).
- •Порядковые данные. Шкала порядка.
- •Количественные данные. Шкала интервалов и шкала отношений.
- •Статистический анализ данных.
- •Функция распределения
- •Законы распределения дискретных случайных величин
- •Биномиальное распределение (распределение Бернулли)
- •Распределение Пуассона
- •Законы распределения непрерывных случайных величин
- •Нормальный закон распределения (Гаусса)
- •Распределение
- •Распределение Стьюдента (Госсета)
- •Эмпирические законы распределения случайных величин
- •Практические задания.
-
Статистический анализ данных.
Функция распределения
Функцией распределения F(x) случайной величины X называется вероятность того, что она примет значение меньшее, чем аргумент функции x:
F(x) = p{X < x}. (4.1)
Проиллюстрируем эти свойства с помощью наглядной геометрической интерпретации.
Для этого рассмотрим случайную величину как случайную точку Х на оси ОХ, которая в результате опыта может занять то или иное положение. Тогда функция распределения F(x) есть вероятность того, что случайная точка Х в результате опыта попадет левее точки х. Увеличиваем х, перемещая точку вправо по оси
абсцисс очевидно, что при этом вероятность выполнения неравенства X < x
убывать не может (свойство 3). При уменьшении х до –∞ событие X < x
становится невозможным, т.е. F(–∞) = 0, при увеличении х до +∞ –
достоверным, т.е. F(+∞) = 1.
Функция распределения используется при рассмотрении как дискретных, так и непрерывных случайных величин.
Плотность распределения
Случайная величина Х называется непрерывной, если ее функция распределения F(x) – непрерывная и дифференцируемая функция для всех значений аргумента.
Для непрерывной функции распределения F(x) вероятность любого отдельного значения случайной величины должна быть равна нулю, т.е. Не должно быть скачков ни в одной точке. Такие события – возможные, но с нулевой вероятностью – появляются только при рассмотрении опытов, не сводящихся к схеме случаев. Это аналогично телу, имеющему определенную массу, но ни одна из точек внутри тела конечной массой не обладает. Малый объем обладает конечной массой, но она приближается к нулю по мере уменьшения объема и в пределе равна нулю для точки. То есть при непрерывном распределении вероятностей вероятность попадания на сколь угодно малый участок отлична от нуля, тогда вероятность попадания в строго определенную точку в точности равна нулю.
Вероятность попадания непрерывной случайной величины X на участок от x до x + Δx равна приращению функции распределения на этом участке:
p{x ≤ X <x + Δx} = F(x + Δx) – F(x). Тогда плотность вероятности на этом участке равна
Переходя к пределу при Δx → 0, получим плотность вероятности в точке x
===
Полученная функция является одной из форм закона распределения непрерывных случайных величин.
Плотностью распределения (плотностью вероятности ) f(x) непрерывной случайной величины X называется производная ее функции распределения
а график плотности распределения называется кривой распределения. Пусть имеется точка x и прилегающий к ней отрезок dx. Вероятность попадания случайной величины X на этот интервал равна f(x)dx. Эта величина называется элементом вероятности. Вероятность попадания случайной величины X на произвольный участок [a, b] равна сумме элементов вероятности
на этом участке:
В геометрической интерпретации равна площади, ограниченной сверху кривой плотности распределения f(x) и участком [a, b].
Соотношение (4.7) позволяет выразить функцию распределения F(x) случайной величины X через ее плотность:
Числовые характеристики случайной величины
Закон распределения случайной величины является исчерпывающей характеристикой, которая полностью описывает случайную величину с вероятностной точки зрения. Однако во многих практических задачах нет надобности в таком полном описании и достаточно указать только отдельные числовые параметры, характеризующие существенные черты распределения. Такие числа называются числовыми характеристиками случайной величины.
Математическое ожидание характеризует среднее значение случайной величины и определяется по формулам:
M[X] – оператор математического ожидания.
В качестве математического ожидания используется «среднее взвешенное значение», причем каждое из значений случайной величины учитывается с «весом», пропорциональным вероятности этого значения.
Физический смысл математического ожидания – среднее значение случайной величины, т.е. то значение, которое может быть использовано вместо случайной величины в приблизительных расчетах или оценках.
Дисперсия случайной величины характеризует степень рассеивания (разброса) значений случайной величины относительно ее математического ожидания и определяется по формулам:
Дисперсия случайной величины имеет размерность квадрата случайной величины, поэтому для анализа диапазона значений величины Х дисперсия не совсем удобна. Этого недостатка лишено среднее квадратическое отклонение (СКО), размерность которого совпадает с размерностью случайной величины.
Среднее квадратическое отклонение случайной величины X характеризует ширину диапазона значений X и равно:
СКО измеряется в тех же физических единицах, что и случайная величина.
Правило 3σ. Практически все значения случайной величины находятся в интервале
[ mx – 3σx; mx + 3σx; ].
Математическое ожидание и дисперсия (или СКО) – наиболее часто применяемые характеристики случайной величины. Они характеризуют наиболее важные черты распределения: его положение и степень разбросанности значений. Для более подробного описания используются начальные и центральные моменты высших порядков. Кроме математического ожидания на практике часто применяются и другие характеристики положения распределения значений.