
- •Методы биостатистики Описание данных: качественные, порядковые и количественные данные Шкалы измерения
- •Качественные данные. Шкала классификации (номинальная).
- •Порядковые данные. Шкала порядка.
- •Количественные данные. Шкала интервалов и шкала отношений.
- •Статистический анализ данных.
- •Числовые характеристики случайной величины
- •Законы распределения дискретных случайных величин
- •Биномиальное распределение (распределение Бернулли)
- •Распределение Пуассона
- •Законы распределения непрерывных случайных величин
- •Нормальный закон распределения (Гаусса)
- •Распределение
- •Распределение Стьюдента (Госсета)
- •Эмпирические законы распределения случайных величин
Статистический анализ данных.
Случайной называется
величина, которая в результате
эксперимента, который может быть повторен
при постоянных условиях большое
количество раз, может принимать значение
.
Дискретной случайной называется
величина, которая может принимать
конечное количество значений (например,
количество детей, которое родилось за
сутки). Непрерывной случайной называется
величина, которая может принимать любое
числовое значение в данном интервале
значений (например, масса тела и вес
новорожденных).
Закон распределения случайных величин – функциональная зависимость между значениями случайных величин и вероятностями, с которыми они принимают эти значения. Закон распределения может быть задан в виде таблицы, формулы или графика.
Функцией распределения F(x) случайной величины X называется вероятность того, что она примет значение меньшее, чем аргумент функции x:
F(x) = p{X < x}.
Ее называют интегральной функцией.
Проиллюстрируем с помощью наглядной геометрической интерпретации.
Для этого рассмотрим случайную величину как случайную точку Х на оси ОХ, которая в результате опыта может занять то или иное положение. Тогда функция распределения F(x) есть вероятность того, что случайная точка Х в результате опыта попадет левее точки х. Увеличиваем х, перемещая точку вправо по оси абсцисс очевидно, что при этом вероятность выполнения неравенства X < x убывать не может. При уменьшении х до –∞ событие X < x становится невозможным, т.е. F(–∞) = 0, при увеличении х до +∞ – достоверным, т.е. F(+∞) = 1.
Функция распределения используется при рассмотрении как дискретных, так и непрерывных случайных величин.
Случайная величина Х называется непрерывной, если ее функция распределения F(x) – непрерывная и дифференцируемая функция для всех значений аргумента.
Для непрерывной функции распределения F(x) вероятность любого отдельного значения случайной величины должна быть равна нулю, т.е. не должно быть скачков ни в одной точке. То есть при непрерывном распределении вероятностей вероятность попадания на сколь угодно малый участок отлична от нуля, тогда вероятность попадания в строго определенную точку в точности равна нулю.
Плотностью распределения (плотностью вероятности) f(x) непрерывной случайной величины X называется производная ее функции распределения
f(x)=F’(x)
а график плотности распределения называется кривой распределения. Пусть имеется точка x и прилегающий к ней отрезок dx. Вероятность попадания случайной величины X на этот интервал равна f(x)dx. Эта величина называется элементом вероятности. Вероятность попадания случайной величины X на произвольный участок [a, b] равна сумме элементов вероятности
на этом участке:
В геометрической
интерпретации
равна площади,
ограниченной
сверху кривой плотности распределения
f(x)
и участком [a,
b].
Числовые характеристики случайной величины
Закон распределения случайной величины является исчерпывающей характеристикой, которая полностью описывает случайную величину с вероятностной точки зрения. Однако во многих практических задачах нет надобности в таком полном описании и достаточно указать только отдельные числовые параметры, характеризующие существенные черты распределения. Такие числа называются числовыми характеристиками случайной величины.
Математическое ожидание характеризует среднее значение случайной величины и определяется по формулам:
Для дискретных
величин:
Для непрерывных
величин:
MX – оператор математического ожидания.
В качестве математического ожидания используется «среднее взвешенное значение», причем каждое из значений случайной величины учитывается с «весом», пропорциональным вероятности этого значения.
Физический смысл математического ожидания – среднее значение случайной величины, т.е. то значение, которое может быть использовано вместо случайной величины в приблизительных расчетах или оценках.
Дисперсия случайной величины характеризует степень рассеивания (разброса) значений случайной величины относительно ее математического ожидания и определяется по формулам:
Для дискретных
величин:
Для непрерывных
величин:
Дисперсия случайной величины имеет размерность квадрата случайной величины, поэтому для анализа диапазона значений величины Х дисперсия не совсем удобна. Этого недостатка лишено среднеквадратическое отклонение (СКО), размерность которого совпадает с размерностью случайной величины.
Среднеквадратическое отклонение случайной величины X характеризует ширину диапазона значений X и равно:
СКО измеряется в тех же физических единицах, что и случайная величина.
Правило 3σ. Практически все значения нормальной случайной величины находятся в интервале
[ mx – 3σx; mx + 3σx; ].
Математическое ожидание и дисперсия (или СКО) – наиболее часто применяемые характеристики случайной величины. Они характеризуют наиболее важные черты распределения: его положение и степень разбросанности значений. Для более подробного описания используются начальные и центральные моменты высших порядков. Кроме математического ожидания на практике часто применяются и другие характеристики положения распределения значений.