Эмпирическая функция распределения
Пусть известно статистическое распределение признака , т.е. построен вариационный ряд для выборки объема. Пусть–число вариант, приходящихся на интервал. Относительная частота событияравна.
Эмпирической функцией распределения (функцией распределения выборки) называется функция , определяющая для каждого значенияотносительную частоту события, т.е.. Из теоремы Бернулли следует, что относительная частота события, т.е., стремится по вероятности к вероятности этого события:для любого. Это означает, что функцииимало отличаются друг от друга при больших значениях.
Функция обладает всеми свойствами функции.:
1) , 2)– неубывающая функция, 3)при,при. Эмпирическая функция распределения приближенно представляет собой теоретическую функцию распределения.
В примере 1
.
Статистические оценки параметров распределения
Наиболее существенными параметрами распределения являются математическое ожидание и дисперсия распределения. Статистические оценки параметров распределения называются статистиками.
Статистической оценкой математического ожидания является среднее арифметическое или среднее выборочное
., (1)
где ,,. (2)
Свойства среднего арифметического
1)
Действительно, .
2) .
.
3) Сумма отклонений всех вариант от их среднего арифметического равна нулю:
4) Сумма квадратов отклонений вариант от их среднего арифметического меньше суммы квадратов их отклонений от любого другого числа
Доказательство
При выводе этого соотношения было учтено равенство =0 и неравенство.
Медиана или срединное значение – значение признака, для которого накопленная относительная частота равна 0.5. При наличии сгруппированных данных для отыскания медианы нужно определить интервал, для нижней границы которого значение накопленной относительной частоты меньше 0.5, а для верхней границы больше 0.5. Середина этого интервала принимается за медиану.
Мода – значение признака, соответствующее максимуму теоретической кривой. За моду принимают середину модального интервала – интервала с наибольшей частотой. Мода– абсцисса наивысшей точки полигона. Модальный интервал соответствует наивысшей ступени гистограммы.
Пример 1. –средняя оценка на экзамене. ,
Пример 2. . Модальный интервал[115;120].
.
Статистическая дисперсия
В качестве меры разброса вариант относительно среднего значения вводят статистическую дисперсию
. (3)
Вообще говоря, статистическую дисперсию нужно вводить как сумму квадратов отклонений вариант от математического ожидания случайной величины, т.е.
(4)
Но поскольку неизвестно, то в качестве статистической дисперсии используют определение (3). Однако при этом происходит занижение оценки дисперсии, т.е. статистическая дисперсия является смещенной оценкой дисперсии генеральной совокупности. Для исправления этой ошибки нужно в формуле (3) заменитьна. Поэтому для оценки дисперсии генеральной совокупности используютисправленную статистическую дисперсию
, (5)
которая является несмещенной оценкой дисперсии генеральной совокупности. Если велико, то формулы (3) и (5) дают практически один и тот же результат. В случаедля вычисления статистической дисперсии используют формулу (5).
Статистическое среднеквадратичное отклонение (СКВО)
(6)
Коэффициентом вариации признака называется
. (7)
Свойства статистической дисперсии и статистического СКВО.
1) для постоянной величины.
2) .
Доказательство.
.
3)
Доказательство
4) (8)
Доказательство.
Формулу (8) используют для практического вычисления дисперсии.
Пример2.
, .
Выборочная асимметрия и выборочный эксцесс определяются соотношениями
,