Статистика
Часто можно услышать словосочетания: «статистика краж», «статистика убийств».
При этом под статистикой понимается совокупность данных.
Кроме этого нам известно, что статистика – это отрасль знаний.
В аналитической статистике как отрасли знаний статистика – это не только данные. Статистика – это какая-либо функция от выборочных данных.
Т.е. статистика – это и область знаний, и данные, и функция. Безусловно, неудобно, что одно и то же слово имеет разные значения, но так уж сложилось.
Статистикой, например, является выборочное среднее. А также выборочная дисперсия, выборочный коэффициент корреляции, которые будут рассмотрены позже.
Поскольку выборочные данные случайны, их различные наборы, подставленные в одно и то же выражение для статистики, каждый раз будут давать несколько отличающиеся результаты.
Поэтому статистика как функция является случайной величиной.
Её распределение, среднее и дисперсия отличаются от соответствующих характеристик выборочных данных, использованных при её вычислении.
Закон больших чисел для статистики
Статистика как случайная величина помимо среднего и дисперсии характеризуется законом или плотностью распределения.
При неограниченном увеличении объёма выборки закон или плотность распределения любой статистики всё более и более приближается к нормальному распределению. Сходство становится заметным при объёме выборки более 10. Практически приемлемое совпадение достигается при объёме выборки более 25.
8.4. ВЫБОРОЧНАЯ ДИСПЕРСИЯ
Выборочная дисперсия
Выборочная дисперсия – это оценка неизвестного значения дисперсии наблюдаемой в опыте случайной величины.
Вычисляется по формуле среднего арифметического, в которой выборочные значения заменены квадратами отклонений выборочных значений от выборочного среднего.
s2 = ( (x1 – )2 + (x2 – )2 + … + (xn – )2 ) / n = .
s2 – это принятое в статистике обозначение для величины, которую мы в теории вероятности обозначали как Dn(X).
Формула для выборочной дисперсии одинаково пригодна как для дискретных, так и для непрерывных случайных величин.
С ростом объёма выборки n возможное отклонение выборочной дисперсии s2 от оцениваемой неизвестной дисперсии случайной величины D(X) уменьшается.
Эта закономерность – проявление закона больших чисел.
Выборочное среднеквадратическое отклонение
Выборочное среднеквадратическое отклонение – это оценка неизвестного значения среднеквадратического отклонения (стандартного отклонения) наблюдаемой в опыте случайной величины.
Буквенное обозначение: s .
Вычисляется как квадратный корень из выборочной дисперсии.
Особенность дисперсии в том, что её единица измерения – это квадрат единицы измерения случайной величины.
Были рубли – будут рубли в квадрате. Были года – будут года в квадрате.
А среднеквадратическое отклонение измеряется в тех же самых единицах измерения, что и случайная величина. В этом удобство этого показателя рассеяния.