- •Часть 1. Первичный анализ данных
- •Глава 1. Основные понятия случайной величины
- •1.1. Классификация случайных величин
- •Понятие генеральной и выборочной совокупностей
- •1.3. Понятие о законе распределения случайной величины
- •1.4. Статистические ряды распределения
- •1.5. Основные этапы статистического анализа эмпирической информации
- •1.6. Общая характеристика океанологической информации
- •1.7. Общие сведения о временных рядах
1.4. Статистические ряды распределения
В общем случае любая выборка может быть упорядочена, т.е. расположена в возрастающем (начиная с минимального значения) или убывающем (начиная с максимального значения) порядке. Такая процедура называется ранжированием ряда, а сам ряд – ранжированным рядом. Если теперь этот ряд разбить на некоторое число интервалов (групп, градаций) и распределить отдельные значения по интервалам, то получим статистический ряд распределения. Другими словами, статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу образования такого ряда, различают атрибутивные и вариационные ряды распределения. Атрибутивными называют ряды распределения, построенные по качественным признакам. Вариационными называют ряды распределения, построенные по количественному признаку. Обычно вариационный ряд строится в порядке возрастания значений его членов и обозначается следующим образом:
х(1) , х(2) ,…,х(n).
Каждый член этой последовательности (х(i)) называется порядковой статистикой. Аппарат порядковых статистик широко используется при статистическом оценивании и проверке гипотез, непараметрическом анализе малых выборок и ряде других задач. Следует иметь в виду, что члены вариационного ряда в отличие от членов исходной выборки уже не являются взаимно независимыми (по причине своей предварительной упорядоченности). Соответственно их частные распределения уже не являются одинаковыми, описываемыми одним и тем же законом распределения, как для исходной выборки.
Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в данном ряду, т.е. конкретные значения варьирующего признака. Частоты - это численности отдельных вариантов или каждой группы вариационного ряда. Другими словами, это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет объем выборки. Частостями называют частоты, выраженные в долях единицы или в процентах к итогу. Поэтому сумма частостей равна 1 или 100 %.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды. Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, а интервальный ряд - по непрерывному признаку, который может принимать на числовой оси любые значения.
Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма. Полигон используется при изображении дискретного вариационного ряда. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения признака, а по оси ординат - частоты. Соединив эти точки прямыми линиями, получим полигон распределения.
Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются номера интервалов, а частоты изображаются прямоугольниками, опирающимися на соответствующие им интервалы. В результате получим гистограмму - график, представляющий распределение частот по интервалам вариационного ряда. Если середины интервалов соединить линией, то получим график плотности распределения, т.е. значения частот, приходящихся на единицу ширины интервала.
Довольно часто для изображения вариационных рядов используется кумулятивная кривая. При помощи кумуляты, т.е. кривой сумм, изображается ряд накопленных частот, который показывает, как быстро к 1 или 100 % приближается ряд распределения. Если на таком графике поменять местами оси ординат и абсцисс, то получим кривую, называемую огивой.