Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Анализ данных и инструментальные методы статист...docx
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
222.81 Кб
Скачать

11. Вариационные ряды, их виды, принципы построения и особенности применения. Графическое изображение вариационных рядов.

Вариационные ряды   строятся   на   основе    количественного группировочного  признака.  Вариационные ряды состоят из двух элементов: вариант и частот.    -  Варианта -  это  отдельное  значение  варьируемого  признака, которое он принимает в ряду распределения.   Они могут быть положительными и отрицательными, абсолютными и относительными.   Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты,  выраженные в долях  единицы  или  в процентах к итогу,  называются частостями. Сумма частот называется объемом совокупности и определяет число элементов всей совокупности.  -Частости – это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.  Вариационные ряды в зависимости от характера вариации подразделяются на дискретные   (прерывные)   и   интервальные (непрерывные).

Дискретные ряды  распределения  основаны   на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье).      Интервальные ряды  распределения  базируются   на непрерывно изменяющемся  значении признака,  принимающем любые (в том числе и дробные) количественные выражения,  т.е. значение признаков таких рядах задается в виде интервала. При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке. Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака  , а затем подсчитывается частота повторения варианта  . Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.  Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности.

Методология построения вариационного ряда распределения включает следующие этапы:

1. На основании неупорядоченных первичных данных строится ранжированный ряд единиц совокупности по возрастанию (реже убыванию) значения варианты, в котором указываются значение группировочного признака х и порядковые номера единиц совокупности, обладающих этим значением.

2. Исходя из численности единиц совокупности по номограмме Стерджесса определяется число групп.

3. Рассчитывается ширина интервала.

4. Определяется количество единиц в каждой группе по ранжированному ряду.

5. Стоится ряд распределения.

6. Дается графическое изображение построенного вариационного ряда.

7. Анализируются данные ряда распределения и его графического представления.

Графическое представление рядов широко используется статистикой для выявления характера распределения единиц совокупности по значениям группировочного признака. Оно представлено полигонами, гистограммами, кумулятами и огивами распределения.

Полигон строится по дискретному вариационному ряду и является графиком, абсцисса любой точки которого указывает значения варианты х, а ордината - число (или доля) единиц совокупности f.

Для интервального вариационного ряда графической иллюстрацией служит гистограмма распределения, представленная столбиками с основаниями, равными ширине интервалов, и высотой, соответствующей f (от греческого слова «гистос» - ткань, строение). По сути гистограмма - одна из разновидностей столбиковых диаграмм. Соединив середины верхних граней столбиков, получим полигон распределения аналогично дискретному ряду (от греческого слова - многоугольник).

Для любого вариационного ряда можно построить график, называемый кумулятой. По горизонтальной оси откладываются значения варианты х, по вертикальной - накопленные частоты ?f. Кумулята наглядно отражает, сколько единиц имеют данное значение х и ниже. Сущность кумуляты заключается в положении: не меньше ?f единиц имеют такое-то значение х.

Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, получим огиву, ключевой фразой анализа которой является: не больше чем ?f единиц имеет такое-то значение х.

Графическое изображение зависимости между величинами дает возможность представить эту зависимость наглядно. Графики могут служить основой для открытия новых свойств, соотношений и закономерностей.

     Наиболее употребительными графиками для изображения вариационных рядов, т. е. соотношений между значениями признака и соответствующими частотами или относительными частотами, являются полигон, гистограмма и кумулята.

     Полигон чаще всего используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс в произвольно выбранном масштабе откладывают значения аргумента, т. е. варианты, а на оси ординат также в произвольно выбранном масштабе - значения частот или относительных частот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность, и чтобы рисунок имел желательный размер. Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Крайнюю "левую" точку соединяют с точкой оси абсцисс, абсцисса которой находится слева от рассматриваемой точки на таком же расстоянии, как абсцисса ближайшей справа точки. Аналогично крайнюю "правую" точку также соединяют с точкой оси абсцисс.

     Кумулята служит для графического изображения кумулятивного вариационного ряда. Для ее построения на оси абсцисс откладывают значения аргумента, а на оси ординат - накопленные частоты или накопленные относительные частоты. Масштаб на каждой оси выбирают произвольно. Далее строят точки, абсциссы которых равны вариантам (в случае дискретных рядов) или верхним границам интервалов (в случае интервальных рядов), а ординаты - соответствующим частотам (накопленным частотам). Эти точки соединяют отрезками прямой. Полученная ломаная и является кумулятой.

Гистограмму используют для изображения интервальных рядов. Для построения гистограммы по данным вариационного ряда с равными интервалами, как и для построения полигона, на оси абсцисс откладывают значения аргумента, а на оси ординат - значения частот или относительных частот. Далее строят прямоугольники, основаниями которых служат отрезки оси абсцисс, длины которых равны длинам интервалов, а высотами - отрезки, длины которых пропорциональны частотам или относительным частотам соответствующих интервалов.

     В результате получают ступенчатую фигуру в виде сдвинутых друг к другу прямоугольников, площади которых пропорциональны частотам (или относительным частотам).

     Если интервалы неравные, то на оси ординат следует откладывать в произвольно выбранном масштабе значения плотности распределения (абсолютной или относительной). Таким образом, высоты прямоугольников, которые мы строим, должны равняться плотностям соответствующих интервалов.

     При графическом изображении вариационного ряда с помощью гистограммы плотность изображается так, как если бы она оставалась постоянной внутри каждого интервала. На самом деле, как правило, это не так. Если построить распределение по частям интервалов, то можно убедиться в том, что плотность распределения на различных участках интервала не остается постоянной. Плотность, полученная ранее, предствляла лишь некоторую среднюю плотность. Итак, гистограмма изображает не фактическое изменение плотности распределения, а лишь средние плотности распределения на каждом интервале.

     Если построена гистограмма интервального распределения, то полигон того же распределения можно получить, если соединить прямолинейными отрезками середины верхних оснований прямоугольников.