Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник по мат статистике.docx
Скачиваний:
32
Добавлен:
23.11.2019
Размер:
1.77 Mб
Скачать

Правила округления интервалов:

• Если интервал имеет один знак ДО запятой, то полученное значение округляется до десятых (0,88 = 0,9; 8,715 = 8,7)

• Если величина интервала имеет два знака ДО запятой, то полученное значение округляется до целых (11,11 = 11; 29,98 = 30)

• Если интервал трех, четырех и более значимое число, то интервал принимают кратным 50 или 100.

3.2.3.Классификация

От группировок следует отличать классификацию. Классификация является основой группировок.

Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Отличительной чертой классификации является то, что в основу ее кладется качественный признак.

Пример. Распределение предприятий региона по величине розничного товарооборота в текущем году.

Если заранее не задано число групп , то для определения количества групп можно использовать формулу Стерджесса. Величину интервала определяют по следующей формуле:

Результаты представим в табличной форме:

3.2.4.Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп.

Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

• Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.

• Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

Пример 1. Имеется группировка сотрудников двух управлений одного из банков по размеру месячной заработной платы.

Данные первой группировки сотрудников являются несопоставимыми, так как в приведенных группировках различные интервалы группировки и неодинаковое количество образованных групп.

Произведем вторичную группировку способом укрупнения интервалов:

При вторичной группировки способом долевой перегруппировки устанавливаем новые интервалы распределения работников по размеру месячной заработной платы, при этом за каждым интервалом закрепляем определенную долю единиц совокупности

Глава 3.3. Ряды распределения.

Очевидно, что основой любой группировки является ряд распределения признака. Он состоит из двух элементов: вариант и частот.

Вариантами являются отдельные значения группировочного признака, а частотами - числа, которые показывают, сколько раз повторяются отдельные значения вариант. Вместо частоты может быть использована частость (доля или процент от общей численности единиц). Накопленную частоту (частость) называют куммулятивной.

В зависимости от природы группировочного признака ряды распределения разделяют на атрибутивные и вариационные. Вариационные ряды разделяют на дискретные и интервальные.

По дискретному признаку, количество значений которого ограничено, образуется дискретный ряд распределения (например, группировка семей по размерам). По непрерывному признаку, который изменяется в широких пределах, строят интервальный ряд распределения.

В интервальных рядах частоты относятся не к отдельным значениям признака, а ко всему интервалу.

Для графического изображения дискретного ряда применяют полигон распределения.

Для его построения на оси абсцисс отмечают точки, соответствующие величине вариантов значений признака, из них восстанавливаются перпендикуляры, длина которых соответствует частоте (частоты) этих вариантов по принятому масштабу на оси ординат. Вершины перпендикуляров в последовательном порядке соединяются отрезками прямых. Для замыкания полигона крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе от Хтах и Xmin.

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Ниже построен Полигон по данным таблицы с результатами микропереписи населения России в1994г.

Задача 1.

3. Для построения полигона распределения по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты (в данном случае,тарифные разряды), а по оси ординат — частоты (в данном случае, число работников),см.рис.5..

Рис.5.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.

Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Для графического изображения интервальных вариационных рядов применяется гистограмма.

Она строится так, что на оси абсцисс откладываются равные отрез/си, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частостям) интервала.

Задача 2.

Условие: Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.

Задача: Построить интервальный вариационный ряд с равными интервалами.

Решение:

• Исходная совокупность состоит из 20 единиц (N = 20).

• По формуле Стерджесса определим необходимое количество используемых групп:

n = 1+3,322*lg20 = 5

• Вычислим величину равного интервала:

i = (152 — 2) /5 = 30 (тыс.руб)

• Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.

• Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Ниже приведена таблица распределения населения России в 1997 г. по возрастным группам.

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис.6.

Задача 3.

Условие: Приводится распределение 30 работников фирмы по размеру месячной заработной платы.

Задача: Изобразить интервальный вариационный ряд графически в виде гистограммы .

Решение:

• Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.

• Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам вариационного ряда.

Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.

• Построим гистограмму:

Рис.7.

Ряд распределения с неравными интервалами также изображается в виде гистограммы, но ее построение основывается на плотности распределения. Плотность распределения - это количество элементов совокупности, которое приходится на единицу ширины интервала группировочного признака.

Например, по количеству рабочих мест 400 предприятий находится в интервале от 800 до 1000. Частное от деления 400:(1000-800)=2 является плотностью распределения. При построении гистограммы для ряда с неравными интервалами следует по оси ординат наносить показатели плотности интервалов.

Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить отрезками прямых. Две крайние точки прямоугольников замыкают по оси абсцисс на середины интервалов, в которых частоты (частости) равны нулю.

Увеличение числа групп интервального ряда приводит к уменьшению величины интервала. При этом число сторон полигона распределения будет расти, и ломаная линия будет иметь тенденцию превращаться в плавную кривую, которую называют кривой распределения.

В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята). Для ее построения надо рассчитать накопленные частоты или частости. Накопленные частоты показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение, и определяются последовательным суммированием частот интервалов.

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 8).

Рис.8.

Вернемся к задаче 2 и рассчитаем накопленные частоты:

Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе: