Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Shpora_stat.doc
Скачиваний:
10
Добавлен:
24.04.2019
Размер:
607.23 Кб
Скачать

18 Сложная группировка.

Сложная группировка бывает или комбинационная, или многомерная.Комбинационная группировка выполняется последовательно: группы, выделенные по одному признаку, затем выделяются в подгруппы по другому признаку, которые, в свою очередь, могут выделяться по следующему другому признаку. В этом случае число групп будет равно произведению числа выделенных групп на число группировочных признаков. Процедура определения оптимального числа групп основана на применении формулы Стерджесса

(3.1)

где n - число групп; N - число единиц совокупности.

Из формулы видно, что выбор числа групп зависит от объема совокупности. Если групп оказывается много и они включают малое число единиц, то групповые показатели могут стать ненадежными. Поэтому альтернативой комбинационной группировке является многомерная группировка, которая осуществляется по комплексу признаков одновременно. Ее применение требует использования электронной вычислительной техники. С помощью специально разработанных электронных программ формируются однородные группы на основании близости по всему комплексу признаков.

19 Группировка по количественному признаку: количество интервалов, величина интервалов.

При построении группировок по количественному признаку число групп зависит от численности совокупности и степени вариации рассматриваемого признака.

При небольшом объеме совокупности не следует образовывать большое количество групп, так как группы могут быть малочисленными или даже пустыми.

При определении числа групп нужно учитывать степень колеблемости группировочного признака (чем она больше, тем больше надо образовывать групп).

На практике для определения оптимального числа групп часто используют формулу Стерджеса:

n = 1+3.322 lgN ,

где n — количество групп, N- численность всей совокупности.

Недостаток этой формулы состоит в том, что ее применение дает хорошие результаты, если совокупность из большого числа единиц и распределение единиц совокупности по признаку, положенному в основание группировки, близко к нормальному.

После определения числа групп решается задача определения интервалов группировки.

Интервал группировки — это интервал значений варьирующего признака, лежащего в пределах одной группы.

Каждый интервал имеет свою ширину, верхнюю и нижнюю границу или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в данном интервале, верхней границей - наибольшее. Ширина интервала представляет собой разность между верхней и нижней границами. Интервалы группировки могут быть равными и неравными. Если вариация признака проявляется в сравнительно узких границах и распределение носит характер близкий к равномерному, то строят группировку с равными интервалами. Величина интервала определяется по формуле:

h = R/n ,

20 Ряд распределения: дискретный, интервальный .

Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.

Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.

Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.

Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).

Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi, а сумма частот, равная объему исследуемой совокупности, обозначается

где k - число вариантов значений признака

Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.

Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:

При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:

где R = xmax- xmin; m = 1 + 3,322 lgn (формула Стерджесса); n - общее число единиц совокупности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]