1 задача
.docxМИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное
учреждение высшего профессионального образования
«Государственный университет по землеустройству»
Кафедра землепользования и кадастра
Расчётно-графическая работа по дисциплине «Методы статистической обработки информации»
Статистическая обработка кадастровой информации
Вариант 27
Выполнил:
Проверила:
Москва 2020
Тема 1 «Статистическая сводка и группировка»
Задача 1. Группировка по одному признаку, построение и анализ групповой таблицы
В результате статистического наблюдения получены значения признаков хозяйственной деятельности 30 сельскохозяйственных коммерческих организаций подзоны области, представленных в таблице 1.
Табл.1 Условия и результаты хозяйственной деятельности совокупности сельскохозяйственных организаций
N/ N
|
Выручка от реализации с.х. продукции, тыс. руб.
|
С.х. угодья, га
|
Число работников чел.
|
Полная себестоимость реализованной с.х. продукции, тыс.руб.
|
Производственные затраты в сельском хозяйстве, тыс.руб.
|
Энергоресурсы, л.с. |
Балл качества почв |
1 |
36054 |
5229 |
157 |
34215 |
42899 |
23897 |
71 |
2 |
28975 |
2677 |
156 |
32374 |
39254 |
13920 |
91 |
3 |
3100 |
120 |
26 |
3047 |
3047 |
1090 |
142 |
4 |
238 |
145 |
10 |
149 |
853 |
560 |
49 |
5 |
33828 |
2442 |
84 |
33538 |
44114 |
15751 |
116 |
6 |
21071 |
1906 |
90 |
26375 |
40579 |
10388 |
96 |
7 |
23885 |
1634 |
88 |
31627 |
44079 |
11307 |
124 |
8 |
27859 |
1667 |
112 |
38336 |
50424 |
12052 |
126 |
9 |
28188 |
1847 |
104 |
27857 |
37042 |
12874 |
125 |
10 |
30411 |
2212 |
97 |
26616 |
44762 |
13714 |
114 |
11 |
21998 |
1499 |
73 |
23696 |
33527 |
10388 |
124 |
12 |
24145 |
1071 |
93 |
33186 |
26653 |
8664 |
138 |
13 |
3542 |
879 |
35 |
6385 |
11315 |
3542 |
58 |
14 |
6903 |
586 |
30 |
8921 |
11067 |
3452 |
104 |
15 |
14205 |
3596 |
64 |
14278 |
28374 |
14816 |
59 |
16 |
95056 |
2466 |
448 |
130695 |
157283 |
21947 |
150 |
17 |
167438 |
7640 |
429 |
155950 |
233666 |
61731 |
136 |
18 |
224307 |
13410 |
640 |
232490 |
372809 |
97223 |
127 |
19 |
9703 |
1565 |
38 |
11377 |
12890 |
6620 |
65 |
20 |
57811 |
2503 |
114 |
74217 |
115918 |
20274 |
139 |
21 |
88787 |
7588 |
265 |
84525 |
165689 |
44086 |
101 |
22 |
7561 |
2560 |
73 |
15580 |
16642 |
9984 |
54 |
23 |
33129 |
4718 |
149 |
33829 |
53995 |
21608 |
71 |
24 |
158280 |
5023 |
345 |
132085 |
172031 |
45960 |
144 |
25 |
38078 |
4426 |
212 |
38866 |
62098 |
22130 |
80 |
26 |
16602 |
3998 |
94 |
26079 |
23488 |
16032 |
60 |
27 |
25388 |
7004 |
195 |
64935 |
71004 |
27876 |
57 |
28 |
27443 |
4194 |
91 |
24348 |
29238 |
18915 |
69 |
29 |
20266 |
3652 |
114 |
23773 |
30701 |
15046 |
61 |
30 |
23357 |
2227 |
81 |
22998 |
34622 |
11425 |
89 |
Требуется: провести статистическую группировку предприятий по качеству пашни, дать всестороннюю характеристику выделенных групп при помощи системы статистических показателей с целью выявления влияния качества почв на экономическую эффективность сельскохозяйственного производства.
Методические указания. Статистическая группировка - важнейшая составная часть второго этапа статистического исследования – сводки, в результате которой на основании зарегистрированных при статистическом наблюдении индивидуальных признаков отдельных единиц статистической совокупности получаются статистические показатели как общие (сводные) признаки массового явления.
Статистическая группировка – это метод разделения сложного массового явления на существенно различные группы. Он позволяет исчислить показатели для каждой группы и, таким образом, всесторонне охарактеризовать состояние, развитие и взаимосвязи изучаемого явления в целом. Одновременно группировка представляет собой процесс объединения в группы однородных единиц, по которым возможна сводка значений варьирующих признаков и получение статистических показателей.
Выделение группы ведется по величине и значению характеризующих единицы совокупности признаков. Поэтому важно правильно выделить и отобрать такие признаки, чтобы отделить друг от друга действительно различные группы единиц. Признаки должны быть существенными, чтобы выделить типичные для рассматриваемого явления группы. Если взять малозначимые признаки, не определяющие главные различия в изучаемом явлении, то можно получить поверхностное или даже искаженное представление о нем. Наряду с этим необходимо учитывать также задачи исследования.
По условиям задачи рассматривается совокупность коммерческих организаций, ведущих товарное сельскохозяйственное производство в одной из сельскохозяйственных подзон области, работающих на землях разного качества. Поскольку ставилась задача выделения групп организаций, различающихся почвенными условиями, то в нашем случае с учётом имеющейся информации группировочным признаком будет оценка качества пашни в баллах.
Табл. 2 Вариационный ряд распределения с.-х. организаций по баллу пашни
№ п/п |
Балл |
№ п/п |
Балл |
№ п/п |
Балл |
1 |
71 |
11 |
124 |
21 |
101 |
2 |
91 |
12 |
138 |
22 |
54 |
3 |
142 |
13 |
58 |
23 |
71 |
4 |
49 |
14 |
104 |
24 |
144 |
5 |
116 |
15 |
59 |
25 |
80 |
6 |
96 |
16 |
150 |
26 |
60 |
7 |
124 |
17 |
136 |
27 |
57 |
8 |
126 |
18 |
127 |
28 |
69 |
9 |
125 |
19 |
65 |
29 |
61 |
10 |
114 |
20 |
139 |
30 |
89 |
По данным вариационного ряда видно, что в совокупности организаций имеются большие различия в величине группировочного признака - от 49 до 150 баллов.
Далее важно правильно разделить единицы совокупности на группы. Здесь необходимо соблюдать два требования:
Состав групп должен быть качественно однородными, а сами группы - существенно различными друг от друга.
Единиц в группе должно быть достаточно много, чтобы проявились типичные черты групп и выявились закономерные причинно-следственные взаимосвязи между статистическими показателями, характеризующими группы.
При выделении групп надо учитывать характер группировочного признака. Если признак атрибутивный (качественный), то по каждому его значению (форма собственности, профессия работника, тип почвы и т.п.) следует выделить столько групп, сколько существует градаций признака. Так же поступают, если признак количественный дискретный и принимает небольшое число целочисленных значений (число членов семьи, число комнат в квартире и т.п.).
В решаемой задаче признак количественный, дискретный, варьирующий в достаточно широких границах. В этом случае необходимо установить качественные переходы в его величине, то есть определить те границы, где заканчивается одна группа единиц и начинается другая. Для этого следует сравнивать величину группировочного признака с ранее оцененными величинами или нормативами, в которых качественные переходы уже установлены или очевидны. Так если бы рассматривался вариационный ряд по сумме полученной прибыли и убытка, то переход от плюса (прибыль) к минусу (убыток) был бы качественной границей и выделялись бы группы прибыльных и убыточных организаций.
В нашем случае нормативов нет и установить границы групп указанным выше путем не представляется возможным. В таком случае рекомендуется устанавливать границы в величине группировочного признака и выделять группы по этапам:
Построить ранжированный ряд, в котором все единицы совокупности располагаются по нарастанию или убыванию группировочного признака, и проанализировать его. Для этой цели целесообразно воспользоваться опцией «Сортировка» в программе Excel: необходимо выделить всю базу данных (только числовые данные, без названия граф), затем указать столбец, по которому будет проведена сортировка (в нашем случае это балл пашни). Принцип « » - расположение единиц по возрастанию признака, а « » соответственно, по убыванию. В отсортированных данных первый порядковый номер будет иметь организация с самым низким баллом, последний порядковый номер – с самым высоким (табл. 3).
При выполнении этого этапа работы следует помнить, что если изначально выделить не всю базу данных, а только столбец группировочного признака, то будет проранжирован только этот столбец, при этом остальные характеристики с.-х. организаций не поменяют своего места. В результате произойдет смещение информации, и она будет непригодна для дальнейшего анализа.
Для наглядности ранжированный ряд можно представить графически, где на оси ординат отражается значение признака, а на оси абсцисс – номера по ранжиру (рис. 1). График ранжированного ряда называется огива Гальтона.
Табл.3. Сортировка данных по качеству пашни
N/ N
|
Выручка от реализации с.х. продукции, тыс. руб.
|
С.х. угодья, га
|
Число работников чел.
|
Полная себестоимость реализованной с.х. продукции, тыс.руб.
|
Производственные затраты в сельском хозяйстве, тыс.руб.
|
Энергоресурсы, л.с. |
Балл качества почв |
1 |
238 |
145 |
10 |
149 |
853 |
560 |
49 |
2 |
7561 |
2560 |
73 |
15580 |
16642 |
9984 |
54 |
3 |
25388 |
7004 |
195 |
64935 |
71004 |
27876 |
57 |
4 |
3542 |
879 |
35 |
6385 |
11315 |
3542 |
58 |
5 |
14205 |
3596 |
64 |
14278 |
28374 |
14816 |
59 |
6 |
16602 |
3998 |
94 |
26079 |
23488 |
16032 |
60 |
7 |
20266 |
3652 |
114 |
23773 |
30701 |
15046 |
61 |
8 |
9703 |
1565 |
38 |
11377 |
12890 |
6620 |
65 |
9 |
27443 |
4194 |
91 |
24348 |
29238 |
18915 |
69 |
10 |
36054 |
5229 |
157 |
34215 |
42899 |
23897 |
71 |
11 |
33129 |
4718 |
149 |
33829 |
53995 |
21608 |
71 |
12 |
38078 |
4426 |
212 |
38866 |
62098 |
22130 |
80 |
13 |
23357 |
2227 |
81 |
22998 |
34622 |
11425 |
89 |
14 |
28975 |
2677 |
156 |
32374 |
39254 |
13920 |
91 |
15 |
21071 |
1906 |
90 |
26375 |
40579 |
10388 |
96 |
16 |
88787 |
7588 |
265 |
84525 |
165689 |
44086 |
101 |
17 |
6903 |
586 |
30 |
8921 |
11067 |
3452 |
104 |
18 |
30411 |
2212 |
97 |
26616 |
44762 |
13714 |
114 |
19 |
33828 |
2442 |
84 |
33538 |
44114 |
15751 |
116 |
20 |
23885 |
1634 |
88 |
31627 |
44079 |
11307 |
124 |
21 |
21998 |
1499 |
73 |
23696 |
33527 |
10388 |
124 |
22 |
28188 |
1847 |
104 |
27857 |
37042 |
12874 |
125 |
23 |
27859 |
1667 |
112 |
38336 |
50424 |
12052 |
126 |
24 |
224307 |
13410 |
640 |
232490 |
372809 |
97223 |
127 |
25 |
167438 |
7640 |
429 |
155950 |
233666 |
61731 |
136 |
26 |
24145 |
1071 |
93 |
33186 |
26653 |
8664 |
138 |
27 |
57811 |
2503 |
114 |
74217 |
115918 |
20274 |
139 |
28 |
3100 |
120 |
26 |
3047 |
3047 |
1090 |
142 |
29 |
158280 |
5023 |
345 |
132085 |
172031 |
45960 |
144 |
30 |
95056 |
2466 |
448 |
130695 |
157283 |
21947 |
150 |
Рис 1.
При анализе ранжированного ряда оценивается интенсивность изменения величины группировочного признака от одной единицы совокупности к другой. Если имеются резкие изменения и большой отрыв ряда единиц от всей совокупности, то их выделяют в особую группу. В нашем примере группировочный признак нарастает плавно, резких отклонений отдельных значений нет, и выделить группы по данным этого ряда невозможно.
При отсутствии явных качественных переходов в ранжированном ряду строится интервальный ряд распределения. Для его построения необходимо знать число групп и границы интервалов. Число групп К зависит от численности единиц исходной совокупности N и определяется по формуле Стерджесса: lgN.