Расчетная часть.
Имеются следующие выборочные данные о деятельности российских банков (выборка 3%-ная механическая), млн. руб.:
№ банка п/п |
Прибыль |
Собственный капитал |
1 |
62 |
1969 |
2 |
175 |
5207 |
3 |
83 |
840 |
4 |
153 |
1828 |
5 |
118 |
589 |
6 |
170 |
1368 |
7 |
139 |
2080 |
8 |
200 |
2400 |
9 |
244 |
3681 |
10 |
268 |
5590 |
11 |
342 |
8587 |
12 |
329 |
2971 |
13 |
289 |
6930 |
14 |
66 |
1115 |
15 |
121 |
1076 |
16 |
129 |
1969 |
17 |
166 |
4703 |
18 |
67 |
440 |
19 |
282 |
2960 |
20 |
148 |
981 |
21 |
165 |
3808 |
22 |
198 |
530 |
23 |
163 |
895 |
24 |
240 |
2818 |
25 |
224 |
3034 |
26 |
165 |
1079 |
27 |
213 |
2918 |
28 |
64 |
985 |
29 |
111 |
2020 |
30 |
119 |
1576 |
31 |
93 |
1152 |
32 |
189 |
3810 |
33 |
203 |
2400 |
34 |
237 |
4077 |
35 |
215 |
2338 |
36 |
153 |
1517 |
37 |
306 |
2646 |
2.1 Задание 1
Постройте статистический ряд распределения банков по признаку прибыль, образовав 5 групп с равными интервалами.
Постройте графики полученного ряда распределения. Графически определите значения моды, медианы, первый и третий квартили и первый и девятый децили.
Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.
Вычислите среднюю арифметическую по исходным данным, сравните ее с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объясните причину их расхождения.
Сделайте выводы по результатам выполнения задания.
Решение.
Построение ранжированного ряда по группировочному признаку (прибыль). Ранжированный ряд – это такой ряд, единицы совокупности которого расположены в упорядоченном виде (по возрастанию). Число групп (n) по условию = 5.
Определения величины интервала по формуле (1)
i = ( x max – x min ) / n
где i – величина интервала
x max - максимальное значение группировочного признака в исследуемой совокупности.
x min - минимальное значение группировочного признака в исследуемой совокупности.
n – число групп.
i = (342 – 62)/5 = 56 (млн. руб.)
Группы банков по признаку «прибыль» получим путем прибавления величины интервала к минимальному уровню признака в группе:
[62; 118)
[118; 174)
[174; 230)
[230; 286)
[286; 342]
Представим зависимость между прибылью банков и их собственным капиталом в табличном виде (таблица 1)
Таблица 1
Ранжированный ряд.
Итого, в первой группе количество банков , во второй группе , в третьей группе , в четвертой группе , в пятой группе . Общее число банков .
Составим таблицу с результатами группировки (таблица 2)
Таблица 2
Результат группировки
Вывод: Банков со средней прибылью почти половины из всех банков (54,76%); банков с маленькой прибылью – 18,92%; с крупной прибылью – 24,32%.
Построение графиков полученного ряда распределения (полигон, гистограмма, кумулята).
а) Полигон – это графическое отображение дискретного ряда распределения в декартовой системе координат в виде многоугольник на оси абсцисс.
Рис. 1 Полигон
б) Гистограмма – это графическое отображение интервального ряда распределения в виде прямоугольников на оси абсцисс. Ширина прямоугольника – величина интервала, высота прямоугольника – частота
Рис. 2 Гистограмма.
в) Кумулята – это графическое изображения ряда распределения по накопленным (кумулятивным) частотам. Кумулятивная частота представляет собой численность единиц совокупности, образуемую от группы к группе путем суммирования предыдущих частот.
Рис. 3 Кумулята
Мода (Мо) – это значение признака, которое чаще всего встречается в статистической совокупности, т.е. это вариант с максимальной частотой. Мода определяется по гистограмме. Примерное значение моды по графику 150 млн. руб. Моду также можно найти по формуле (2)
М0= ХМо+iMo*((fMo-fMo-1)/( fMo-fMo-1)+ (fMo-fMo+1)) (2)
М0=118+56*((13-7)/(13-7)+(13-8))=148,5 (млн. руб.)
Мода = 148,5 говорит о том, что большинство из изученных банков имеет величину прибыли 148,5 млн. руб.
Медиана (Ме) – это значение признака, которое находится в середине ранжированного вариационного ряда и делит его по сумме частот на 2 равные части. Медиана находится по кумуляте в интервале, кумулятивная частота в котором равна или только начала превышать половину суммы всех частот. Примерное значение медианы по графику = 170 млн. руб. Медиану можно найти более точно по формуле (3)
. (3)
=167,5 (млн. руб.)
Медиана = 167,5 млн. руб. означает, что в исследуемой совокупности половина банков имеют прибыль до 167,5 млн. руб., а другая половина банков свыше 167,5 млн. руб.
Первый квартиль – это значение признака, которое делит вариационный ряд по сумме частот на 4 равные части и находится в ¼ от начала ранжированного вариационного ряда. Первый квартиль находится по кумуляте в интервале, кумулятивная частота в котором равна или только начала превышать ¼ суммы всех частот. Примерное значение первого квартиля по графику = 130 млн. руб. Первый квартиль находится по формуле (4)
(4)
=118+56 =127,7 (млн. руб.)
Третий квартиль – находится в ¾ от начала ранжированного вариационного, по кумуляте в интервале, кумулятивная частота в котором равна или только начала превышать ¾ суммы всех частот. Примерное значение третьего квартиля по графику = 229 млн. руб. Третий квартиль находится по формуле (5)
(5)
=207,6 (млн. руб.)
Первый дециль – это вариант, который делит вариационный ряд на 10 равных частей и находится в 1/10 от начала ранжированного вариационного ряда. Первый дециль находится по кумуляте в интервале, кумулятивная частота в котором равна или только начала превышать 1/10 суммы всех частот. Примерное значении первого дециля по графику = 80 млн. руб. Первый дециль находится по формуле (6)
(6)
(млн. руб.)
Девятый дециль - это вариант, который делит вариационный ряд на 10 равных частей и находится в 9/10 от начала ранжированного вариационного ряда. Девятый дециль находится по кумуляте в интервале, кумулятивная частота в котором равна или только начала превышать 9/10 суммы всех частот. Примерное значении девятого дециля по графику = 290 млн. руб. Девятый дециль находиться по формуле (7)
(7)
(млн. руб.)