
«Методические указания
Таможенная инспекция провела 1%-ю проверку после выпуска товаров. В результате получен следующий дискретный ряд распределения числа нарушений, выявленных в каждой проверке (табл. 6). Проведем анализ этого ряда распределения.
Таблица 6. Ряд распределения числа нарушений, выявленных таможенной инспекцией
Число нарушений |
0 |
1 |
2 |
3 |
Число проверок |
24 |
4 |
2 |
1 |
Этап 1. Данный в табл. 6 ряд распределения уже ранжирован в порядке возрастания числа нарушений, поэтому переходим сразу к расчету основного обобщающего показателя – среднего числа нарушений. Сначала рассчитаем среднее число нарушений в выборке, а также его дисперсию, для чего построим вспомогательную таблицу 7.
Таблица 7. Ряд распределения числа нарушений, выявленных таможенной инспекцией
Число нарушений X |
Число проверок f |
Xf |
(Х
- |
m |
|
f’ |
m’ |
|f’– m’| |
0 |
24 |
0 |
3,022 |
21,7 |
0,244 |
24 |
21,7 |
2,3 |
1 |
4 |
4 |
1,665 |
7,7 |
1,778 |
28 |
29,4 |
1,4 |
2 |
2 |
4 |
5,413 |
1,4 |
0,257 |
30 |
30,8 |
0,8 |
3 |
1 |
3 |
6,997 |
0,2 |
3,200 |
31 |
31 |
0 |
Итого |
31 |
11 |
17,097 |
31 |
5,479 |
|
|
|
Среднее число нарушений в выборке по формуле, приняв за X число нарушений, а за N – численность выборки n:
=
=
11/31 = 0,355 (нарушений).
Дисперсию определим по формуле:
=
=
0,552 (нарушений2).
Затем определим среднюю ошибку выборки по формуле, так как число величин в генеральной совокупности N неизвестно:
=
.
Предельная ошибка выборки при вероятности 0,95 по формуле:
= 1,96*0,133 =
0,261.
Доверительный интервал среднего числа нарушений в генеральной совокупности по формуле:
=
0,355 ± 0,261 или 0,094
0,616 (нарушений), то есть среднее число
нарушений по всей совокупности товаров,
прошедших через таможенную границу, с
вероятностью 0,95 лежит в пределах от
0,094 до 0,616 нарушений в 1 партии.
Найдем еще обобщающий показатель – долю выпущенных товаров без нарушений d (т.е. с числом нарушений X=0). Доля таких товаров в выборке по формуле составила:
24/31
= 0,774, или 77,4%.
Дисперсия этой доли по формуле (2) 4 составила:
=
0,774*(1–0,774) = 0,175. (2)
Средняя ошибка выборки по формуле:
=
.
Предельная ошибка выборки при вероятности 0,95 по формуле:
= 1,96*0,075 = 0,147.
Доверительный интервал доли выпущенных товаров без нарушений в генеральной совокупности по формуле:
d = 0,774 ± 0,147 или 0,627 d 0,921, то есть доля выпущенных товаров без нарушений по всей совокупности товаров, прошедших через таможенную границу, с вероятностью 0,95 лежит в пределах от 62,7% до 92,1%.
Этап 2. Данный ряд распределения не имеет смысла превращать в интервальный в виду очень малой вариации значений признака. Построив график этого распределения (полигон) – рис. 5, видно, что данное распределение не похоже на нормальное.
Рис. 5. Кривая распределения числа нарушений, выявленных таможенной инспекцией
Этап 3. Из структурных характеристик ряда распределения можно определить только моду: Мо = 0, так как по данным табл. 7 такое число нарушений чаще всего встречается (f=24).
Этап 4. По формуле определим размах вариации: H = 3 – 0 = 3, что характеризует вариацию в 3 нарушения.
По формуле Error: Reference source not found найдем среднее линейное отклонение:
.
Это означает, что в среднем число нарушений в выборке отклоняется от среднего числа нарушений на 0,55.
Среднее
квадратическое отклонение рассчитаем
не по формуле, а как корень из дисперсии,
которая уже была рассчитана нами на 1-м
этапе:
,
тогда
,
т.е. в изучаемом распределении наблюдается некоторое число выделяющихся нарушений (с большим числом нарушений, выявленных в одной проверке).
Поскольку квартили на предыдущем этапе не определялись, на данном этапе расчет среднего квартильного расстояния пропускаем.
Теперь рассчитаем относительные показатели вариации:
относительный размах вариации по формуле Error: Reference source not found:
= 3/0,355 = 8,45;
линейный коэффициент вариации по формуле Error: Reference source not found:
= 0,550/0,355 = 1,55;
квадратический коэффициент вариации по формуле Error: Reference source not found:
= 0,743/0,355 = 2,09.
Все расчеты на данном этапе свидетельствуют о значительных размере и интенсивности вариации нарушений, выявленных таможенной инспекцией.
Этап 5. Не имеет практического смысла расчет моментов распределения, так как видно из рис. 5, что в изучаемом распределении симметрия отсутствует вовсе, поэтому и расчет эксцесса также бесполезен.
Этап 6. Выдвинем гипотезу о соответствии изучаемого распределения распределению Пуассона5, которое описывается формулой (2):
, (2)
где P(X) – вероятность того, что признак примет то или иное значение X;
e = 2,7182 – основание натурального логарифма;
X! – факториал числа X (т.е. произведение всех целых чисел от 1 до X включительно);
a
=
– средняя арифметическая ряда
распределения.
Из формулы (2) видно, что единственным параметром распределения Пуассона является средняя арифметическая величина. Порядок определения теоретических частот этого распределения следующий:
рассчитать среднюю арифметическую ряда, т.е. = a;
рассчитать e–a;
для каждого значения X рассчитать теоретическую частоту по формуле (2):
. (2)
Поскольку a = = 0,355 найдем значение e – 0,355 =0,7012. Затем, подставив в формулу (2) значения X от 0 до 3, вычислим теоретические частоты:
m0
=
(т.к. 0! = 1); m1
=
;
m2
=
;
m3
=
.
Полученные теоретические частоты занесем в 5-й столбец табл. 7 и построим график эмпирического и теоретического распределений (рис. 6), из которого видна близость эмпирического и теоретического распределений.
Рис. 6. Эмпирическая и теоретическая (распределение Пуассона) кривые распределения
Проверим выдвинутую гипотезу о соответствии изучаемого распределения закону Пуассона с помощью критериев согласия.
Рассчитаем значение критерия Пирсона χ2 по формуле в 6-м столбце табл. 7: χ2 =5,479, что меньше табличного (Приложение 7) значения χ2табл=5,9915 при уровне значимости α = 0,05 и числе степеней свободы ν=4–1–1=2, значит с вероятностью 0,95 можно говорить, что в основе эмпирического распределения лежит закон распределения Пуассона, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.
Определим значение критерия Романовского по формуле:
=
1,74 < 3, что подтверждает несущественность
расхождений между эмпирическими и
теоретическими частотами.
Для
расчета критерия Колмогорова в последних
трех столбцах таблицы 7 приведены расчеты
накопленных частот и разностей между
ними, откуда видно, что в 1-ой группе
наблюдается максимальное расхождение
(разность) D
= 2,3. Тогда по формуле:
.
По таблице Приложения 6 находим значение
вероятности при λ = 0,4:
P
= 0,9972 (наиболее близкое значение к 0,413),
т.е. с вероятностью, близкой к единице,
можно говорить, что в основе эмпирического
распределения величины нарушений,
выявленных
таможенной инспекцией,
лежит закон распределения Пуассона, а
расхождения эмпирического и теоретического
распределений носят случайный характер»
[2].
1 По данным ФТС в 2005 году с помощью СУР дополнительно удалось перечислить в государственный бюджет порядка 10,7 млрд. руб., возбуждено 3459 дел об административных правонарушениях
2 Журнал «Таможня» №11, 2006, стр. 5.
3 Зачастую заполнение электронного отчета о выявленных рисках занимает в несколько раз больше времени, чем документальная проверка декларации
4 Самостоятельно получить формулу (2) из формулы путем подстановки двух значений признака, равных X1 = 0 и X2 = 1 с частотами f1 = d и f2 = q, причем d + q = 1
5 Названо по имени французского математика Симеона Пуассона (1781 – 1840), еще называют законом распределения редких явлений; возникает, когда значения признака выражены дискретно и являются результатом какого-либо редко возникающего события среди наблюдаемых единиц, причем с увеличением значений признака вероятность наступления события падает