- •Домашнее задание по дисциплине «Статистика» Раздел «Общая теория статистики»
- •Семестровое домашнее задание по дисциплине «Статистика» Раздел «Общая теория статистики»
- •1. Проверка первичной информации на однородность, наличие аномальных наблюдений и нормальность распределения
- •2. Вариационный ряд распределения активов банков и система показателей, вычисляемая на его основе
- •2.1. Определение количества групп
- •2.2. Показатели центра распределения
- •2.3. Показатели вариации
- •2.4. Показатели дифференциации
- •Показатели концентрации
- •2.6. Показатели формы распределения
- •2.7. Проверка соответствия эмпирического распределения внешнеторгового оборота фирм нормальному распределению с помощью критериев согласия Пирсона, Романовского и Колмогорова
- •3. Определение доверительного интервала для средней величины внешнеторгового оборота фирм в генеральной совокупности
- •4. Анализ зависимости таможенных платежей от внешнеторгового оборота фирм
- •4.1 Построение групповой таблицы.
- •4.2. Проверка правила сложения дисперсий и оценка степени влияния факторного признака на величину результативного.
- •4.4. Построение уравнения парной регрессии
- •4.4.1. Статистический анализ модели
- •4.4.2. Оценка качества построенной модели
- •Характеристики точности
- •Проверка адекватности модели
- •4.4.3. Построение доверительных интервалов
3. Определение доверительного интервала для средней величины внешнеторгового оборота фирм в генеральной совокупности
Величина доверительного интервала (предельная ошибка выборки) находится из выражения
, (40)
где t – коэффициент доверия;
- средняя ошибка
выборки.
Средняя ошибка бесповторной выборки:
,
(41)
где
- дисперсия генеральной совокупности;
- объем выборочной
совокупности;
N – объём генеральной совокупности.
В случае малой выборки (n<100) средняя ошибка бесповторной выборки находится из выражения:
(42)
где
Коэффициент доверия в распределении Стьюдента является функцией доверительной вероятности и функцией объема выборки. Его значение получим с помощью функции СТЬЮДРАСПОБР (1-0,9973; 47), где 1-0,9973 – уровень значимости, n-1=47- количество степеней свободы.
Выборка считается репрезентативной, если величина ее относительной ошибки составляет не более 5%, т.е.
(43)
Учитывая, что
,
выборку следует признать представительной.
4. Анализ зависимости таможенных платежей от внешнеторгового оборота фирм
4.1 Построение групповой таблицы.
Для построения групповой таблицы вычисляются средние значения результативного признака в каждой группе фирм (графа 6 табл. 5.2). Сравнив их значения, можно предположить о наличии прямой корреляционной зависимости между признаками, что иллюстрируется рис. 4.
Рис. 4. Зависимость средней прибыли У от средней суммы активов в j-ой группе банков
4.2. Проверка правила сложения дисперсий и оценка степени влияния факторного признака на величину результативного.
Правило сложения дисперсий заключается в равенстве общей дисперсии сумме средней из внутригрупповых и межгрупповой дисперсий, т.е.:
,
(44)
Где
, (45)
—
общая средняя
арифметическая результативного признака;
_
среднее значение результативного
признака в
-
ой группе;
-
cредняя
из внутригрупповых дисперсий;
—дисперсия
в j-ой
группе (графа 13 табл. 5.2), вычисляемая по
формуле:
;
-
межгрупповая
дисперсия;
Как следует из выражения (44) правило сложения дисперсий выполняется.
Разделив левую и правую части выражения (44) на общую дисперсию получим следующее тождество:
доли
средней из внутригрупповых и межгрупповой
дисперсий в сумме равны единице.
Второе слагаемое
именуется эмпирическим коэффициентом
детерминации (причинности) и обозначается
(46)
Квадратный корень из коэффициента детерминации принято называть корреляционным отношением:
(47)
Изменяется корреляционное отношение от 0 до 1.
При недостаточном количестве данных в выделенных группах к рассчитанной величине корреляционного отношения вносится поправка:
;
0,962
(48)
где m — число выделенных групп.
Для оценки значимости корреляционного отношения можно применить однофакторный дисперсионный анализ. Его логика рассуждений сводится к следующему:
Пусть
- математическое ожидание результативного
признака, соответственно в группах
.
Если при изменении уровня фактора
групповые математические ожидания не
изменяются, то результативный признак
не зависит от фактора А - в противном
случае такая зависимость имеется.
В связи с тем, что числовые значения математических ожиданий неизвестны, то возникает задача проверки гипотезы
Проверить данную гипотезу можно при соблюдении следующих требований при каждом значении уровня фактора:
1. наблюдения независимы и проводятся в одинаковых условиях;
2. результативный признак имеет нормальный закон распределения с постоянной для различных уровней генеральной дисперсией.
Для ответа на второй вопрос вычислим значения относительных показателей асимметрии и эксцесса ta= 1,14; te=1,42 для зависимой переменной. Учитывая, что каждый из них меньше 1,5 эмпирическое распределение таможенных платежей в бюджет не противоречит нормальному.
Проверим выполнение гипотезы:
(49)
с помощью критерия Бартлетта:
3,976
где
остаточная
дисперсия, что является синонимом
средней из внутригрупповых выборочных
дисперсий;
выборочная
дисперсия в
ой
группе (графа 14 табл. 5.2); ;
.
При выполнении
гипотезы о равенстве дисперсий, величина
w
имеет распределение близкое к
с
степенями
свободы.
При соблюдении условия
гипотеза (7.14)
подтверждается.
Здесь
- правосторонняя критическая точка при
заданном уровне значимости
,
определяющая критический интервал (
).
Далее можно приступить к проверке гипотезы . Для этого сформируем массив значений результативного признака по группам (табл. 8).
Таблица 8
группа 1 |
группа 2 |
группа 3 |
группа 4 |
группа 5 |
12,62 |
17,38 |
20,38 |
24,76 |
31,47 |
12,37 |
17,52 |
23,12 |
25,26 |
32,44 |
12,82 |
17,35 |
22,32 |
25,72 |
33,21 |
15,47 |
17,75 |
22,67 |
27,13 |
|
15,82 |
19,35 |
22,45 |
25,7 |
|
15,64 |
17,94 |
22,43 |
27,93 |
|
14,45 |
19,54 |
21,88 |
|
|
14,04 |
18,1 |
21,96 |
|
|
14,37 |
19,63 |
22,21 |
|
|
18,12 |
19,42 |
23,14 |
|
|
16,74 |
19,93 |
22,54 |
|
|
|
18,96 |
23,99 |
|
|
|
19,75 |
24,86 |
|
|
|
|
25,58 |
|
|
|
|
24,7 |
|
|
Обратимся к режиму работы «Однофакторный дисперсионный анализ».
|
Однофакторный дисперсионный анализ |
|
|
|
|||||||
ИТОГИ |
|
|
|
|
|
|
|
||||
Группы |
Размер выборки |
Сумма |
Среднее |
Дисперсия |
|
|
|
||||
группа 1 |
11 |
162,46 |
14,76909 |
3,24331 |
|
|
|
||||
группа 2 |
13 |
242,62 |
18,66308 |
0,99784 |
|
|
|
||||
группа 3 |
15 |
344,23 |
22,94867 |
1,8011 |
|
|
|
||||
группа 4 |
6 |
156,5 |
26,08333 |
1,44275 |
|
|
|
||||
группа 5 |
3 |
97,12 |
32,37333 |
0,76023 |
|
|
|
||||
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
||||
Дисперсионный анализ |
|
|
|
|
|
||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
|
||||
Между группами |
1097,586 |
4 |
274,3965 |
150,58117 |
1,07E-24 |
2,588836 |
|
||||
Внутри групп |
78,35674 |
43 |
1,82225 |
|
|
|
|
||||
|
|
|
|
|
|
|
|
||||
Итого |
1175,942 |
47 |
|
|
|
|
|
||||
Проверка гипотезы
о равенстве математических ожиданий
основывается на сравнении оценок
факторной
и остаточной
дисперсий. В математической статистике
доказывается, что если гипотеза о
равенстве математических ожиданий
подтверждается, то величина
имеет F
– распределения с числом свободы
и
,
т.е.
При использовании
F
– критерия строится правосторонняя
область (
),
т.к. обычно
.
Если расчетное значение F
– критерия
попадает
в указанный интервал, то гипотеза о
равенстве групповых математических
ожиданий отвергается, т.е. считаем, что
фактор А
влияет на результативный признак Y
и можно измерить степень этого влияния
с помощью корреляционного
отношения.
4.3. Оценка степени взаимной согласованности между суммой
внешнеторгового оборота фирм и величиной таможенных платежей в бюджет с помощью линейного коэффициента корреляции, проверка его значимости и возможности использования линейной функции в качестве формы уравнения
Для определения
степени тесноты парной линейной
зависимости служит линейный коэффициент
корреляции (
);
при любой форме зависимости (линейной
и криволинейной) - эмпирическое
корреляционное отношение (
)).
Для расчета линейного коэффициента корреляции можно использовать формулу:
=0,785,
(50)
где
—
среднее значение произведения факторного
и результативного признаков;
-
средние значения факторного и
результативного признаков;
n— число единиц в совокупности;
— средние
квадратические отклонения соответственно
признака - фактора и результативного
признака.
Оценка существенности
линейного коэффициента корреляции при
большом объеме выборки (свыше 500)
проводится с использованием отношения
коэффициента корреляции (
)
к его средней квадратической ошибке
(
):
,
(51)
где
.
(52)
Если это отношение окажется больше критического значения t-критерия Стьюдента, определяемого по формуле СТЬЮДЕНТ.ОБР(0,95;46) при числе степеней свободы к = п — 2 и с вероятностью (1 — ), то следует говорить о существенности коэффициента корреляции ( — уровень значимости 0,01 или 0,05).
При недостаточно большом объеме выборки величину средней квадратической ошибки коэффициента корреляции определяют по формуле
.
(53)
В этом случае
.
(54)
Полученная величина
сравнивается
с критическим значением t-критерия
Стьюдента (
).
Так как рассчитанное
значение, (tр(8,59)>tкрит(2,01),
гипотеза
:r=0
отвергается, что свидетельствует о
значимости линейного коэффициента
корреляции, а следовательно, и о
статистической существенности зависимости
между суммой активов банков и величиной
их прибыли.
При недостаточном
объеме выборки для построения
доверительного интервала коэффициент
корреляции преобразуют в величину
,
имеющую приблизительно нормальное
распределение и рассчитываемую по
формуле
. (55)
Данное выражение имеет название «z – преобразование Фишера».
Интервальная оценка для z определяется из выражения
(56)
где
- табулированые значения для стандартного
нормального распределения, зависимые
от
.
На основе обратного
преобразования Фишера определяется
интервальная оценка линейного коэффициента
корреляции.
Приведем реализацию изложенного алгоритма.
по формуле ФИШЕР( ) – вычисляется значение ;
по формулам
2,44-НОРМСТОБР((0,95+1)/2)*КОРЕНЬ(1/45)=2,15 и
2,44+НОРМСТОБР((0,95+1)/2)*КОРЕНЬ(1/45)=2,73 рассчитываются интервальные оценки z;
по формулам ФИШЕРОБР(2,25)=0,973 и ФИШЕРОБР(2,73)=0,99 находим обратные преобразования Фишера.
Таким образом, с вероятностью 0,95 линейный коэффициент корреляции заключен в интервале от 0,766 до 1,35 со стандартной ошибкой 0,09.
Проверка возможности
использования линейной функции в
качестве формы уравнения заключается
в определении разности квадратов
,
если она меньше 0,1, то считается возможным
использовать линейное уравнение
корреляционной зависимости. В данном
случае эта разность составляет 0,036
