
- •Государственное казенное образовательное учреждение
- •Содержание
- •Введение
- •Содержание задания
- •Рекомендации по выполнению и оформлению домашнего задания.
- •Приложение 1. Таблицы исходных данных для выполнения домашнего задания
- •Приложение 2 Значения функции р(λ)
- •Приложение 3
- •Приложение 4
- •1. Проверка первичной информации на однородность, наличие аномальных наблюдений и нормальность распределения
- •2. Вариационный ряд распределения активов банков и система показателей, вычисляемая на его основе
- •2.1. Определение количества групп
- •2.2. Показатели центра распределения
- •2.3. Показатели вариации
- •2.4. Показатели дифференциации
- •Показатели концентрации
- •2.6. Показатели формы распределения
- •2.7. Проверка соответствия эмпирического распределения внешнеторгового оборота фирм нормальному распределению с помощью критериев согласия Пирсона, Романовского и Колмогорова
- •3. Определение доверительного интервала для средней величины внешнеторгового оборота фирм в генеральной совокупности
- •4. Анализ зависимости таможенных платежей от внешнеторгового оборота фирм
- •4.2. Проверка правила сложения дисперсий и оценка степени влияния факторного признака на величину результативного.
- •4.4. Построение уравнения парной регрессии
- •4.4.1. Статистический анализ модели
- •4.4.2. Оценка качества построенной модели
- •Характеристики точности
- •Проверка адекватности модели
- •4.4.3. Построение доверительных интервалов
3. Определение доверительного интервала для средней величины внешнеторгового оборота фирм в генеральной совокупности
Величина доверительного интервала (предельная ошибка выборки) находится из выражения
,
(40)
где t – коэффициент доверия;
-средняя ошибка
выборки.
Средняя ошибка бесповторной выборки:
,(41)
где
- дисперсия генеральной совокупности;
- объем выборочной
совокупности;
N – объём генеральной совокупности.
В случае малой выборки (n<100) средняя ошибка бесповторной выборки находится из выражения:
(42)
где
Коэффициент доверия в распределении Стьюдента является функцией доверительной вероятности и функцией объема выборки. Его значение получим с помощью функции СТЬЮДЕНТ.ОБР.2Х (0,05; 47), где 0,05 – уровень значимости, n-1=47- количество степеней свободы.
.
Выборка считается репрезентативной, если величина ее относительной ошибки составляет не более 5%, т.е.
(43)
Учитывая, что
,
выборку следует признать представительной.
4. Анализ зависимости таможенных платежей от внешнеторгового оборота фирм
4.1 Построение групповой таблицы.
Для построения групповой таблицы вычисляются средние значения результативного признака в каждой группе фирм (графа 6 табл. 5.2). Сравнив их значения, можно предположить о наличии прямой корреляционной зависимости между признаками, что иллюстрируется рис. 4.
Рис. 4. Зависимость средних перечислений в бюджет
от среднего значения ВТО фирм
4.2. Проверка правила сложения дисперсий и оценка степени влияния факторного признака на величину результативного.
Правило сложения дисперсий заключается в равенстве общей дисперсии сумме средней из внутригрупповых и межгрупповой дисперсий, т.е.:
,
(44)
где,
(45)
—общая средняя
арифметическая результативного признака;
_
среднее значение результативного
признака в
-
ой группе;
-
cредняя
из внутригрупповых дисперсий;
—дисперсия
в j-ой
группе (графа 13 табл. 5.2), вычисляемая по
формуле:
;
-
межгрупповая
дисперсия;
Как следует из выражения (44) правило сложения дисперсий выполняется.
Разделив левую и правую части выражения (44) на общую дисперсию получим следующее тождество:
доли
средней из внутригрупповых и межгрупповой
дисперсий в сумме равны единице.
Второе слагаемое
именуется эмпирическим коэффициентом
детерминации (причинности) и обозначается
(46)
Квадратный корень из коэффициента детерминации принято называть корреляционным отношением:
(47)
Изменяется корреляционное отношение от 0 до 1.
При недостаточном количестве данных в выделенных группах к рассчитанной величине корреляционного отношения вносится поправка:
,
(48)
где m
— число выделенных групп.
Для оценки значимости корреляционного отношения можно применить однофакторный дисперсионный анализ. Его логика рассуждений сводится к следующему:
Пусть
- математическое ожидание результативного
признака, соответственно в группах
.
Если при изменении уровня фактора
групповые математические ожидания не
изменяются, то результативный признак
не зависит от фактора А - в противном
случае такая зависимость имеется.
В связи с тем, что числовые значения математических ожиданий неизвестны, то возникает задача проверки гипотезы
Проверить данную гипотезу можно при соблюдении следующих требований при каждом значении уровня фактора:
1. наблюдения независимы и проводятся в одинаковых условиях;
2. результативный признак имеет нормальный закон распределения с постоянной для различных уровней генеральной дисперсией.
Для ответа на
второй вопрос вычислим значения
относительных показателей асимметрии
и эксцесса
для зависимой переменной. Учитывая, что
каждый из них меньше 1,5 эмпирическое
распределение таможенных платежей в
бюджет не противоречит нормальному.
Проверим выполнение гипотезы:
(49)
с помощью критерия Бартлетта:
где
остаточная
дисперсия, что является синонимом
средней из внутригрупповых выборочных
дисперсий;
выборочная
дисперсия в
ой
группе (графа 14 табл. 5.2);
;
;
.
При выполнении
гипотезы о равенстве дисперсий, величина
w
имеет распределение близкое к
с
степенями
свободы.
При соблюдении условия
гипотеза (7.14)
подтверждается.
Здесь
- правосторонняя критическая точка при
заданном уровне значимости
,
определяющая критический интервал (
).
Далее можно
приступить к проверке гипотезы
.
Для этого сформируем массив значений
результативного признака по группам
(табл. 4).
Массив значений результативного признака
Таблица 4
Обратимся к режиму работы «Однофакторный дисперсионный анализ».
Однофакторный дисперсионный анализ |
|
|
| |||||||||
|
|
|
|
|
|
| ||||||
ИТОГИ |
|
|
|
Таблица 5 |
|
| ||||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
|
| ||||||
Столбец 1 |
5 |
72,29 |
14,46 |
1,566 |
|
| ||||||
Столбец 2 |
12 |
202,05 |
16,84 |
0,721 |
|
| ||||||
Столбец 3 |
14 |
272,83 |
19,49 |
0,780 |
|
| ||||||
Столбец 4 |
11 |
238,77 |
21,71 |
1,210 |
|
| ||||||
Столбец 5 |
6 |
146,02 |
24,34 |
1,892 |
|
| ||||||
|
|
|
|
|
|
| ||||||
|
|
|
|
|
|
| ||||||
Дисперсионный анализ |
|
|
|
|
Таблица 6 | |||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое | ||||||
Между группами |
405,746 |
4 |
101,437 |
95,066 |
9,022E-21 |
2,589 | ||||||
Внутри групп |
45,882 |
43 |
1,067 |
|
|
| ||||||
|
|
|
102,504 |
|
|
| ||||||
Итого |
451,628 |
47 |
9,609 |
|
|
|
Проверка гипотезы
о равенстве математических ожиданий
основывается на сравнении оценок
факторной
и остаточной
дисперсий.
В математической статистике доказывается,
что если гипотеза о равенстве математических
ожиданий подтверждается, то величина
имеет F
– распределения с числом свободы
и
,
т.е.
,
где
;
При использовании
F
– критерия строится правосторонняя
область (),
т.к. обычно
.
Если расчетное значениеF
– критерия
попадает
в указанный интервал, то гипотеза о
равенстве групповых математических
ожиданий отвергается, т.е. считаем, что
факторА
влияет на результативный признак Y
и можно измерить степень этого влияния
с помощью корреляционного
отношения.
4.3. Оценка степени взаимной согласованности между суммой
внешнеторгового оборота фирм и величиной таможенных платежей в бюджет с помощью линейного коэффициента корреляции, проверка его значимости и возможности использования линейной функции в качестве формы уравнения
Для определения
степени тесноты парной линейной
зависимости служит линейный коэффициент
корреляции ();
при любой форме зависимости (линейной
и криволинейной) - эмпирическое
корреляционное отношение (
)).
Для расчета линейного коэффициента корреляции можно использовать формулу:
,
(50)
где
—
среднее значение произведения факторного
и результативного признаков;
-
средние значения факторного и
результативного признаков;
n— число единиц в совокупности;
—средние квадратические
отклонения соответственно признака -
фактора и результативного признака.
Оценка существенности
линейного коэффициента корреляции при
большом объеме выборки (свыше 500)
проводится с использованием отношения
коэффициента корреляции ()
к его средней квадратической ошибке
(
):
,
(51)
где
.
(52)
Если это отношение
окажется больше критического значения
t-критерия
Стьюдента, определяемого по формуле
СТЬЮДЕНТ.ОБР.2X(0,95;46)
при числе степеней свободы к
= п -
p
-
2 и с вероятностью (1 —
),
то следует говорить о существенности
коэффициента корреляции (
—
уровень значимости 0,01 или 0,05;
p
-
количество
факторных признаков).
При недостаточно большом объеме выборки величину средней квадратической ошибки коэффициента корреляции определяют по формуле
.
(53)
В этом случае
.
(54)
Полученная величина
сравнивается
с критическим значениемt-критерия
Стьюдента (
).
В тех случаях,
когда
получен по данным малой выборки и близок
к единице (
>
0,8),для построения
доверительного интервала коэффициент
корреляции преобразуют в величину
,
имеющую приблизительно нормальное
распределение и рассчитываемую по
формуле
(55)
Данное выражение имеет название «z – преобразование Фишера».
Интервальная оценка для z определяется из выражения
(56)
где
- табулированые значения для стандартного
нормального распределения, зависимые
от
.
На основе обратного
преобразования Фишера определяется
интервальная оценка линейного коэффициента
корреляции.
Приведем реализацию изложенного алгоритма.
по формуле ФИШЕР(
) – вычисляется значение
;
по формулам
2,196-НОРМСТОБР((0,95+1)/2)*КОРЕНЬ(1/45)=1,904 и
2,196+НОРМСТОБР((0,95+1)/2)*КОРЕНЬ(1/45)=2,489 рассчитываются интервальные оценки z;
по формулам ФИШЕРОБР(1,904)=0,957 и ФИШЕРОБР(2,489)=0,986 находим обратные преобразования Фишера.
Таким образом, с вероятностью 0,95 линейный коэффициент корреляции заключен в интервале от 0,957 до 0,986.
Средняя квадратическая ошибка Z'-распределения зависит только от объема выборки и определяется по формуле:
.
(57)
Если соотношение
Z' к средней квадратической ошибке (Z':
=14,42)
окажется больше критического значения
критерия Стьюдента при определенном
уровне значимости, то можно говорить о
наличии связи между признаками в
генеральной совокупности.