
- •Проверка первичной информации на однородность, наличие аномальных наблюдений и нормальность распределения
- •2. Вариационный ряд распределения активов банков и система показателей, вычисляемая на его основе
- •2.1. Определение количества групп
- •2.2. Показатели центра распределения
- •2.3. Показатели вариации
- •2.4. Показатели дифференциации
- •2.5.Показатели концентрации
- •2.6. Показатели формы распределения
- •2.7. Проверка соответствия эмпирического распределения активов банков нормальному распределению с помощью критериев согласия Пирсона, Романовского и Колмогорова
- •3.Определение доверительного интервала для средней величины активов банков в генеральной совокупности
- •4. Анализ зависимости прибыли банков от стоимости их активов
- •Построение групповой таблицы.
- •Проверка правила сложения дисперсий и оценка степени влияния факторного признака на величину результативного.
- •4.4. Построение уравнения парной регрессии
- •4.4.1. Статистический анализ модели
- •4.4.2. Оценка качества построенной модели
- •Характеристики точности
- •Проверка адекватности модели
- •Проверка значимости модели
- •4.4.5. Построение доверительных интервалов
Проверка правила сложения дисперсий и оценка степени влияния факторного признака на величину результативного.
Правило сложения дисперсий заключается в равенстве общей дисперсии сумме средней из внутригрупповых и межгрупповой дисперсий, т.е.:
=
24,50
где
=24,50 (общая дисперсия)
= 1,63 (внутригрупповые
дисперсии)
средняя
из внутригрупповых дисперсий
= 22,87
(межгрупповая дисперсия)
внутригрупповые
средние;
=20,89 (общая средняя)
Для того, чтобы выяснить влияет ли контролируемый фактор на результативный признак, а при наличии такого влияния оценить его степень можно применить однофакторный дисперсионный анализ. Его логика рассуждений сводится к следующему:
Пусть
- математическое ожидание результативного
признака, соответственно в группах
.
Если при изменении уровня фактора
групповые математические ожидания не
изменяются, то результативный признак
не зависит от фактора А, в противном
случае такая зависимость имеется.
В связи с тем, что числовые значения математических ожиданий неизвестны, то возникает задача проверки гипотезы
Проверить данную гипотезу можно при соблюдении следующих требований при каждом значении уровня фактора:
наблюдения независимы и проводятся в одинаковых условиях;
результативный признак имеет нормальный закон распределения с постоянной для различных уровней генеральной дисперсией.
Для ответа на второй вопрос вычислим значения относительных показателей асимметрии и эксцесса. Учитывая, что каждый из них меньше 1,5 эмпирическое распределение прибыли банков не противоречит нормальному. Проверим выполнение гипотезы:
с помощью критерия Бартлетта:
=
4,60
где
=
1,65
l=n-m=
43
=
0,02
=
1,08
=
0,95
k=m-1
- дисперсия в j-ой
группе;
-выборочная
дисперсия в j-ой
группе.
При выполнении
гипотезы о равенстве дисперсий, величина
w
имеет распределение близкое к
ск=m-
степенями свободы.
При соблюдении условия
гипотеза
подтверждается.
Здесь
- правосторонняя критическая точка при
заданном уровне значимости
,
определяющая критический интервал (
).
Проверка гипотезы
о равенстве математическихожиданий
основывается на сравнении оценок
и
.
В математической статистике доказывается,
что если гипотеза о равенстве математических
ожиданий подтверждается, то величина
=150,58
имеет F
– распределения с числом свободы k=m-1
и
=n-m,
т.е.
При использовании
F
– критерия строится правосторонняя
область (
),
т.к. обычно
.
Если расчетное значение F
– критерия
попадает
в указанный интервал, то гипотеза о
равенстве групповых математических
ожиданий отвергается, т.е. считаем, что
фактор А влияет на результативный
признак Y
и можно измерить степень этого влияния
с помощью выборочного коэффициента
детерминации.
Значение правосторонней критической точки = 9,49
В связи с тем, что
=4,60
не попадает в критическую область
(9,49;
),
то гипотеза
принимается и можно приступить к проверке
гипотезы
.
Для этого сформируем массив значений
результативного признака по группам.
Таблица 8
Группа № 1 |
Группа № 2 |
Группа № 3 |
Группа № 4 |
Группа № 5 |
12,62 |
17,38 |
20,38 |
24,76 |
31,47 |
12,37 |
17,52 |
23,12 |
25,26 |
32,44 |
12,82 |
17,35 |
22,32 |
25,72 |
33,21 |
15,47 |
17,75 |
22,67 |
27,13 |
|
15,82 |
19,35 |
22,45 |
25,70 |
|
15,64 |
17,94 |
22,430 |
27,93 |
|
14,45 |
19,54 |
21,88 |
|
|
14,04 |
18,10 |
21,96 |
|
|
14,37 |
19,63 |
22,21 |
|
|
18,12 |
19,42 |
23,14 |
|
|
16,74 |
19,93 |
22,54 |
|
|
|
18,96 |
23,99 |
|
|
|
19,75 |
24,86 |
|
|
|
|
25,58 |
|
|
|
|
24,70 |
|
|
Обратимся к режиму работы «Однофакторный дисперсионный анализ». Показатели, рассчитанные в ходе проверки гипотезы, приведены в табл. 9 и 10.
Однофакторный дисперсионный анализ |
|
|||
|
|
|
|
|
ИТОГИ |
|
|
|
Таблица 9 |
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
Столбец 1 |
11 |
162,46 |
14,76 |
3,24 |
Столбец 2 |
13 |
242,62 |
18,66 |
0,99 |
Столбец 3 |
15 |
344,23 |
22,94 |
1,80 |
Столбец 4 |
6 |
156,5 |
26,08 |
1,44 |
Столбец 5 |
3 |
97,12 |
32,37 |
0,76 |
|
|
|
|
|
Таблица 10
Дисперсионный анализ |
|
|
|
|
|
|
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
Между группами |
1097,58 |
4 |
274,39 |
150,58 |
1,07882E-24 |
2,581 |
Внутри групп |
78,35 |
43 |
1,82 |
|
|
|
|
|
|
|
|
|
|
Итого |
1175,94 |
47 |
|
|
|
|
Как видно из табл.
10 расчетное значение F
– критерия
,
а критическая область образуется
правосторонним интервалом (2,59:
).
Так как
попадает в критическую область, то
гипотеза о равенстве групповых
математических ожиданий отвергается,
т.е. считаем, что прибыль банков зависит
от их группы.
Показатель SS между группами рассчитывается взвешенная сумма квадратов отклонений групповых средних от общей выборочной средней:
=
1097,58
ПоказательSS внутри групп вычисляется остаточная сумма квадратов отклонений наблюдаемых значений уровня от своей выборочной средней:
=
78,35
Показатель MS
вычисляются несмещенные оценки
и
Показатель F вычисляется расчетное значение критерия :
Разделив левую и правую части выражения на общую дисперсию получим следующее равенство:
.
Т.е. доли средней из внутригрупповых и межгрупповой дисперсий в сумме равны единице. Второе слагаемое именуется эмпирическим коэффициентом детерминации
=
0,93
Он характеризует долю объясненной дисперсии в общей. Следовательно, 93% вариации прибыли банков объясняются величиной их активов. Для оценки тесноты зависимости используется эмпирическое корреляционное отношение
=
0,97
Учитывая, что
теснота зависимости (по шкале Чеддока)
весьма высокая.
При недостаточном количестве данных в выделенных группах к рассчитанной величине корреляционного отношения водится поправка на группировку:
откуда
Таким образом можно сделать вывод, что эмпирический коэффициент детерминации является значимым и его можно применять для оценки влияния суммы активов банков на величину их прибыли.
4.3. Оценка степени взаимной согласованности между суммой активов банков и величиной их прибыли с помощью линейного коэффициента корреляции. Проверка его значимости и возможности использования линейной функции в качестве формы уравнения.
Линейный коэффициент корреляции вычисляется с помощью формулы:
Значение коэффициента
детерминации
=
0,92
Из приведенных результатов следует, что степень взаимной согласованности между суммой активов банков и величиной их прибыли весьма высокая.
В связи с тем, что линейный коэффициент корреляции определен по выборочным данным, то его значение может существенно отличаться от аналогичного показателя в генеральной совокупности. Поэтому необходимо определить значимость выборочного линейного коэффициента корреляции. При наличии значимости определяются границы доверительного интервала линейного коэффициента корреляции и его можно использовать для оценки степени тесноты связи.
Оценку значимости линейного коэффициента корреляции выполним на основе t – критерия Стьюдента
=
23,78
где
- стандартная ошибка линейного коэффициента
корреляции
При этом проверяется
гипотеза
о равенстве нулю коэффициента корреляции
(
:r=0).
Если гипотеза
подтверждается, то t
– статистика имеет распределение
Стьюдента с выходными параметрами
и k
(
- уровень значимости; k=n-2
– число степеней свободы).
Так как рассчитанное
значение
,
гипотеза
:r=0
отвергается, что свидетельствует о
значимости линейного коэффициента
корреляции, а следовательно, и о
статистической существенности зависимости
между суммой активов банков и величиной
их прибыли.
При недостаточном
объеме выборки для построения
доверительного интервала коэффициент
корреляции преобразуют в величину
,
имеющую приблизительно нормальное
распределение и рассчитываемую по
формуле
=
1,97
Данное выражение имеет название «z–преобразование Фишера».
Интервальная оценка для z определяется из выражения
(65)
где
- табулированые значения для стандартного
нормального распределения, зависимые
от
.
На основе обратного
преобразования Фишера определяется
интервальная оценка линейного коэффициента
корреляции.
Таким образом, с вероятностью 1,97 линейный коэффициент корреляции заключен в интервале от 1,67 до 2,27 со стандартной ошибкой 0,06.
Проверка возможности
использования линейной функции в
качестве формы уравнениязаключается
в определении разности квадратов
,
если она меньше 0,1, то считается возможным
использовать линейное уравнение
корреляционной зависимости. В данном
случае эта разность составляет 0,009