
- •Проверка первичной информации на однородность, наличие аномальных наблюдений и нормальность распределения
- •2. Вариационный ряд распределения активов банков и система показателей, вычисляемая на его основе
- •2.1. Определение количества групп
- •2.2. Показатели центра распределения
- •2.3. Показатели вариации
- •2.4. Показатели дифференциации
- •2.5.Показатели концентрации
- •2.6. Показатели формы распределения
- •2.7. Проверка соответствия эмпирического распределения активов банков нормальному распределению с помощью критериев согласия Пирсона, Романовского и Колмогорова
- •3.Определение доверительного интервала для средней величины активов банков в генеральной совокупности
- •4. Анализ зависимости прибыли банков от стоимости их активов
- •Построение групповой таблицы.
- •Проверка правила сложения дисперсий и оценка степени влияния факторного признака на величину результативного.
- •4.4. Построение уравнения парной регрессии
- •4.4.1. Статистический анализ модели
- •4.4.2. Оценка качества построенной модели
- •Характеристики точности
- •Проверка адекватности модели
- •Проверка значимости модели
- •4.4.5. Построение доверительных интервалов
4.4. Построение уравнения парной регрессии
При линейной связи параметры уравнения парной регрессии:
находится из системы уравнений:
,
которая получается применением метода наименьших квадратов. Из первого уравнения системы следует, что:
.
Подставив полученное выражение во второе уравнение, получим:
.
Коэффициент корреляции определяется по формуле:
Зная значения r,
и
можно вычислить по выражениям (72) и (68)
параметры
и
линейного уравнения регрессии, а также
значение среднего коэффициента
эластичности:
4.4.1. Статистический анализ модели
Наличие случайных
отклонений, вызванных воздействием на
переменную y
множества других, неучтенных в уравнении
факторов и ошибок измерения, приведет
к тому, что связь наблюдаемых величин
и
приобретает вид:
Здесь
- случайные ошибки (отклонения, возмущения).
Если были бы известны точные значения
отклонений
,
то можно было бы рассчитать значения
параметров
и
.
Так как они неизвестны, то по наблюдениям
и
можно получить только оценки параметров
и
,
которые сами являются случайными
величинами в связи с тем, что соответствуют
случайной выборке. Пусть
- оценка параметра
,
- оценка параметра
.
Тогда оцененное уравнение регрессии
будет иметь вид:
Для того чтобы
оценки
и
обладали
адекватностью ряд остатков
должен удовлетворять следующим
требованиям:
математическое ожидание равно нулю (критерий нулевого среднего);
величина является случайной переменной (критерий серий);
значения независимы между собой (критерий Дарбина-Уотсона);
дисперсия постоянна:
для всех i, j (тест Гольдфельда-Квандта);
Остатки распределены по нормальному закону (свойство используется для проверки статистической значимости и построения доверительных интервалов при прогнозировании)
Известно, что если данные условия выполняются, то оценки, сделанные с помощью метода наименьших квадратов, обладают следующими свойствами:
оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению:
Это вытекает из
того, что
и свидетельствует об отсутствии
систематической ошибки в определении
положения линии регрессии;
оценки состоятельны, т.к. дисперсии оценок параметров при возрастании числа наблюдений стремятся к нулю:
;
, т.е. надежность оценки при увеличении выборки растет;
оценки эффективны, т.е. они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра.
Если предположения 3 и 4 нарушены, т.е. дисперсия возмущений непостоянна или значения связаны друг с другом, то свойства несмещенности и состоятельности сохраняется, но свойства эффективности – нет.
4.4.2. Оценка качества построенной модели
Близость точек исходных данных и линий регрессии на графике корреляционного поля (рис. 17) позволяет судить о качестве модели, но более строгий подход, кроме визуальной оценки, предполагает использование и других критериев.
Рисунок 17
Выбор функции для моделирования взаимосвязи между факторами осуществляется на основе формального и неформального подходов.
Формальный подход позволяет определить соответствие модели исходному объекту (адекватность) и степень близости ее к фактическим данным (точность).
Неформальный подход заключается в логическом исследовании соответствия математической функции, принятой в качестве модели, исследуемой зависимости.
При выборе модели можно сначала на основе содержательного анализа исключить заведомо неподходящие функции, а затем выбрать лучшую из оставшихся моделей и по ней осуществлять моделирование.
Можно подойти к выбору модели иначе: сначала оценить параметры всех моделей и выбрать лучшую из них по формальным признакам, а затем решать вопрос о ее соответствии исследуемой зависимости в содержательном плане.
Формально качество модели определяется ее адекватностью и точностью. Эти свойства исследуются на основе анализа ряда остатков (отклонений расчетных значений от фактических):