- •МинИстерство сельского хозяйства рф
- •Методические указания
- •Методические указания
- •Раздел 1
- •1.1.Условия применения корреляционно-регрессионного анализа
- •1.2.Вычисление описательных статистик с помощью ппп ms Excel и Statistica 6.1
- •Раздел 2
- •2.1. Методические указания
- •2.2.Построение типовой модели
- •2.3.Решение типовых задач с помощью ппп ms Excel и Statistica 6.1
- •2.4. Варианты заданий лабараторной работы №1
- •Множественная регрессия и корреляция
- •Методические указания
- •Построение типовой модели
- •2.3.Решение типовых задач с помощью ппп ms Excel и Statistica 6.1
- •3.4 Варианты заданий лабараторной работы №2
- •4. Врменные ряды в эконометрике
- •4.1. Методические указания
- •4.2. Моделирование временных рядов: оценка адекватности уравнения тренда
- •4.3. Решение типовых задач с помощью ппп ms Excel и Statistica 6.1
- •4.4 Варианты заданий для лабораторной работы №3
- •5. Список рекомендуемой литературы:
- •6. Приложения: основные значения статистик
2.4. Варианты заданий лабараторной работы №1
В таблице 2.4 представлены данные по территориям региона за 20ХХ год
Таблица 2.4 - Исходные данные для лабораторной работы №1
№ предприятия |
Среднедушевой прожиточный минимум в день, у.е. (Х) |
Среднедневная заработная плата, у.е. (У) |
1 |
70+2i |
133 |
2 |
90-4j |
148 |
3 |
80+i |
134 |
4 |
90-3i |
154 |
5 |
90+3i |
162 |
6 |
110-5i |
195 |
7 |
60+j |
139 |
8 |
90-2j |
158 |
9 |
80-j |
152 |
10 |
87+0,5i |
162 |
11 |
75-0,1j |
159 |
12 |
110+0,1i |
173 |
где i, j – две последние цифры зачетной книжки соответственно.
По данным своего варианта необходимо:
1. Построить поле корреляции.
2. Для характеристики зависимости у от х:
а) построить линейное уравнение парной регрессии у от х;
б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации;
в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации;
г) дать оценку силы связи с помощью среднего коэффициента эластичности;
д) оценить статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера;
е) оценить статистическую значимость параметров регрессии и корреляции.
3. Рассчитать параметры показательной парной регрессии. Оценить статистическую надежность указанной модели с помощью F-критерия Фишера.
4. Обосновано выбрать лучшую модель и рассчитать по ней прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости γ = 0,05.
Множественная регрессия и корреляция
Методические указания
Множественная регрессия – уравнение связи с несколькими переменными:
Где у – зависимая переменная (результативный признак);
-
независимые переменные (факторные
признаки).
Для построения уравнения множественной регрессии и корреляции используются некоторые функции:
-
Линейная -
;
-
Степенная -
;
-
Экспонента -
;
-
гипербола -
.
Для построения многофакторной модели можно использовать и другие функции, однако учитывая сложность оценки параметров множественной регрессии и еще более сложной интерпретации полученных оценок, чаще всего в практике используется линейная модель, реже степенная.
Оценка параметров уравнения регрессии производится с помощью метода наименьших квадратов (МНК). Для линейных уравнений и нелинейных (приводимых к линейным), строиться система нормальных уравнений, решение которой позволяет оценить параметры уравнения регрессии:
Решение данной системы производиться методом определителей:
Где Δ – общий определить системы;
Δа, Δbp – частные определители системы.
Δа, Δb, … , Δbр получаются путем замены соответствующего столбца матрицы общего определителя данной системы данными левой части системы.
Оценив параметры системы получаем уравнение множественной регрессии:
,
где у – зависимая переменная (результативный признак);
- независимые переменные (факторные признаки);
-
коэффициенты
«условно чистой» регрессии.
Коэффициенты
при
называются
коэффициентами «условно чистой»
регрессии. Они показывают среднее
изменение результата с изменением
соответствующего фактора на единицу
при неизменном значении других факторов,
закрепленных на среднем уровне.
Параметр а не подлежит экономической интерпретации.
Поскольку факторные признаки уравнения множественной регрессии имеют разные формы выражения, коэффициенты «условно чистой» регрессии не позволяют ранжировать факторы по силе влияния на результативный признак.
Поэтому в множественной корреляции и регрессии строиться другой вид уравнения – уравнение регрессии в стандартизированном масштабе.
где
стандартизированные
переменные;
-
стандартизированные коэффициенты
регрессии (бетта -коэффициента).
Для оценки параметров уравнения регрессии в стандартизированном масштабе, также применим МНК. Бетта-коэффициенты оцениваются при помощи следующей системы нормальных уравнений:
Стандартизированные коэффициенты имеют связь с коэффициентами «условно чистой» регрессии
Свободный член уравнения множественной регрессии определяется по следующей формуле:
Более понятной интерпретацию многофакторной модели позволяют сделать рассчитанные коэффициенты эластичности, которые показывают в процентном выражении, как измениться в среднем результативный показатель при изменении соответствующего факторного признака на 1 % от своего среднего уровня.
Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле:
Частные коэффициенты эластичности рассчитываются по следующей формуле:
Одним из главных этапов построения многофакторной корреляционно-регрессионной модели является оценка тесноты многофакторной связи, которая базируется на расчете матрицы парных линейных коэффициентов корреляции.
Тесноту совместного влияния факторов на результативный показатель позволяет оценить множественный коэффициент корреляции (индекс множественной корреляции). Который возможно рассчитать несколькими способами:
С помощью метода определителей, на основе матрицы коэффициентов корреляции путем деления определителя матрицы Δ* на общий определитель Δ:
На основе дисперсионного анализа:
Множественный коэффициент корреляции для уравнения регрессии в стандартизированном масштабе может быть оценен по формуле:
Множественный коэффициент корреляции лежит в пределах от 0 до 1 и должен быть больше или равен максимальному парному индексу корреляции
При решении проблемы отбора факторов, т.е. целесообразности включения в модель того или иного фактора используется частичные коэффициенты корреляции. Они характеризуют тесноту связи между результативным фактором и соответствующим факторным признаком, при устранении влияния других факторов включенных в уравнение регрессии.
Показатели частичной корреляции представляют собой отношение сокращения остаточной дисперсии, за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.
Частные коэффициенты
(индексы) корреляции, позволяют измерить
влияние фактора
на результативный показатель
у, при
неизменном уровне других факторов:
Множественный коэффициент детерминации
характеризует отношение части вариации результативного признака, объясненного за счет вариации, входящей в уравнение факторов к общей вариации результативного признака за счет всех факторов.
Скорректированный коэффициент (индекс) множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:
где n – число наблюдений
m- число факторных признаков в модели
Скорректированный
коэффициент
всегда ниже, чем нескорректированный.
Исключение слабого фактора всегда
снижает некорректируемый коэффициент
детерминации, поэтому мы не можем сделать
точный вывод о целесообразности
исключения данного фактора из модели
по R2.
Для
измерения тесноты связи результативного
фактора с каждым из фактических признаков
используются коэффициент
раздельной детерминации
:
Сумма коэффициентов раздельной детерминации равна множественному коэффициенту детерминации
Оценка
совместимости факторов в модели, т.е
насколько хорошо подобранны фактор и
если смысл рассматривать множественную
корреляцию и регрессию, позволяет
показатель
системного эффекта
:
Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:
Для оценки статистической значимости присутствия каждого их факторов в уравнении рассчитывается частный F-критерий. В общем виде для фактора xi частный F-критерий определиться как
Оценка значимости коэффициентов «условно чистой» регрессии с помощью t-критерия Стьюдента сводиться к вычислению значения
где mbi – средняя квадратическая ошибка коэффициента регрессии bi, она может быть определена как
