
эконометрика для очно-заочного 4 курс 2024-2025 год / ЛабРаб_Эконометрика_ 2023
.pdf
Как видно из отчетов Excel, для развитых и развивающихся стран наблюдается обратная связь между переменными. По шкале Чеддока значение по развитым странам попадает в категорию «заметная», по развивающимся странам попадает в категорию «слабая».
Задание 4.
Проверим значимость рассчитанных в задании 3 парных коэффициентов корреляции.
Расчетные и табличные значения t критерия Стъюдента при уровне значимости 0,05 представлены на рисунке 4.13.
Рис. 4.13. Проверка значимости коэффициентов корреляции
На основании представленной информации можно сделать вывод о том, по группе развивающихся стран связь между переменными «ожидаемая продолжительность жизни» и «уровень младенческих смертей» можно считать случайной с вероятностью не более 95%. По группе развитиях стран наблюдается статистическая обратная связь между переменными «ожидаемая продолжительность жизни» и «уровень младенческих смертей» с вероятностью не более 0,95%.
Задание 5.
В связи с тем, что на основании корреляционного анализа по группе развитых страны была подтверждена гипотеза о наличии статистически устойчивой связи между переменными «ожидаемая продолжительность жизни» и «уровень младенческих смертей» по данной группе стран можно построить модель парной регрессии.
Исследуя график разброса по развивающимся странам, можно сделать вывод о наличии аномальных значений. Это страны Индия, Пакистан, Китай, Нигерия, Эфиопия, Индонезия, Банглодэш. Как видно из рисунка 4.14 –это станы с высокой детской смертностью.
61

Рис. 4.14. Аномальные значения
Исключим аномальные значения, повторно перестроим график и проверим взаимосвязь между переменными (Рис. 4.15, 4.16). Как видно из рисунка 4.16 сила коэффициента корреляции по шкале Чеддока стало «заметной».
Рис. 4.15. Диаграмма разброса по развивающимся странам после исключения аномалий
Рис. 4.16. Матрица корреляций по группе развивающихся стран после исключения аномалий
62

Проверим значимость коэффициента корреляции по группе развивающихся стран после исключения аномалий. Число стран сократится до
109.
Расчетные и табличные значения t критерия Стъюдента при уровне значимости 0,05 представлены по группе развивающихся стран по исходным даннм и после исключения аномалий представлен на рисунке 4.17.
Рис. 4.17. Проверка значимости коэффициентов корреляции по группе развивающихся стран после исключения аномалий
Таким образом, по группе развитых и развивающихся стран была выявлена зависимость между показателями «ожидаемая продолжительность жизни» и «уровень младенческих смертей».
Построим модель парной регрессии по объединенной совокупности данных: по развитым и развивающимся странам без учета 6 стран, являющихся аномальными значениями. После исключения аномальных значений следует ожидать высокое качество построенной регрессионной модели.
Объем выборки составит 137 наблюдений.
Запишем спецификацию парной линейной регрессии в общем виде.
Задание 6. |
|
|
|
Запишем расширенную матрицу независимых переменных. Размерность |
|||
матрицы составит Х |
, поэтому в отчете представлен фрагмент матрицы. |
||
|
|
1 |
64 |
|
|
1 |
0 |
|
1 |
21 |
1 14
59,9
77,575,4
79,1
63
Осуществим операции с матрицами для нахождения параметров
регрессии. |
|
|
|
|
|
|
Найдем |
|
. Полученная матрица будет размерностью 2Х2. Запишем |
||||
выражение |
Excel, если |
расширенная |
матрица |
независимых переменных |
||
|
|
|
|
|
|
|
находится в ячейках D3:E139 как {=МУМНОЖ(ТРАНСП(D3:E139);D3:E139)}. |
||||||
|
|
|
|
Х 137 |
3545 |
|
|
Х |
Х |
3545 |
251245 |
Найдем . Полученная матрица будет размерностью 2Х2. Запишем выражение Excel, если матрица находится в ячейках B142:C143 как
{=МОБР(B142:C143))}.
|
|
0,01150 |
0,00016 |
0,00016 |
0,00001 |
Найдем . В результате получим вектор строку. Запишем выражение Excel, если расширенная матрица независимых переменных находится в ячейках D3:E139, а вектор-столбец зависимой переменной в ячейках С3:С139 как
{=МУМНОЖ(ТРАНСП(D3:E139);C3:C139)}.
Найдем |
|
|
|
. В результате∙ |
9781 258607 |
|
|||
|
|
|
|
|
получим вектор-столбец. Запишем |
||||
выражение |
|
|
|
|
находится в ячейках |
B145:C146, а |
|||
|
Excel, если матрица |
|
|
||||||
вектор-строка |
|
|
находится |
в |
ячейках |
E142:F142 как |
|||
|
|
|
|
|
|
|
|||
{=МУМНОЖ |
|
|
|
|
|
|
|
||
|
|
(B145:C146;E142:F142}. |
|
70,5 |
|
||||
|
|
|
|
|
|
|
|
|
|
Запишем модель |
|
|
0,0345 |
|
|||||
|
|
|
|
регрессии в явном виде |
|
||||
Полученные значения |
70,5 |
0,0345 |
|
||||||
|
|
|
|
|
параметров регрессии означают, что в среднем по |
странам средняя продолжительность жизни составляет 70,5 лет. При увеличении детской смертности на 1, продолжительность жизни увеличится на 0,0345.
Полученная модель противоречит выдвинутой гипотезе и результатам корреляционного анализа об отрицательной связи между переменными.
Задание 7.
64

Модель парной линейной регрессии по «развитым» и «развивающимся» странам, построенная с помощью надстройки «Анализ данных» представлена на рисунке 4.18
Рис. 4.18. Построение модели регрессии для решения задания 7, лабораторная работа 4
Как видно из рисунка 4.18, коэффициенты регрессии совпали с расчетами, осуществляемыми в задании 6.
Построим отдельно две модели регрессии по «развитым» и «развивающимся странам» и посмотрим на значение параметра (Рисунки 4.19, 4.20)
Модель по развитым странам примет вид: |
86 0,057 |
Рис. 4.19. Построение модели регрессии по группе развитых стран
65

Рис. 4.20. Построение модели регрессии по группе развитых стран
Модель по развивающимся странам примет вид: |
72 0,24 |
Таким образом, в среднем в развитых странах продолжительность жизни составляет 86 лет, а в развивающихся 72 года. При этом младенческая смертность больше влияет на среднюю продолжительность жизни в группе развивающихся стран.
Задание 8.
Проверим гипотезу о значимости параметров модели регрессии
построенной по объединённой выборке по двум группам стран |
|
|
70,5 |
||||||||||||||||
0,0345 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Расчетные |
значения |
|
t-статистики Стъюдента |
возьмем из |
отчета |
Excel |
|||||||||||||
(Рисунок |
4.18), столбец |
|
«t-статистика». |
Критическое |
значение |
критерия |
|||||||||||||
Стъюдента |
при |
уровне |
|
значимости |
0,05 определим |
выражением |
|||||||||||||
=СТЬЮДЕНТ.ОБР.2Х(0,05;135)=1,978 |
|
|
|
|
|
|
|
|
|
||||||||||
Для параметра |
|
расчетное |
значение критерия |
Стъюдента |
меньше |
||||||||||||||
табличного. Это |
означает, что нет оснований отвергнуть основную гипотезу |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
с |
вероятностью |
0,95% |
||||||
с вероятностью |
95%, то |
есть |
параметр регрессии |
||||||||||||||||
|
|
||||||||||||||||||
является незначимым, равным нулю. Параметр |
является |
значимым с |
|||||||||||||||||
вероятностью 0,95%. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
На основании |
|
p-Значения посмотрим при каком |
уровне |
значимости |
|||||||||||||||
параметр будет значимым. |
|
Значение |
0,126 |
, |
следовательно при уровне |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
значимости |
больше |
|
0,126 параметр |
|
будет значимым. Возьмем |
уровень |
|||||||||||||
значимости 0,13 (вероятность 87%). |
Критическое значение критерия Стъюдента |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
66 |
|
|
|
|
|
|
|
|
|

при уровне значимости 0,13 составит 1,523. С вероятностью не более 0,87 параметр будет значимым. Сопоставление расчетного значения критерия и табличного при различных уровнях значимости представлено на рисунке 4.21.
Рис. 4.21. проверка значимости параметра для решения задания 8, лабораторная работа 4
На основании рисунков |
4.19, 4.20можно сделать вывод о значимости |
||||||||||||||
параметров моделей |
|
86 |
0,057 ; 72 |
0,24 |
с вероятностью 95%. |
||||||||||
Проверим |
|
|
|
|
|||||||||||
|
|
|
гипотезу о значимости параметров модели регрессии |
||||||||||||
построенной по объединённой выборке по двум группам стран |
|
70,5 |
|||||||||||||
0,0345 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Расчетные значения F-статистики Фишера |
возьмем из |
отчета |
Excel |
||||||||||||
(Рисунок |
4.18), дисперсионные |
анализ, столбец |
|
«F». Критическое значение |
|||||||||||
критерия |
Фишера |
при |
уровне |
значимости |
0,05 определим |
выражением |
|||||||||
=FРАСПОБР(0,05;1;135)=3,91 |
|
|
|
|
|
|
|
|
|
||||||
Для модели |
|
|
70,5 |
0,0345 |
расчетное значение критерия Фишера |
||||||||||
меньше табличного. |
|
|
|
|
|
|
|
||||||||
|
|
|
|
Это означает, что нет оснований отвергнуть основную |
|||||||||||
гипотезу |
|
с вероятностью 95%, то модель регрессии с вероятностью 0,95% |
|||||||||||||
является |
незначимой. |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
На основании «Значимость F» посмотрим, при каком уровне значимости |
|||||||||||||||
модель будет значимой. |
Значимость 0,126 |
, |
следовательно при уровне |
||||||||||||
значимости больше 0,126 |
|
|
|
|
|
||||||||||
|
|
|
|
|
|
модель будет значимой. Возьмем уровень значимости |
0,13 (вероятность 87%). Критическое значение критерия Фишера при уровне значимости 0,13 составит 2,32. С вероятностью не более 0,87 модель будет значимой. Сопоставление расчетного значения критерия и табличного при различных уровнях значимости представлено на рисунке 4.22.
67

Рис. 4.22. проверка значимости модели |
для решения |
задания 8, |
||||
лабораторная работа 4 |
|
|
|
|
|
|
На основании рисунков |
4.19, |
4.20можно сделать вывод о значимости |
||||
моделей |
0,057 ; |
72 |
0,24 |
с вероятностью 95%. |
|
|
Задание86 |
|
|
|
|||
9. |
|
|
|
|
|
|
Рассчитаем |
значения |
коэффициента |
эластичности |
переменной |
«Ожидаемая продолжительность жизни» по переменной «Уровень младенческих смертей». Результаты расчетов представлены в таблице 4.3
Таблица 4.3 -Расчет коэффициента эластичности для задания 9 лабораторная работа 4
Группа стран/ модель |
|
|
|
Э |
||
Развитые |
|
|||||
Развивающиеся |
81,3 |
|
73,5 |
-0,057 |
||
|
86 |
0,057 |
|
|
|
|
|
72 |
0,24 |
68,8 |
|
13,7 |
-0,240 |
На основании таблицы 4.3 можно сделать вывод о том, что если уровень младенческой смертности увеличится на 1%, то ожидаемая продолжительность жизни уменьшится для развитых стран на 0,052%, а для развивающихся на
0,048%.
Задание 10.
Воспользуемся отчетами Excel Регрессионная« статистика» и «Дисперсионный анализ» для оценки качества регрессионных моделей по обобщенной выборке и по группам развитых и развивающихся стран (рисунки 4.18,4.19,4.20) Сведем информационные характеристики качества в таблицу 4.4.
Из таблицы 4.4 видно, что качество модели по объединенной выборке очень низкое и использовать такую модель для решения задач бизнес-аналитики нельзя. При рассмотрении моделей для двух групп стран видно, что единственный фактор «Уровень младенческой смертности» объясняет
68

«Ожидаемую продолжительность жизни» всего на 29%. То есть необходимо определить дополнительные факторы, которые могут влиять на «Ожидаемую продолжительность жизни».
Таблица 4.4 - Сравнительные информационные характеристики регрессионных моделей
|
|
|
Информационные характеристики модели |
|||
Вид оцененных моделей |
|
R2 (R2adj) |
|
|
||
|
регрессии |
s/MSE |
|
F-статистика |
||
|
|
|
|
|
|
|
Развитые |
|
3,718 |
0,287(0,259) |
10,45 |
||
|
|
|
|
|
|
|
Развивающиеся |
6,824 |
0,293(0,286) |
44 |
|||
|
86 |
0,057 |
|
|
|
|
Развитые и |
0,24 |
8,954 |
0,017(0,010) |
2,37 |
||
|
72 |
|
|
|
|
|
развивающиеся |
|
|
|
|
||
|
70,5 |
0,0345 |
|
|
|
|
69
Подготовка отчета и оценка лабораторных работ
Лабораторная работа оформляется в виде отчета в виде документа Word и сдается преподавателю в печатном виде,
Документ Word оформленным в соответствии с правилами оформления письменных работ ГУУ должен соответствовать всем требованиям, предъявляемым к оформлению работ. Все диаграммы, расчеты и отчеты Excel должны быть подписаны и читаться без пояснений. Дополнительно для пояснения работы могут использоваться сводные таблицы и диаграммы.
Защита лабораторных работ осуществляется на занятиях. Для защиты
обучающийся должен иметь файл Excel, где он производил расчеты. |
|
|||
Оценка лабораторных работ приводится в таблице 5.1 |
|
|
||
Таблица 5.1 – Оценка лабораторных работ в баллах |
|
|
||
Номер |
Максимальный балл с |
Минимальный |
балл, |
при |
лабораторной |
учетом защиты работы |
котором работа |
считается |
|
работы |
|
зачтенной |
|
|
1 |
5 |
2 |
|
|
2 |
9 |
3 |
|
|
3 |
8 |
3 |
|
|
4 |
15 |
4 |
|
|
Всего |
37 |
12 |
|
|
При описании задания лабораторной работы устанавливаются примерные баллы за выполнение каждого задания. Однако, баллы за лабораторную работу выставляются по совокупности ее выполнения и защиты. В методических указаниях приводится пример выполнения лабораторной работы. Этот пример назовем термином «шаблон». Если обучающийся выполняет лабораторную работу, полностью копируя слова из «шаблона» при условии умения защитить лабораторную работу, он получает средние значения баллов. Максимальный балл получают студенты, которые могут представить оригинальный текст лабораторной работы, оригинальное исследование и выводы. Обучающийся, который предоставил материалы преподавателю, но не ориентируется в работе при защите, получает минимальный балл за работу. Также минимальный балл получают обучающиеся, которые предоставили отчеты по шаблону без защиты.
Перечислим основные критерии по которым оценивается защита лабораторной работы.
1. Умение обосновать расчеты, представленные в отчете Word с помощью расчетов в Excel.
2.Умение детализировать расчеты на листах Excel.
3.Знание теоретического материала для обоснования выводов
лабораторной работы.
70