Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
2
Добавлен:
19.01.2025
Размер:
6.84 Mб
Скачать

Как видно из отчетов Excel, для развитых и развивающихся стран наблюдается обратная связь между переменными. По шкале Чеддока значение по развитым странам попадает в категорию «заметная», по развивающимся странам попадает в категорию «слабая».

Задание 4.

Проверим значимость рассчитанных в задании 3 парных коэффициентов корреляции.

Расчетные и табличные значения t критерия Стъюдента при уровне значимости 0,05 представлены на рисунке 4.13.

Рис. 4.13. Проверка значимости коэффициентов корреляции

На основании представленной информации можно сделать вывод о том, по группе развивающихся стран связь между переменными «ожидаемая продолжительность жизни» и «уровень младенческих смертей» можно считать случайной с вероятностью не более 95%. По группе развитиях стран наблюдается статистическая обратная связь между переменными «ожидаемая продолжительность жизни» и «уровень младенческих смертей» с вероятностью не более 0,95%.

Задание 5.

В связи с тем, что на основании корреляционного анализа по группе развитых страны была подтверждена гипотеза о наличии статистически устойчивой связи между переменными «ожидаемая продолжительность жизни» и «уровень младенческих смертей» по данной группе стран можно построить модель парной регрессии.

Исследуя график разброса по развивающимся странам, можно сделать вывод о наличии аномальных значений. Это страны Индия, Пакистан, Китай, Нигерия, Эфиопия, Индонезия, Банглодэш. Как видно из рисунка 4.14 –это станы с высокой детской смертностью.

61

Рис. 4.14. Аномальные значения

Исключим аномальные значения, повторно перестроим график и проверим взаимосвязь между переменными (Рис. 4.15, 4.16). Как видно из рисунка 4.16 сила коэффициента корреляции по шкале Чеддока стало «заметной».

Рис. 4.15. Диаграмма разброса по развивающимся странам после исключения аномалий

Рис. 4.16. Матрица корреляций по группе развивающихся стран после исключения аномалий

62

Проверим значимость коэффициента корреляции по группе развивающихся стран после исключения аномалий. Число стран сократится до

109.

Расчетные и табличные значения t критерия Стъюдента при уровне значимости 0,05 представлены по группе развивающихся стран по исходным даннм и после исключения аномалий представлен на рисунке 4.17.

Рис. 4.17. Проверка значимости коэффициентов корреляции по группе развивающихся стран после исключения аномалий

Таким образом, по группе развитых и развивающихся стран была выявлена зависимость между показателями «ожидаемая продолжительность жизни» и «уровень младенческих смертей».

Построим модель парной регрессии по объединенной совокупности данных: по развитым и развивающимся странам без учета 6 стран, являющихся аномальными значениями. После исключения аномальных значений следует ожидать высокое качество построенной регрессионной модели.

Объем выборки составит 137 наблюдений.

Запишем спецификацию парной линейной регрессии в общем виде.

Задание 6.

 

 

 

Запишем расширенную матрицу независимых переменных. Размерность

матрицы составит Х

, поэтому в отчете представлен фрагмент матрицы.

 

 

1

64

 

 

1

0

 

1

21

1 14

59,9

77,575,4

79,1

63

Осуществим операции с матрицами для нахождения параметров

регрессии.

 

 

 

 

 

 

Найдем

 

. Полученная матрица будет размерностью 2Х2. Запишем

выражение

Excel, если

расширенная

матрица

независимых переменных

 

 

 

 

 

 

находится в ячейках D3:E139 как {=МУМНОЖ(ТРАНСП(D3:E139);D3:E139)}.

 

 

 

 

Х 137

3545

 

Х

Х

3545

251245

Найдем . Полученная матрица будет размерностью 2Х2. Запишем выражение Excel, если матрица находится в ячейках B142:C143 как

{=МОБР(B142:C143))}.

 

 

0,01150

0,00016

0,00016

0,00001

Найдем . В результате получим вектор строку. Запишем выражение Excel, если расширенная матрица независимых переменных находится в ячейках D3:E139, а вектор-столбец зависимой переменной в ячейках С3:С139 как

{=МУМНОЖ(ТРАНСП(D3:E139);C3:C139)}.

Найдем

 

 

 

. В результате

9781 258607

 

 

 

 

 

 

получим вектор-столбец. Запишем

выражение

 

 

 

 

находится в ячейках

B145:C146, а

 

Excel, если матрица

 

 

вектор-строка

 

 

находится

в

ячейках

E142:F142 как

 

 

 

 

 

 

 

{=МУМНОЖ

 

 

 

 

 

 

 

 

 

(B145:C146;E142:F142}.

 

70,5

 

 

 

 

 

 

 

 

 

 

Запишем модель

 

 

0,0345

 

 

 

 

 

регрессии в явном виде

 

Полученные значения

70,5

0,0345

 

 

 

 

 

 

параметров регрессии означают, что в среднем по

странам средняя продолжительность жизни составляет 70,5 лет. При увеличении детской смертности на 1, продолжительность жизни увеличится на 0,0345.

Полученная модель противоречит выдвинутой гипотезе и результатам корреляционного анализа об отрицательной связи между переменными.

Задание 7.

64

Модель парной линейной регрессии по «развитым» и «развивающимся» странам, построенная с помощью надстройки «Анализ данных» представлена на рисунке 4.18

Рис. 4.18. Построение модели регрессии для решения задания 7, лабораторная работа 4

Как видно из рисунка 4.18, коэффициенты регрессии совпали с расчетами, осуществляемыми в задании 6.

Построим отдельно две модели регрессии по «развитым» и «развивающимся странам» и посмотрим на значение параметра (Рисунки 4.19, 4.20)

Модель по развитым странам примет вид:

86 0,057

Рис. 4.19. Построение модели регрессии по группе развитых стран

65

Рис. 4.20. Построение модели регрессии по группе развитых стран

Модель по развивающимся странам примет вид:

72 0,24

Таким образом, в среднем в развитых странах продолжительность жизни составляет 86 лет, а в развивающихся 72 года. При этом младенческая смертность больше влияет на среднюю продолжительность жизни в группе развивающихся стран.

Задание 8.

Проверим гипотезу о значимости параметров модели регрессии

построенной по объединённой выборке по двум группам стран

 

 

70,5

0,0345

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчетные

значения

 

t-статистики Стъюдента

возьмем из

отчета

Excel

(Рисунок

4.18), столбец

 

«t-статистика».

Критическое

значение

критерия

Стъюдента

при

уровне

 

значимости

0,05 определим

выражением

=СТЬЮДЕНТ.ОБР.2Х(0,05;135)=1,978

 

 

 

 

 

 

 

 

 

Для параметра

 

расчетное

значение критерия

Стъюдента

меньше

табличного. Это

означает, что нет оснований отвергнуть основную гипотезу

 

 

 

 

 

 

 

 

 

 

 

 

с

вероятностью

0,95%

с вероятностью

95%, то

есть

параметр регрессии

 

 

является незначимым, равным нулю. Параметр

является

значимым с

вероятностью 0,95%.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

На основании

 

p-Значения посмотрим при каком

уровне

значимости

параметр будет значимым.

 

Значение

0,126

,

следовательно при уровне

 

 

 

 

 

 

 

 

 

 

 

 

 

значимости

больше

 

0,126 параметр

 

будет значимым. Возьмем

уровень

значимости 0,13 (вероятность 87%).

Критическое значение критерия Стъюдента

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

66

 

 

 

 

 

 

 

 

 

при уровне значимости 0,13 составит 1,523. С вероятностью не более 0,87 параметр будет значимым. Сопоставление расчетного значения критерия и табличного при различных уровнях значимости представлено на рисунке 4.21.

Рис. 4.21. проверка значимости параметра для решения задания 8, лабораторная работа 4

На основании рисунков

4.19, 4.20можно сделать вывод о значимости

параметров моделей

 

86

0,057 ; 72

0,24

с вероятностью 95%.

Проверим

 

 

 

 

 

 

 

гипотезу о значимости параметров модели регрессии

построенной по объединённой выборке по двум группам стран

 

70,5

0,0345

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчетные значения F-статистики Фишера

возьмем из

отчета

Excel

(Рисунок

4.18), дисперсионные

анализ, столбец

 

«F». Критическое значение

критерия

Фишера

при

уровне

значимости

0,05 определим

выражением

=FРАСПОБР(0,05;1;135)=3,91

 

 

 

 

 

 

 

 

 

Для модели

 

 

70,5

0,0345

расчетное значение критерия Фишера

меньше табличного.

 

 

 

 

 

 

 

 

 

 

 

Это означает, что нет оснований отвергнуть основную

гипотезу

 

с вероятностью 95%, то модель регрессии с вероятностью 0,95%

является

незначимой.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

На основании «Значимость F» посмотрим, при каком уровне значимости

модель будет значимой.

Значимость 0,126

,

следовательно при уровне

значимости больше 0,126

 

 

 

 

 

 

 

 

 

 

 

модель будет значимой. Возьмем уровень значимости

0,13 (вероятность 87%). Критическое значение критерия Фишера при уровне значимости 0,13 составит 2,32. С вероятностью не более 0,87 модель будет значимой. Сопоставление расчетного значения критерия и табличного при различных уровнях значимости представлено на рисунке 4.22.

67

Рис. 4.22. проверка значимости модели

для решения

задания 8,

лабораторная работа 4

 

 

 

 

 

На основании рисунков

4.19,

4.20можно сделать вывод о значимости

моделей

0,057 ;

72

0,24

с вероятностью 95%.

 

Задание86

 

 

 

9.

 

 

 

 

 

 

Рассчитаем

значения

коэффициента

эластичности

переменной

«Ожидаемая продолжительность жизни» по переменной «Уровень младенческих смертей». Результаты расчетов представлены в таблице 4.3

Таблица 4.3 -Расчет коэффициента эластичности для задания 9 лабораторная работа 4

Группа стран/ модель

 

 

 

Э

Развитые

 

Развивающиеся

81,3

 

73,5

-0,057

 

86

0,057

 

 

 

 

 

72

0,24

68,8

 

13,7

-0,240

На основании таблицы 4.3 можно сделать вывод о том, что если уровень младенческой смертности увеличится на 1%, то ожидаемая продолжительность жизни уменьшится для развитых стран на 0,052%, а для развивающихся на

0,048%.

Задание 10.

Воспользуемся отчетами Excel Регрессионная« статистика» и «Дисперсионный анализ» для оценки качества регрессионных моделей по обобщенной выборке и по группам развитых и развивающихся стран (рисунки 4.18,4.19,4.20) Сведем информационные характеристики качества в таблицу 4.4.

Из таблицы 4.4 видно, что качество модели по объединенной выборке очень низкое и использовать такую модель для решения задач бизнес-аналитики нельзя. При рассмотрении моделей для двух групп стран видно, что единственный фактор «Уровень младенческой смертности» объясняет

68

«Ожидаемую продолжительность жизни» всего на 29%. То есть необходимо определить дополнительные факторы, которые могут влиять на «Ожидаемую продолжительность жизни».

Таблица 4.4 - Сравнительные информационные характеристики регрессионных моделей

 

 

 

Информационные характеристики модели

Вид оцененных моделей

 

R2 (R2adj)

 

 

 

регрессии

s/MSE

 

F-статистика

 

 

 

 

 

 

Развитые

 

3,718

0,287(0,259)

10,45

 

 

 

 

 

 

Развивающиеся

6,824

0,293(0,286)

44

 

86

0,057

 

 

 

 

Развитые и

0,24

8,954

0,017(0,010)

2,37

 

72

 

 

 

 

развивающиеся

 

 

 

 

 

70,5

0,0345

 

 

 

 

69

Подготовка отчета и оценка лабораторных работ

Лабораторная работа оформляется в виде отчета в виде документа Word и сдается преподавателю в печатном виде,

Документ Word оформленным в соответствии с правилами оформления письменных работ ГУУ должен соответствовать всем требованиям, предъявляемым к оформлению работ. Все диаграммы, расчеты и отчеты Excel должны быть подписаны и читаться без пояснений. Дополнительно для пояснения работы могут использоваться сводные таблицы и диаграммы.

Защита лабораторных работ осуществляется на занятиях. Для защиты

обучающийся должен иметь файл Excel, где он производил расчеты.

 

Оценка лабораторных работ приводится в таблице 5.1

 

 

Таблица 5.1 – Оценка лабораторных работ в баллах

 

 

Номер

Максимальный балл с

Минимальный

балл,

при

лабораторной

учетом защиты работы

котором работа

считается

работы

 

зачтенной

 

 

1

5

2

 

 

2

9

3

 

 

3

8

3

 

 

4

15

4

 

 

Всего

37

12

 

 

При описании задания лабораторной работы устанавливаются примерные баллы за выполнение каждого задания. Однако, баллы за лабораторную работу выставляются по совокупности ее выполнения и защиты. В методических указаниях приводится пример выполнения лабораторной работы. Этот пример назовем термином «шаблон». Если обучающийся выполняет лабораторную работу, полностью копируя слова из «шаблона» при условии умения защитить лабораторную работу, он получает средние значения баллов. Максимальный балл получают студенты, которые могут представить оригинальный текст лабораторной работы, оригинальное исследование и выводы. Обучающийся, который предоставил материалы преподавателю, но не ориентируется в работе при защите, получает минимальный балл за работу. Также минимальный балл получают обучающиеся, которые предоставили отчеты по шаблону без защиты.

Перечислим основные критерии по которым оценивается защита лабораторной работы.

1. Умение обосновать расчеты, представленные в отчете Word с помощью расчетов в Excel.

2.Умение детализировать расчеты на листах Excel.

3.Знание теоретического материала для обоснования выводов

лабораторной работы.

70