Добавил:
ДонАУиГС(Бывший ДонГУУ) Менеджмент производственной сферы (МП-20) Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Компьютерный практикум Анализ данных Вариант 5 Ответ

.docx
Скачиваний:
2
Добавлен:
22.12.2021
Размер:
283.35 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ ДНР

ГОУ ВПО «ДОНЕЦКАЯ АКАДЕМИЯ УПРАВЛЕНИЯ И ГОСУДАРСТВЕННОЙ СЛУЖБЫ ПРИ ГЛАВЕ ДНР»

КАФЕДРА ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Индивидуальная работа №1

по теме: «Анализ данных в MS EXCEL»

Вариант № 5

Выполнил: студент группы МП-20

Пыхтина О.А.

Проверил: к.э.н., доцент Стешенко И.В.

Донецк, 2021 год

Оглавление

1. Описательная характеристика 4

­2. Оценка взаимосвязи 4

2.1. Корреляция 4

2.2. Регрессия 5

2.3. Множественная линейная регрессия 8

3. график зависимости. Линии тренда 9

4. Прогноз объёма производства 12-ти; 14-ти; 15-ти работников. При помощи ПРЕДСКАЗ() 11

5. Прогноз объёма производства 12-ти; 14-ти; 15-ти работников. При помощи ТЕНДЕНЦИЯ() 13

Задание

Рис. 1 Описательная характеристика

1. Описательная характеристика

Выполнена описательная характеристика совокупности данных объема производства.

(Рисунок 1). При помощи Сервис – Анализ данных – Описательная характеристика.

Рис. 2 Корреляция

­2. Оценка взаимосвязи

2.1. Корреляция

Рис. 3 Множественная корреляция

Н а рисунке 2 выполнена оценка взаимосвязи и взаимное влияние объема производства от количества работников. Объем производства равен 0,88 что находится близко к единице, это значит, что сильная зависимость между данными величинами почти линейная.

- коэффициент корреляции количества работников равен 1;

- объем производства сильно связан с Количеством работников (всего) коэффициент корреляции равен 0,89;

- объем производства средне связан с количеством работников с большим стажем в меньшей степени (коэффициент корреляции 0,63);

2.2. Регрессия

Рис. 4 Регрессия

Объём производства = 24,585х + Количество работников

у = 24,585х + 327,995

Для анализа адекватности полученного уравнения линейной регрессии в MS Excel используют параметры (см. рис. 4): коэффициент множественной корреляции (множественный R); коэффициент детерминации (R-квадрат); критерий Фишера (F-статистика); критерий Стьюдента (t-статистика).

Коэффициент множественной корреляции R позволяет оценить тесноту вероятностной связи между зависимой и независимой переменными. Высокое значение этой величины свидетельствует о сильной связи между переменными (при равенстве R=1 – связь функциональная). Таким образом, величина R=0,886 говорит о высокой степени связи переменных КОЛИЧЕСТВО РАБОТНИКОВ и ОБЪЕМ ПРОИЗВОДСТВА. Однако, характер этой связи пока неясен.

Величина квадрата коэффициента множественной корреляции или коэффициент детерминации R2(RI) показывает долю общего разброса (относительно выборочного среднего зависимой переменной), которая объясняется построенной регрессией. Иными словами, данная величина показывает, разброс какой части полученных экспериментальных данных (зависимая переменная) соответствует полученному уравнению линейной регрессии. В задаче эта величина составляет 78,5%, что говорит о том, что имеющиеся статистические данные с достаточно высокой степенью точности могут быть описаны полученным уравнением регрессии.

F-статистика (критерий Фишера) используется для оценки значимости полученной линейной зависимости, то есть, он подтверждает или опровергает гипотезу о существовании линейной зависимости. Если полученное значение F-критерия выше критического Fкр, то гипотеза о незначимости линейной зависимости отвергается. Величина Fкр должна быть получена из специальных таблиц в соответствии с числом степеней свободы df. Однако в окне рис. 4 приведено значение величины p – уровня значимости, показывающего вероятность непринятия верной гипотезы. Иными словами, если выдвинута гипотеза о незначимости линейной зависимости, то если уровень значимости p стремится к единице, то между переменными (зависимой и независимой) не существует линейной зависимости (гипотеза принимается), и, наоборот, если p стремится к нулю, то гипотеза отвергается (между переменными существует линейная зависимость). Для задачи F=25,658; df=1,7; p=0,00011, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет всего 0,011%.

Значение t-статистики (критерий Стьюдента) используется для оценки значимостей коэффициента при неизвестной и свободного члена полученной линейной зависимости. Если полученное значение t-критерия выше критического tкр, то гипотеза о незначимости свободного члена линейной зависимости отвергается. Аналогично как уровню значимости F-критерия, для t-критерия также приведено значение величины p – уровня значимости, показывающего вероятность непринятия верной гипотезы. В задаче 1 для свободного члена t=7,76885; p=0,00011, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена практически равна нулю. Для коэффициента при неизвестной t=5,06538; p=0,001454, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,16%.

Таким образом, проанализировав все четыре вышеназванных параметра можно сделать вывод об адекватности полученного уравнения линейной регрессии.

Рис. 5 Множественная регрессия

2 .3. Множественная линейная регрессия

По этим результатам может быть построено следующее уравнение регрессии:

CP = 20,967х1 + 13,399х2 + 332,149

или

y = 20,967x1 + 13,399x2 + 332,149

Коэффициент множественной корреляции R =0,923 говорит о высокой степени связи переменных КОЛИЧЕСТВО РАБОТНИКОВ С БОЛЬШИМ СТАЖЕМ и ОБЪЕМ ПРОИЗВОДСТВА. Однако, характер этой связи пока неясен.

Коэффициент детерминации R2(RI) 85,2%, что говорит о том, что имеющиеся статистические данные с высокой степенью точности могут быть описаны полученным уравнением регрессии.

F-статистика. Для задачи F=17,361; df=2,6; p=0,00012, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет всего 0,012%.

t-статистика t=8,76576; p=0,00012, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена практически равна нулю. Для коэффициента при неизвестной t=4,30795; p=0,00505, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,5%.

Рис. 6 Линейная линия тренда

3. график зависимости. Линии тренда

На рисунке 6 изображена линия тренда с параметрами «Линейная»

Рис. 7 Полиоминальная линия тренда

На рисунке 7 изображена линия тренда с параметрами «Полиоминальная» степень 2. Эта линия тренда лучше описывает процесс, чем линейная так как R2 больше приближен к единице. А если быть точнее, то R2 =0,8.

Рис. 8 Прогнозирование

Рис. 9 Прогнозирование

На рисунке 8 изображена линия тренда с прогнозом объема производства для 12-ти работников предприятия.

На рисунке 9 изображена линия тренда с прогнозом объема производства для 12-ти, 14-ти и 15-ти работников предприятия. Из рисунка 8 и 9 видно, что прогноз, который строится по предшествующим данным при повышении количества работников, показывает повышения объема производства на предприятии.

Рис. 10 Формула предсказа

Рис. 9 Предсказ

4. Прогноз объёма производства 12-ти; 14-ти; 15-ти работников. При помощи ПРЕДСКАЗ()

На рисунке 9 сделан ПРЕДСКАЗ() для прогнозирования объема производства при 12-ом, 14-ом и 15-ом работнике предприятия. Формулы показаны на рисунке 10.

Рис. 11 Предсказ

Рис. 12 Формула предсказа

Функция ПРЕДСКАЗ() предназначена для расчета значений зависимой случайной величины по известным статистическим данным на основе линейного приближения методом наименьших квадратов и имеет следующий синтаксис:

На рисунке 11 выполнен ПРЕДСКАЗ() для прогнозирования объема производства при учете работников с большим стажем. Формулы показаны на рисунке 12. Из этого можно сделать вывод, что прогнозируемый объем производства будет больше при учете всех работников в данном случае 12-ом, 14-ом и 15-ом работнике предприятия.

Тем временем при учёте лишь количества работников с большим стажем, можно сказать что прогнозируемый объем производства уменьшился. Поэтому 1й вариант будет в этом случае выгоднее, чем второй.

Рис. 13 Тенденция

Рис. 14 Формула тенденции

5. Прогноз объёма производства 12-ти; 14-ти; 15-ти работников. При помощи ТЕНДЕНЦИЯ()

Используя массив и формулу ТЕНДЕНЦИЯ() (рис. 13 и рис. 14) был спрогнозирован объем производства учитывая данные количества работников и количества работников со стажем. Объем производства увеличился на примерно 100 единиц исходя из прошлых данных прогнозирования.