Добавил:
ДонАУиГС(Бывший ДонГУУ) Менеджмент производственной сферы (МП-20) Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Компьютерный практикум Анализ данных Вариант 3 Ответ

.docx
Скачиваний:
6
Добавлен:
22.12.2021
Размер:
175.96 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ ДНР

ГОУ ВПО «ДОНЕЦКАЯ АКАДЕМИЯ УПРАВЛЕНИЯ И ГОСУДАРСТВЕННОЙ СЛУЖБЫ ПРИ ГЛАВЕ ДНР»

Кафедра информационных технологий

Индивидуальная работа №1

по теме: «Анализ данных в MS EXCEL»

Вариант № 3

Выполнил: студент группы МП-20

Матвеев Р. А.

Проверил: к.э.н., доцент Стешенко И.В.

Донецк, 2021 год

Вариант 3

Имеются данные о потреблении электроэнергии цехом по месяцам (табл.1).

Задания

  1. Охарактеризовать совокупность данных потребления электроэнергии цехом.

  2. Определить взаимосвязь и взаимовлияние потребления электроэнергии цехом и номером месяца.

  3. Построить график зависимости потребления электроэнергии цехом от номера месяца, используя

  4. Установить функциональную зависимость между потреблением электроэнергии цехом и номером месяца. Проанализировать адекватность полученного уравнения. Сравнить результаты пунктов 3 и 4..

  5. Спрогнозировать потребления электроэнергии цехом для 10-го месяца.

  6. Спрогнозировать потребления электроэнергии цехом для 10-го; 11-го; 12-го месяцев.

Добавить данные об изменении тарифа на электроэнергию (табл.2).

  1. Выполнить задания п. 2, 4, 5, 6, учитывая зависимость потребления электроэнергии цехом от тарифа и номера месяца.

Сравнить спрогнозированные результаты для потребления электроэнергии цехом, полученные с учётом 1) месяца; 2) месяца и тарифа.

мес

Цех (тыс.кВт.ч)

1

1150,23

2

1154,35

3

1152,33

4

1160,67

5

1158,58

6

1155,26

7

1154,31

8

1154,64

9

1156,35

Табл. 1

мес

Тариф(грн/кВт.ч.)

Цех (тыс.кВт.ч)

1

0,016

1150,23

2

0,016

1154,35

3

0,016

1152,33

4

0,017

1160,67

5

0,017

1158,58

6

0,019

1155,26

7

0,02

1154,31

8

0,02

1154,64

9

0,021

1156,35

10

0,021

11

0,021

12

0,023

Табл. 2

1. Описательная статистика

Рис.1 Описательная статистика

Выполнена описательная характеристика совокупности данных потребления электроэнергии цехом. (Рисунок 1). При помощи Сервис – Анализ данных – Описательная характеристика.

2. Оценка взаимосвязи

2.1. Корреляция

Рис. 2 Корреляция

На рисунке 2 выполнена оценка взаимосвязи и взаимное влияние цеха от номера месяца. Коэффициент цеха равен 0,35 что находится далеко от единице, это значит, что слабая зависимость между данными величинами либо не линейная вовсе.

Рис. 3 Корреляция с учётом тарифа

- коэффициент корреляции номера месяца равен 1;

- тариф сильно связан с номером месяца, коэффициент равен 0,95

- цех слабо связан с номером месяца (всего) коэффициент корреляции равен 0,35;

- цех очень слабо связан с ценой на тариф (коэффициент корреляции 0,18);

2.2. Регрессия

Рис. 4 Регрессия

Цех = 0,398 + № месяца

у = 0,398 х – 1154,199

Для анализа адекватности полученного уравнения линейной регрессии в MS Excel используют параметры (см. рис. 4): коэффициент множественной корреляции (множественный R); коэффициент детерминации (R-квадрат); критерий Фишера (F-статистика); критерий Стьюдента (t-статистика).

Множественной корреляции R=0,350 говорит о слабой связи переменных ЦЕХА и НОМЕРА МЕСЯЦА. Характер этой связи пока неясен.

Величина квадрата R2(RI) составляет 0,12%, что говорит о том, что имеющиеся статистические данные с низкой степенью точности описаны полученным уравнением регрессии.

F-статистика (критерий Фишера) F=0,9812; df=1,7; p=2,958, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет 2,9%.

Значение t-статистики (критерий Стьюдента). В задаче для свободного члена t = 509,612;

p = 2,958, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена находится не близко к нулю. Для коэффициента при неизвестной t = 0,990; p=0,354, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,35%.

Таким образом, проанализировав все четыре вышеназванных параметра можно сделать вывод об адекватности полученного уравнения линейной регрессии.

2.3. Множественная линейная регрессия

Рис. 5 Множественная регрессия

По этим результатам может быть построено следующее уравнение регрессии:

CP = 2,441 х1 – 2919,230 х2 + 1195,528

или

y = 2,441 x1 – 2912,230 x2 + 1195,528

Коэффициент множественной корреляции R = 0,639 говорит о высокой степени связи переменных ТАРИФА и ЦЕХА. Однако, характер этой связи пока неясен.

Коэффициент детерминации R2(RI) 40,9%, что говорит о том, что имеющиеся статистические данные с высокой степенью точности могут быть описаны полученным уравнением регрессии.

F-статистика. Для задачи F = 2,076; df = 2,6; p = 5,492, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет 5,4%.

t-статистика t = 47,984; p = 5,492, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена маленькая, но не равна нулю. Для коэффициента при неизвестной t = 1,952; p = 0,098, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,09%. Для коэффициента при неизвестной t = -1,704; p = 0,139, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,13%.

3. График зависимости

Рис. 6 Линейная линия тренда

На рисунке 6 изображена линия тренда с параметрами «Линейная»

Рис. 7 Полиоминальная линия тренда 6-й степени

На рисунке 7 изображена линия тренда с параметрами «Полиоминальная» шестой степени. Эта линия тренда намного лучше описывает процесс, чем линейная так как R2 больше приближен к единице. А если быть точнее, то R2 =0,7.

Рис. 8 Линия тренда с прогнозом

На рисунке 8 изображена линия тренда с прогнозом потребления электроэнергии цехом для 10-го; 11-го; 12-го месяцев. Из рисунка 8 видно, что прогноз, который строится по предшествующим данным при увеличении количества месяцев, вычислено стабильное повышения потребление электроэнергии.

4. Предсказ

Рис. 9 Предсказ

На рисунке 9 сделан ПРЕДСКАЗ() для прогнозирования потребления электроэнергии цехом для 10-го; 11-го; 12-го месяцев. Ф

Рис. 11 Предсказ

Рис. 12 Формула предсказа

ункция ПРЕДСКАЗ() предназначена для расчета значений зависимой случайной величины по известным статистическим данным на основе линейного приближения методом наименьших квадратов.

5. Тенденция

Рис. 10 Тенденция

Используя массив и формулу ТЕНДЕНЦИЯ() (рис. 10) было спрогнозировано потребление электроэнергии цехом с учётом месяца и тарифа.