Добавил:
ДонАУиГС(Бывший ДонГУУ) Менеджмент производственной сферы (МП-20) Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Компьютерный практикум Анализ данных Вариант 6 Ответ

.docx
Скачиваний:
2
Добавлен:
22.12.2021
Размер:
217.9 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ ДНР

ГОУ ВПО «ДОНЕЦКАЯ АКАДЕМИЯ УПРАВЛЕНИЯ И ГОСУДАРСТВЕННОЙ СЛУЖБЫ ПРИ ГЛАВЕ ДНР»

Кафедра информационных технологий

Индивидуальная работа №1

по теме: «Анализ данных в MS EXCEL»

Вариант № 6

Выполнил: студент группы МП-20

Гончарова Т.А.

Проверил: к.э.н., доцент Стешенко И.В.

Донецк, 2021 год

Оглавление

1. Описательная статистика 5

2. Оценка взаимосвязи 5

2.1. Корреляция 5

2.2. Регрессия 6

2.3. Множественная линейная регрессия 8

3. Графики зависимостей 9

4. Предсказ 10

5. Тенденция 11

1. Описательная статистика

Рис. 1 Описательная статистика

Выполнена описательная статистика совокупности данных недельной прибыли.

(Рисунок 1). При помощи Данные – Сервис – Анализ данных – Описательная статистика.

2. Оценка взаимосвязи

2.1. Корреляция

Рис. 2 Корреляция

На рисунке 2 выполнена оценка взаимосвязи и взаимное влияние Недельной прибыли от цены. Недельная прибыль к цене, равна -0,9 что находится меньше нуля, это значит, что зависимость между данными величинами очень слабая, либо не носит линейного характера совсем.

Рис. 3 Корреляция с учетом объема продаж

- коэффициент корреляции цены равен 1;

- объем продаж не связан с ценой, коэффициент корреляции равен -0,42;

- недельная прибыль не связана с ценой и равняется -0,92

- недельная прибыль средне связана с объемом продаж (коэффициент корреляции 0,44);

2.2. Регрессия

Рис. 4 Регрессия

Недельная прибыль = -0,590х + Цена

у = -0,590х + 222,385

Для анализа адекватности полученного уравнения линейной регрессии в MS Excel используют параметры (см. рис. 4): коэффициент множественной корреляции (множественный R); коэффициент детерминации (R-квадрат); критерий Фишера (F-статистика); критерий Стьюдента (t-статистика).

Коэффициент множественной корреляции R позволяет оценить тесноту вероятностной связи между зависимой и независимой переменными. Высокое значение этой величины свидетельствует о сильной связи между переменными (при равенстве R=1 – связь функциональная). Таким образом, величина R=0,922 говорит о слабой степени связи переменных ЦЕНА и НЕДЕЛЬНАЯ ПРИБЫЛЬ. Однако, характер этой связи пока неясен.

Величина квадрата коэффициента множественной корреляции или коэффициент детерминации R2(RI) показывает долю общего разброса (относительно выборочного среднего зависимой переменной), которая объясняется построенной регрессией. Иными словами, данная величина показывает, разброс какой части полученных экспериментальных данных (зависимая переменная) соответствует полученному уравнению линейной регрессии. В задаче эта величина составляет 85,1%, что говорит о том, что имеющиеся статистические данные с высокой степенью точности описаны полученным уравнением регрессии.

F-статистика (критерий Фишера) используется для оценки значимости полученной линейной зависимости, то есть, он подтверждает или опровергает гипотезу о существовании линейной зависимости. Если полученное значение F-критерия выше критического Fкр, то гипотеза о незначимости линейной зависимости отвергается. Величина Fкр должна быть получена из специальных таблиц в соответствии с числом степеней свободы df. Для задачи F=22,969; df=1,4; p=2,577, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет 2,5%.

Значение t-статистики (критерий Стьюдента) используется для оценки значимостей коэффициента при неизвестной и свободного члена полученной линейной зависимости. Если полученное значение t-критерия выше критического tкр, то гипотеза о незначимости свободного члена линейной зависимости отвергается. Аналогично как уровню значимости F-критерия, для t-критерия также приведено значение величины p – уровня значимости, показывающего вероятность непринятия верной гипотезы. В задаче для свободного члена t=21,891; p=2,577, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена находится близко к нулю. Для коэффициента при неизвестной t= -4,792; p=0,008, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,008%.

Таким образом, проанализировав все четыре вышеназванных параметра можно сделать вывод об адекватности полученного уравнения линейной регрессии.

2.3. Множественная линейная регрессия

Рис. 5 Множественная линейная регрессия

По этим результатам может быть построено следующее уравнение регрессии:

CP = -0,570х1 + 0,029х2 + 206,717

или

y = -0,570x1 + 0,029x2 + 206,717

Коэффициент множественной корреляции R =0,925 говорит о средней степени связи переменных ОБЪЕМА ПРОДАЖ и НЕДЕЛЬНОЙ ПРИБЫЛИ. Однако, характер этой связи пока неясен.

Коэффициент детерминации R2(RI) 76,0%, что говорит о том, что имеющиеся статистические данные с низкой степенью точности могут быть описаны полученным уравнением регрессии.

F-статистика. Для задачи F=8,924; df=2,3; p=0,029, вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет 0,02%.

t-статистика t=3,906; p=0,029, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена практически равна нулю. Для коэффициента при неизвестной t= -3,701; p=0,034, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,03%. Для коэффициента при неизвестной t= 0,303; p=0,781, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,78%.

3. Графики зависимостей

Рис. 6 Линейная линия тренда

Рис. 7 Полиоминальная линия тренда 4-й степени

На рисунке 7 изображена полиоминальная линия тренда четвёртой степени. Эта линия тренда лучше описывает процесс, чем линейная так как R2 больше приближен к единице по сравнению с линейной. А если быть точнее, то R2 =0,9

Рис. 8 Прогноз

На рисунке 8 изображена линия тренда с прогнозом для цены $100, $99 и $98. Из рисунка видно, что прогноз, который строится по предшествующим данным при уменьшении цены, показывает цену в обратно направлении по той же траектории.

4. Предсказ

Рис. 9 Предсказ

На рисунке 9 сделан ПРЕДСКАЗ() для прогнозирования недельной прибыли, если цена будет $100, $99 и $98.

5. Тенденция

Рис. 10 Тенденция

Используя массив и формулу ТЕНДЕНЦИЯ() (рис. 10) была спрогнозирована недельная прибыль с учетом срока эксплуатации помещения и цены.