- •Тема 1. Информационные технологии статистического анализа…...…4
- •Тема 2. Описательная статистика………………………………………..9
- •Тема 3. Дисперсионный анализ………………………………………....16
- •Лабораторная работа № 3. Инструмент «Двухфакторный дисперсионный анализ»………………………………………………….24 Тема 4. Корреляционно- регрессионный анализ………………………36
- •Тема 5. Прогнозирование и бизнес – анализ с помощью Excel.
- •Тема 1. Информационные технологии статистического анализа
- •Тема 2. Описательная статистика Теория вопроса.
- •Лабораторная работа № 1.
- •Контрольные вопросы.
- •Тема 3. Дисперсионный анализ
- •Лабораторная работа № 2.
- •Однофакторный дисперсионный анализ Теория вопроса.
- •Контрольные вопросы.
- •Лабораторная работа 3
- •Двухфакторный дисперсионный анализ Теория вопроса.
- •Двухфакторный дисперсионный анализ с повторениями.
- •Контрольные вопросы.
- •Тема 4. Корреляционно – регрессионый анализ.
- •Лабораторная работа № 4.
- •Теория вопроса.
- •Контрольные вопросы.
- •Лабораторная работа № 5. Инструмент ИспользованиЯ функции «корреляция».
- •Контрольные вопросы.
- •Лабораторная работа № 6. Инструмент использования функции «линейн».
- •Контрольные вопросы.
- •Тема 5. Прогнозирование и бизнес — анализ с помощью excel.
- •5.1. Методы и модели прогнозирования. О средствах прогнозирования excel.
- •5.2. Использование графического метода.
- •Лабораторная работа № 7.
- •Прогнозирование и регрессионный анализ.
- •Контрольные вопросы.
- •Прогнозирование методом скользящего среднего.
- •Лабораторная работа № 8.
- •Контрольные вопросы.
- •Лабораторная работа № 9.
- •Задание 2.1.
- •Задание 2.2.
- •Контрольные вопросы.
- •Лабораторная работа № 10.
- •Контрольные вопросы.
- •Лабораторная работа № 11.
- •Контрольные вопросы.
- •Лабораторная работа № 12.
- •Алгоритм построения прогнозной модели.
- •4. Строится модель прогнозирования: ,
- •Контрольные вопросы.
- •Критерии оценки знаний студентов
- •Контрольные вопросы к зачету.
- •Приложение 1 задания для самостоятельной
- •Задания для индивидуальной работы.
- •Виды статистических функций
- •Литература.
Контрольные вопросы.
Каково назначение регрессионного анализа?
Что такое уравнение регрессии? Какова технология построения регрессионной модели?
Какие виды регрессии различают? приведите примеры?
Что показывает коэффициент множественной корреляции Пирсона?
В чем заключается задача построения регрессионной зависимости?
Для чего применяется F-критерий Фишера? Как он вычисляется?
Какими параметрами определяется значимость коэффициента Пирсона?
Как построить линейную регрессионную модель в Excel? Что характеризует t-статистика?
Лабораторная работа № 5. Инструмент ИспользованиЯ функции «корреляция».
Цель: закрепить знания о понятиях «корреляция», «коэффициент корреляции»; научиться применять функцию «Корреляция».
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Теснота связи количественно выражается величиной коэффициентов корреляции. Он определяется как метод, применяемый тогда, когда данные наблюдения можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону. Основная задача корреляционного анализа (являющаяся основной и в регрессионном анализе) состоит в оценке уравнения регрессии.
Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.
Статистика разработала множество методов изучения связей, выбор которых зависит от целей исследования и от поставленных задач. Связи между признаками и явлениями ввиду их большого разнообразия классифицируют по ряду оснований.
Признаки по их значению для изучения взаимосвязи делятся на два класса: результативные; факторные.
Результативными называются признаки, изменяющиеся под действием других, связанных с ними признаков.
Факторными называются признаки, обуславливающие изменение результативных признаков.
Существуют различные виды и формы связи признаков.
По характеру зависимости признаков различают: функциональную (полную) связь; корреляционную (неполную) связь.
Функциональная - это связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака.
Корреляционная - это связь, при которой определенному значению факторного признака соответствует лишь среднее значение результативного признака.
Существуют также связи непосредственные и косвенные. Фактор X может непосредственно оказывать влияние на Y или косвенно, через другой фактор W.
Парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными).
Частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.
Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование.
Наиболее важным для практического использования является случай, когда связь между признаками X и Y линейная:
где и — коэффициенты уравнения регрессии.
Мера силы линейной связи признаков X и Y называется коэффициентом корреляции (коэффициент корреляции Пирсона). Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определить “полезность” факторных признаков при построении уравнений множественной регрессии. Величина коэффициентов корреляции служит также оценкой соответствия уравнению регрессии выявленным причинно-следственным связям.
Для применения корреляционного анализа необходимо, чтобы все рассматриваемые переменные были случайными и имели нормальный закон распределения. Причем выполнение этих условий необходимо только при вероятностной оценке выявленной тесноты связи.
Рассмотрим простейшие случай выявления тесноты связи – двумерную модель корреляционного анализа.
Для
характеристики тесноты связи между
двумя переменными обычно пользуются
парным коэффициентом корреляции
,
если рассматривать генеральную
совокупность, или его оценкой – выборочным
парным коэффициентом
,
если изучается выборочная совокупность.
Парный коэффициент корреляции в случае
линейной формы связи вычисляют по
формуле:
а
его выборочное значение – по формуле:
При малом числе наблюдений выборочный коэффициент корреляции удобно вычислять по следующей формуле:
Величина
коэффициента корреляции изменяется в
интервале
.
При
между двумя переменными существует
функциональная связь, при
- прямая функциональная связь. Если
,
то значение x
и y
в выборке некоррелированы; в случае,
если система случайных величин
имеет двумерное нормальное распределение,
то величины x
и y
будут и независимыми.
Если
коэффициент корреляции находится в
интервале
,
то между величинами x
и y
существует обратная корреляционная
связь. Это находит подтверждение и при
визуальном анализе исходной информации.
В этом случае отклонение величины y
от среднего значения взяты с обратным
знаком.
Если
каждая пара значений величин x
и y
чаще всего одновременно оказывается
выше (ниже) соответствующих средних
значений, то между величинами существует
прямая корреляционная связь и коэффициент
корреляции находится в интервале
.
Если же отклонение величины x от среднего значения одинаково часто вызывают отклонения величины y вниз от среднего значения и при этом отклонения оказываются все время различными, то можно предполагать, что значение коэффициента корреляции стремится к нулю.
Следует отметить, что значение коэффициента корреляции не зависит от единиц измерения и выбора начала отсчета. Это означает, что если переменные x и y уменьшить (увеличить) в К раз либо на одно и то же число С, то коэффициент корреляции не изменится.
Упражнение 1.
В таблице 13 представлены исходные данные по срокам работы (в годах) и затратам на техническое обслуживание (в тысячах долларов в год) для пяти одинаковых печатных прессов. На основании этих данных вычислить корреляцию между сроком работы и затратами на техническое обслуживание.
Последовательность действий:
Открыть файл Анализ. xls. Добавить новый лист. Переименовать его дав имя Корреляция. Разместить на листе Корреляция данные таблицы 13.
Т
аблица
13. Данные по срокам работы и затратам
на техническое обслуживание для пяти
одинаковых печатных прессов.
2. С помощью команды меню Сервис > Анализ данных вызвать диалоговое окно Анализ данных. Выбрать инструмент анализа — Корреляция (рис. 5).
Рис. 5. Окно инструмента «Корреляция».
3. В этом диалоговом окне задаются следующие параметры:
в поле Входной интервал вводится ссылка на диапазон ячеек, содержащий анализируемые данные;
переключатель Группирование установить в требуемое положение: По строкам или По столбцам, в зависимости от расположения исходных данных во входном диапазоне;
Флажок опции Метки в первой строке устанавливается в том случае, если первая строка во входном диапазоне содержит заголовок;
Переключатель в группе Параметры вывода может быть установлен в одно из трех положений: Выходной интервал, Новый рабочий лист или Новая рабочая книга;
Переключатель в группе Параметры вывода установите в положение Новый рабочий лист, дав ему имя Итог7.
Результаты расчетов представлены в таблице 14.
Таблица 14. Результаты расчетов коэффициента корреляции.
К
оэффициент
корреляции для этих данных равен 0,98. В
данном случае коэффициент практически
равен 1, что показывает сильную, практически
линейную прямую зависимость между
сроком работы пресса и затратами на его
техническое обслуживание. Следовательно
можно сделать обоснованный вывод, что
чем больше срок эксплуатации печатного
станка, тем больше приходиться тратить
средств на его ремонт и техническое
обслуживание.
Задания для самостоятельной работы.
Задача № 5. (Приложение 1).
Задача № 5. (Приложение 2).
