- •Тема 1. Описательная статистика
- •1.1. Общие сведения
- •1.2. Cтатистические функции ms Excel для вычисления основных характеристик случайной величины
- •Практическое задание № 1
- •Контрольные вопросы
- •Тема 2. Дисперсионный анализ
- •Практическое задание № 2
- •Контрольные вопросы
- •Практическое задание № 3
- •Теоретические сведения
- •Контрольные вопросы
- •Тема 3. Корреляционно – регрессионый анализ
- •Практическое задание № 4
- •Теоретические сведения
- •Контрольные вопросы
- •Практическое задание № 5 ИспользованиЕ инструмента «корреляция»
- •Теоретические сведения
- •Контрольные вопросы
- •Практическое задание № 6 использование функции линейн
- •Теоретические сведения
- •Контрольные вопросы
- •Тема 5. Прогнозирование и бизнес-анализ средстами ms excel
- •5.1. Прогнозирование на основе анализа временных рядов
- •Факторы, влияющие на значения временного ряда
- •5.1.Средства ms Excel для анализа временных рядов
- •5.3. Применение трендового анализа
- •Практическое задание № 7
- •Теоретические сведения
- •Контрольные вопросы
- •5.4. Прогнозирование методом скользящего среднего
- •Практическое задание № 8
- •Теоретические сведения
- •Контрольные вопросы
- •Практическое задание № 9
- •Теоретические сведения
- •Контрольные вопросы
- •Практическое задание № 11
- •Теоретические сведения
- •Контрольные вопросы
- •Практическое задание № 12
- •Теоретические сведения
- •4. Строится модель прогнозирования: ,
- •Контрольные вопросы
- •Контрольные вопросы по вычислительной практике
- •Индивидуальные задания
- •Индивидуальные задания
Практическое задание № 1
ИНСТРУМЕНТ «ОПИСАТЕЛЬНАЯ СТАТИСТИКА»
Цель: ознакомиться с основными характеристиками случайной величины, содержанием основных статистических функций MS Excel; изучить и научиться применять методы описательной статистики.
Упражнение 1
Применить методы описательной статистики для анализа количества работников отраслей экономики, которым начислена заработная плата за март 2011 года. Размерность массива исходных данных — 20 элементов (рис. 1).
Последовательность действий:
1. Создать рабочую книгу с помощью команды Файл→ Создать.
2. Переименовать Лист1 в лист Статистика 1.
3. Разместить на этом листе исходные данные (рис. 1).
4. С помощью команды Данные→ Анализ→ Анализ данных вызвать диалоговое окно Анализ данных. Выбрать инструмент анализа Описательная статистика (рис. 2)
Р
ис.
1. Численность работников отраслей
экономики,
которым начислена
заработная плата за март 2011 г.
5. Указать параметры описательной статистики:
входной интервал – блок ячеек, содержащий число работников, включая названия столбца, группирование по столбцам; указать наличие меток в первой строке;
выходной интервал – Новый рабочий лист > ввести Итог 1;
указать Итоговая статистика;
уровень надежности – 95%; вычислить k-й наименьший – 2; k-й наибольший – 2;
нажать кнопку Оk.
6. Сохранить файл, задав ему имя Анализ-фамилия-группа.xlsx. Например: Анализ-ФинА-Иванов.xlsx.
Р
ис.
2. Окно инструмента «Описательная
статистика».
Результаты расчетов представлены на рис. 3.
Р
ис.
3. Результаты расчетов
Упражнение 2
Применить методы описательной статистики для анализа количества и заработной платы работников отраслей экономики. Размерность массива исходных данных — 26 элементов (приложение 1, таблица 1). Выполнить расчет показателей описательной статистики по выборке «Среднеучетная численность штатных работников, тыс.» отдельно за 2010 и 2011 годы и сравнить статистические показатели, определить отклонение и сделать выводы о характере изменений, прошедших за эти годы. Такой же расчет и анализ выполнить по выборке «Заработная плата, начисленная в среднем за месяц на одного штатного работника». Данные таблицы разместить на Лист 2 рабочей книги, переименов его в Статистика 2. Таблицы результатов разместить на новом листе, дав ему название Итог 2. Сравнить результаты анализа данных за 2010 и 2011 годы. |
Индивидуальные задания
Задача № 1. (Приложение Б).
Задача № 1. (Приложение В).
Контрольные вопросы
Как подключить надстройку Пакет анализа?
Какие инструменты входят в надстройку Пакет анализа?
Опишите основные статистические функции MS Excel.
Перечислите основные числовые характеристики случайной величины.
Что характеризуют функции МОДА.ОДН, КВАРТИЛЬ.ВКЛ, МЕДИАНА, ПРОЦЕНТИЛЬ.ВКЛ, ПРОЦЕНТРАНГ.ВКЛ?
Укажите назначение инструмента «Описательная статистика»?
Тема 2. Дисперсионный анализ
Диспе́рсия (от лат. dispersio – рассеяние) – в математической статистике и теории вероятностей, наиболее употребительная мера рассеивания, т. е. отклонения от среднего. В статистическом понимании дисперсия есть среднее арифметическое из квадратов отклонений величин xi от их среднего арифметического [Большая советская энциклопедия].
Дисперсионный анализ — метод в статистической математике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий в средних значениях.
Дисперсионный анализ применяют для изучения влияния качественных признаков на количественную переменную.
Первоначально дисперсионный анализ был предложен английским статистиком Р. Фишером (1925) для обработки результатов агрономических опытов по выявлению условий, при которых испытываемый сорт сельско-хозяйственной культуры даёт максимальный урожай. Современные приложения дисперсионного анализа охватывают широкий круг задач экономики, биологии и техники и трактуются обычно в терминах статистической теории выявления систематических различий между результатами непосредственных измерений, выполненных при тех или иных меняющихся условиях.
Задачей дисперсионного анализа является изучение влияния одного или нескольких факторов на рассматриваемый признак.
При исследовании зависимостей одной из наиболее простых является ситуация, когда можно указать только один фактор, влияющий на конечный результат, и этот фактор может принимать лишь конечное число значений (уровней). Такие задачи называются задачами однофакторного анализа.
Однофакторный дисперсионный анализ используется в тех случаях, когда есть в распоряжении три или более независимые выборки, полученные из одной генеральной совокупности путем изменения какого-либо независимого фактора, для которого по каким-либо причинам нет количественных измерений.
Однофакторный дисперсионный анализ используется для проверки гипотезы о сходстве средних значений двух или более уровней фактора, принадлежащих одной и той же генеральной совокупности.
Задача сравнения выборок случайных величин формулируется следующим образом: есть несколько (три или более) независимых выборок, полученных из одной генеральной совокупности путем изменения какого-либо независимого фактора, для которого по каким-либо причинам нет количественных измерений (например, этот фактор — тип упаковки). Для полученных выборок предполагается, что они имеют различные выборочные средние и одинаковые выборочные дисперсии. Поэтому необходимо ответить на вопрос, оказал ли изменяемый независимый фактор существенное влияние на разброс выборочных средних или же разброс является следствием случайностей, вызванных небольшими объемами выборок? Другими словами, если выборки принадлежат одной и той же генеральной совокупности, то разброс данных между выборками (между группами) должен быть не больше, чем разброс данных внутри этих выборок (внутри групп).
Требуется проверить нулевую гипотезу Н0 о равенстве средних значений выборок при каждом уровне фактора. Иначе говоря, требуется установить, значительно или незначительно различаются выборочные средние значения, вычисленные для каждого уровня.
Для сравнения средних значений нескольких выборок строится F-статистика. Нулевая гипотеза записывается следующим образом:
(1),
где
—
среднее k-й
группы.
В дисперсионном анализе разработаны методы проверки подобных гипотез. Теория дисперсионного анализа и расчетные формулы рассмотрены в специальной литературе [Кендалл М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. - М.: Наука, 1976. – 736 с.]
Гипотезу Н0 проверяют против альтернативной гипотезы Н1, согласно которой хотя бы одно из указанных равенств не выполнено.
Проверить гипотезу о равенстве средних значений выборок можно, учитывая следующие допущения при каждом уровне фактора: генеральные совокупности распределены нормально; дисперсии всех совокупностей одинаковы; наблюдения независимы и проводятся в одинаковых условиях.
Пусть
-й
элемент (i
=
) k-ой
выборки (
),
где т
—
число выборок и пк
—
число
данных в k-ой
выборке.
Тогда
—
выборочное среднее k-ой
выборки
— определяется по формуле:
(2).
Общее среднее значение для всех групп вычисляется по формуле:
где
(3).
Основное
уравнение дисперсионного анализа имеет
следующий вид:
(4),
где
— сумма квадратов отклонений между
группами (сумма квадратов отклонений
выборочных средних
от
общего среднего
).
Расчет
производится по формуле:
(5).
— сумма
квадратов отклонений внутри групп
(сумма
квадратов отклонений наблюдаемых
значений
от
выборочного среднего
).
Формула для вычисления этой суммы
квадратов отклонений:
(6).
— общая
сумма квадратов отклонений наблюдаемых
значений
от
общего среднего
.
Расчет
этой суммы квадратов отклонений
осуществляется по следующей формуле:
(7).
В качестве статистического критерия необходимо воспользоваться критерием Фишера:
(8).
Нулевая гипотеза принимается, если расчетное значение критерия Фишера будет меньше табличного значения, и следовательно, нет оснований считать, что независимый фактор оказывает влияние на разброс средних значений:
,
где
—
уровень значимости или уровень риска,
обычно для экономических задач принимается
= 0,05
В противном случае независимый фактор оказывает существенное влияние на разброс средних значений и нулевая гипотеза отвергается.
Итак, процедура однофакторного дисперсионного анализа состоит в проверке гипотезы о том, что имеется одна группа однородных экспериментальных данных против альтернативы о том, что таких групп больше, чем одна. Под однородностью понимается одинаковость средних значений и дисперсий в любом подмножестве данных. При этом дисперсии могут быть как известны, так и неизвестны заранее. Если имеются основания полагать, что известная или неизвестная дисперсия измерений одинакова по всей совокупности данных, то задача однофакторного дисперсионного анализа сводится к исследованию значимости различия средних в группах данных.
Для проведения однофакторного дисперсионного анализа в MS Excel можно использовать инструмент Однофакторный дисперсионный анализ из надстройки Пакет анализа.
