
- •Министерство образования и науки Республики Казахстан
- •1. Учебная программа дисциплины – Syllabus
- •1. 1. Данные о преподавателях:
- •1.1 Данные о дисциплине:
- •Выписка из учебного плана
- •1.5. Краткое описание дисциплины
- •1.6. Перечень и виды заданий и график их выполнения:
- •Виды заданий и сроки их выполнения
- •1.7. Список литературы
- •1.8. Контроль и оценка знаний
- •Распределение рейтинговых баллов по видам контроля
- •Календарный график сдачи всех видов контроля
- •Оценка знаний студентов
- •2. Содержание Активного раздаточного материала
- •2.1 Тематический план курса составляется в виде таблицы, где указываются наименование темы и количество академических часов, предусмотренных для каждой темы. Тематический план курса
- •2.2 Конспект лекционных занятий
- •Глава 1. Основные понятия и определения статистики
- •Тема 2. Показатели описательной статистики. Среднее, дисперсия, стандартное отклонение, эксцесс, асимметрия, интервалы. Компьютерные технологии получения дескриптивной статистики.
- •Глава 2. Выборки.
- •Тема 5. Анализ одной выборки. Анализ однородности выборки. Доверительные интервалы для среднего. Доверительные интервалы для средних выборок. Компьютерные технологии анализа.
- •Тема 6. Анализ двух выборок. Выявление достоверности различий. Параметрические и непараметрические методы анализа выборок. Компьютерные технологии анализа одной выборки.
- •Глава 3. Анализ статданных.
- •Тема 7. Дисперсионный анализ статданных. Однофакторный дисперсионный анализ статистических данных. F- тест для для дисперсий. Компьютерные технологии анализа.
- •Тема 8. Корреляционный анализ статданных. Коэффицент корреляции Пирсона. Коэффициент ранговой корреляции. Ложная и истинная корреляция Компьютерные технологии анализа.
- •Глава 4. Регрессионный анализ.
- •Тема 9. Регрессионный анализ статданных. Простая линейная регрессии. Оценивание параметров линейной регрессиии методом наименьших квадратов, коэффициент детерминации.
- •Тема 10. Оценка существенности параметров линейной регрессии. Оценка качества регрессии f-критерий Фишера, t-статистика. Проверка значимости параметров регрессии. Понятие нелинейной регрессии.
- •Тема 11. Множественная регрессия. Многомерная регрессионая модель. Фиктивные переменные. Кодирование значений качественных переменных. Мультиколлинеарность.
- •Глава 5. Анализ временных рядов.
- •Тема 12. Анализ статданных в виде временных рядов. Временные ряды и их характеристики. Аддитивная и мультипликативная модель. Декомпозиция временного ряда.
- •Тема 13. Анализ и получение тренда. Методы аналитического выравнивания. Метод скользящего среднего. Метод экспоненциального сглаживания. Оценка точности трендовой модели.
- •Тема 14. Модели временных рядов. Понятие об авторегрессионных моделях временных рядов. Коэффицент автокорреляции и автокорреляционная функция.Тест Дарбина-Уотсона.
- •Тема 15. Анализ моделей временных рядов. Решение проблемы автокорреляции. Учет сезонности. Коинтеграция временных рядов.Тест Энгла - Гренжера. Современные тенденции статанализа.
- •2.3 Планы лабораторных занятий
- •Технология построения трендов в Microsoft Excel Порядок выполнения лабораторной работы
- •Форматирование метки линии тренда.
- •Задание на выполнение лабораторной работы:
- •Задание на выполнение лабораторной работы
- •2.4 Планы занятий в рамках самостоятельной работы студентов под руководством преподаватля (срсп)
- •Тема 1. Функции распределения дискретной случайной величины. Биномиальное распределение. Применение компьютерных технологий при статистическом исследовании биномиального распределения. (2 ч.)
- •Тема 3. Функции распределения дискретной случайной величины. Распределение Пуассона. Применение компьютерных технологий при статистическом исследовании распределения Пуассона. (2 ч.)
- •Тема 4. Функции распределения непрерывной случайной величины. Гауссово распределение. Применение компьютерных технологий при статистическом исследовании Гауссово распределения. (2 ч.)
- •Тема 5. Функции распределения непрерывной случайной величины. Распределение хи-квадрат. Применение компьютерных технологий при статистическом исследовании распределения хи-квадрат. (2 ч.)
- •Тема 6. Функции распределения непрерывной случайной величины. Распределение Стьюдента. Применение компьютерных технологий при статистическом исследовании распределения Стьюдента. (2 ч.)
- •Тема 7. Функции распределения непрерывной случайной величины. Распределение Фишера. Применение компьютерных технологий при статистическом исследовании распределения Фишера. (2 ч.)
- •Тема 9. Генерация случайных чисел. Применение компьютерных технологий при генерации случайных чисел. (2 ч.)
- •Тема 10. Статистические гипотезы. Одновыборочный z-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного z-теста для средних величин. (2 ч.)
- •Тема 11. Статистические гипотезы. Двухвыборочный z-тест для средних величин. Применение компьютерных технологий при проведении двухвыборочного z-теста для средних величин. (2 ч.)
- •Тема 12. Статистические гипотезы. Одновыборочный t-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного t-теста для средних величин. (2 ч.)
- •Тема 15. Статистические гипотезы. Парный двухвыборочный t-тест для средних величин. Применение компьютерных технологий при проведении парного двухвыборочного t-теста для средних величин. (2 ч.)
- •2.5 Планы занятий в рамках самостоятельной работы студентов (срс)
- •Тема 1. Регрессионный анализ с применением компьютерных технологий. Интерпретация результатов.
- •Тема 2. Регрессионный анализ. Метод наименьших квадратов (мнк).Интерпретация результатов.
- •Тема 3. Регрессионный анализ. Анализ вариации зависимой переменной.
- •Тема 4. Регрессионный анализ. Условия Гаусса-Маркова по классической нормальной линейной регрессионной модели.
- •Тема 5. Регрессионный анализ. Стандартная ошибка регрессии.
- •Тема 6. Регрессионный анализ. Стандартные ошибки коэффициентов регрессии.
- •Тема 7. Регрессионный анализ. Проверка гипотез по коэффициентам регрессии.
- •Тема 8. Регрессионный анализ. Нелинейные регрессии.
- •Тема 9. Регрессионный анализ. Прогнозирование в регрессионных моделях.
- •Тема 10. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Получение тренда. Интерпретация результатов.
- •Тема 11. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Исследование автокорреляции данных временного ряда.
- •Тема 12. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест Дарбина-Уотсона.
- •Тема 13. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест на коинтеграцию на основе критерия Энгла-Грэнжера.
- •Тема 14. Статистический программный инструментарий. Обзор статистических функций ms Excel.
- •Тема 15. Статистический программный инструментарий. Обзор возможностей пакета "Анализа данных" ms Excel.
- •2.6. Тестовые задания для самоконтроля с указанием ключей правильных ответов
- •24. Имеют ли в общем случае смысловую нагрузку свободный член уравнения линейной регрессии?
- •25. Что такое корреляционные поля?
- •26. Что такое авторегрессионая модель временного ряда?
- •27. Что означает регрессионная модель с лагированными переменными?
- •28. Какой показатель определяется отношением дисперсии результативного признака регрессии к общей дисперсии результативного признака?
- •29. Какой критерий применяется для проверки гипотезы - средние двух выборок относятся к одной и той же совокупности?
- •30. Какой метод применяется для проверки гипотезы - относится та или иной вариант к данной статистической совокупности?
- •Перечень экзаменационных вопросов по пройденному курсу
- •Глоссарий
- •Выходные сведения
Технология построения трендов в Microsoft Excel Порядок выполнения лабораторной работы
1. Построите XY-диаграмму исходного динамического ряда.
Создайте копию диаграммы исходного ряда (не обязательно).
Выделите ряд данных, для которого следует построить или добавить тренд.
В меню "Вставка" выберите опцию Добавить линию тренда (Insert Trendline).
В открывшемся диалоговом окне "Тип" выберите нужный тип регрессионного анализа линии тренда. Окно "Линия тренда" (Trendline) предоставляет возможность моделировать тренд, используя пять основных типов регрессии:Linear - линейную, Logaritmic - логарифмическую, Polinomial - полиномиальную (степени от двух до шести задаются в прокурчиваемом списке Степень), Power - степенную, Exponential - экспоненциальную.
В том же окне выбрать вкладку "Параметры".
В открывшемся диалоговом окне параметров тренда установите флажок "Показывать уравнение на диаграмме" и флажок "Поместить на диаграмму величину достоверности аппроксимации R2".
По желанию устанавливается необходимое число периодов для изображения возможного прогноза вперед или назад, а также вводится название моделируемого тренда, которое будет помещено в метку диаграммы. Названия даются и по умолчанию, но без указания степени полиномиального тренда.
Если не нужен свободный член уравнения, следует активизировать флажок "Пересечение кривой с осью Y в точке 0".
Активизируйте кнопку "ОК".
Для получения каждого нового тренда повторить шаги от п. 2 до п. 7.
Форматирование линии тренда
Активизируйте диаграмму.
Сделайте двойной щелчок по линии тренда.
Выберите вкладку «Вид».
В группе «Линия» укажите стиль, цвет, толщину линий.
Проверьте образец отформатированной линии тренда в диалоговом окне .
Форматирование метки линии тренда.
Активизируйте диаграмму.
Сделайте двойной щелчок по линии тренда.
Выберите вкладку «Число».
«Выберите нужный числовой формат».
Пример построения линии тренда.
КОРРЕЛЯЦИЯ
Вданном разделе работы следует
построить корреляционную матрицу,
отражающую линейную связь между всеми
рядами показателей. Необходимо
использовать вышеприведенные ис ходные
данные и использовать пакет анализа
данныхExcel.
Необходимо также вывести корреляционные
поля, позволяющие визуально оценить
корреляционные связи.
Задание на выполнение лабораторной работы:
1. Выберите любые 5 рядов данных для упражнения.Используя табличный процессор, попытайтесь найти истинную форму тренда показателя за весь временной промежуток и оцените качество построенного тренда. Сделайте прогноз: по найденному тренду на 2-3 периода.
Выберите показатели для упражнения (не менее 5 пар).
а) Постройте корреляцинныю таблицу.
в) Для выбранных данных постройте корреляционные поля.
с) Сделайте качественные выводы о тесноте линейной связи отдельных показателей.
Контрольные вопросы:
1. Какова методика поиска тренда в MS Excel?
2. На основании какого показателя можно выбирать лучший тренд в MS Excel?
3. Какова методика оценки корреляционной завасимости данных в MS Excel?
Литература: 1ocн[178-196], 6ocн[17-21], 2[43-53],4доп[114-134].
Лабораторная работа 5.
Тема: Регрессионный анализ.
Связи между различными величинами носят функциональный или корреляционный характер. Функциональная зависимость означает детерминированную, предопределенную заранее связь между величинами и может быть выражена точным математическим соотношением. Корреляционная зависимость означает стохастическую (случайную) связь между величинами и общем случае выражается ковариацией или коэффициентом корреляции, при этом одна независимая случайная величина рассматривается как фактор, а другая случайная величина - как основной признак, для которого оценивается мера тесноты связи с фактором.
Форма взаимосвязи случайных величин и функции получила название уравнения регрессии. Различают простую (парную) и множественную регрессию линейного и криволинейного (квадратичного, экспоненциального, полулогарифмического и т.д.) типа. Вид и параметры уравнения регрессии устанавливаются с помощью метода наименьших квадратов отклонений эмпирических данные от выровненных.
Статистическая оценка тесноты связи основана на показателях вариации:
• общая дисперсия
результативного признака, обусловленная
влиянием всех факторов в совокупности
-;
• факторная
дисперсия результативного признака,
отражающая вариацию результативного
признака от воздействия фактора -;
• остаточная
дисперсия результативного признака,
отражающая вариацию результативного
признака от воздействия всех прочих
факторов, кроме выделенного-.
Основное соотношение:
.
Качественная оценка степени связи случайных переменных - коэффициент детерминации, который вычисляется как отношение факторной к общей дисперсии - R2, доля факторной дисперсии в общей дисперсии. Иногда используется индекс корреляции - R. Для оценки значимости R применяется F-критерий Фишера. Фактическая величина критерия сравнивается с критическим значением, определяемым с учетом уровня значимости и числа степеней свободы. Если фактическое значение больше критического, величина R признается существенной.
При значениях коэффициента детерминации более 0,7 вариации зависимой переменной, в основном, обусловлены влиянием факторов, и регрессионные модели признаются пригодными для их практического использования в целях прогнозирования.
Найденные коэффициенты уравнения регрессии являются оценками истинных значений параметров. Если анализируется совокупность малого размера (до 30 значений), то для определения доверительного интервала параметров используют распределение Стьюдента (значение t-критерия Стьюдента). Рассчитанные значения t-критериев сравниваются с критическими с учетом принятого уровня значимости и числа степеней свободы и признаются типичными, если фактическое значение больше критического.
Если анализируется совокупность достаточно большого размера, вместо таблицы распределения Стьюдента пользуются таблицей интеграла вероятностей Лапласа.
Как выполнять в MS Excel.
Для получения коэффициентов регрессии используется процедура "Регрессия" пакета анализа. Кроме того, могут быть использованы функция "ЛИНЕЙН" для получения параметров регрессионного уравнения и функция "ТЕНДЕНЦИЯ" для получения предсказанных значений Y в требуемых точках.
Для реализации процедуры Регрессия необходимо: выполнить команду "Сервис" ->"Анализ данных", в появившемся диалоговом окне "Анализ данных" в списке "Инструменты анализа" выбрать строку "Регрессия". В появившемся диалоговом окне задать "Входной интервал Y", то есть ввести ссылку на диапазон анализируемых зависимых данных, содержащий один из столбцов данных. Указать "Входной интервал X", то есть ввести ссылку на диапазон независимых данных. Указать выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Размер выходного диапазона будет определен автоматически. Если небходимо визуально проверить отличие экспериментальных точек от предсказанных по регрессионной модели, следует установить флажок в поле График подбора, нажать кнопку ОК.
Результаты анализа. Выходной диапазон будет включать в себя результаты дисперсионного анализа, коэффициенты регрессии, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов.
Приводимое значение R-квадрат (коэффициент детерминации) определяет, с какой степенью точности полученное регрессионное уравнение аппроксимируется исходные данные.
Задание: Построить и объяснить регрессионную модель для предсказания изменений уровня заболеваемости органов дыхания (Y) в зависимости от содержания в воздухе двуокиси углерода (X1) и степени запыленности (X2). В таблице приведены данные наблюдений в течение 29 месяцев.
X1 |
X2 |
Y |
1 |
1,3 |
1160 |
1 |
1,3 |
1155 |
1,1 |
1,4 |
1158 |
1,1 |
1,4 |
1157 |
1,1 |
1,5 |
1160 |
1,1 |
1,5 |
1161 |
1 |
1,4 |
1157 |
1 |
1,5 |
1159 |
1,2 |
1,6 |
1256 |
1,2 |
1,7 |
1260 |
0,6 |
1 |
1040 |
0,6 |
1 |
1039 |
0,7 |
1,1 |
1039 |
0,7 |
1,15 |
1040 |
0,75 |
1,2 |
1040 |
0,7 |
1,2 |
1039 |
0,7 |
1,3 |
1040 |
0,7 |
1,3 |
1039 |
0,8 |
1,4 |
1140 |
0,8 |
1,4 |
1138 |
0,78 |
1,5 |
1240 |
0,8 |
1,5 |
1239 |
0,78 |
1,5 |
1241 |
0,78 |
1,6 |
1240 |
0,8 |
1,7 |
1239 |
0,8 |
1,8 |
1239 |
0,75 |
1,8 |
1240 |
0,78 |
1,9 |
1238 |
0,75 |
1,9 |
1238 |
Сверьте решение :Y=682+91*X1+275*X2.
Контрольные вопросы:
1. Какова методика получения регрессионных уравнений в MS Excel?
2. Какие показатели характеризуют качество регрессионных уравнений в MS Excel?
3. Как визуально можно проверить отличие экспериментальных точек от предсказанных по регрессионной модели в MS Excel?
Литература: 1осн. [273-285], 2осн. [42-74], 6осн. [22-30], 2доп. [60-76], 3доп. [260-266], 4 доп. [135-142], 6доп. [206-214].
Лабораторная работа 6.
Тема: Анализ временных рядов. Коинтеграция.
В данной работе следует проверить коинтеграцию временных рядов используя критерий Энгла-Грэнжера. В данной работе следует проверить приводимый пример, незначительно изменив данные, провести вычисления и объяснить смысл применения критерия Энгла-Грэнжера.
Исходные данные и результаты расчетов сведены в таблицу (столбцы B,C,D).
В таблице даны: у - временной ряд зависимой переменной, х - временной ряд независимой переменной, е остатки от регрессии (чтобы получить данные об остатках необходимо активизировать параметр "вывод остатков" в окне задания условий функции РЕГРЕССИЯ пакета "Анализ данных" ). e(t-1) и е(t)-e(t-1) соответствующие модифицированные ряды от е. Далее получить новое регрессионое уравнение (аналогично предыдущему шагу), где зависимая переменная е(t)-e(t-1), а e(t-1) независимая. Значение t-статистики при 5% уровне значимости -2,60423, критическое значение статистики Энгла-Грэнжера при этом же уровне значимости 1,6177. По абсолютной величине фактические значения t-статистики превышают критические значения статистики Энгла-Грэнжера. С учетом оценки по критерию можно сделать вывод о коинтеграции рассматриваемых временных рядов.