
- •1.1. Место статистических методов в стандартах iso 9000
- •1.2. История развития статистических методов качества
- •2.1. Проверка статистических гипотез
- •2.1.1. Основные понятия о статистической гипотезе
- •2.1.2. Ошибки при проверке статистических гипотез
- •2.1.3. Проверка биномиальных гипотез
- •2.1.4. Критерий согласия χ² (хи – квадрат)
- •2.2. Анализ безотказности
- •2.2.1. Взаимосвязь качества и надежности. Виды отказов
- •2.2.2. Методы оценки надежности
- •2.2.3. Резервирование
- •2.2.4. Основные меры по обеспечению надежности
- •3.1. Факторный анализ
- •3.1.1. Основные понятия
- •3.1.2. Сущность факторного анализа
- •3.1.3. Дисперсионный анализ факторов
- •3.2. Корреляционный и регрессионный анализ
- •3.2.1. Понятие о корреляционных связях
- •3.2.2. Определение уравнений регрессии
- •3.2.3. Определение коэффициента корреляции
- •3.3. Планирование многофакторного эксперимента
- •3.3.1.Основные понятия и определения
- •3.3.2. Выбор факторов, областей их варьирования и вида уравнения регрессии
- •3.3.3. Построение плана эксперимента
- •3.3.4. Полный факторный эксперимент
- •4.1 Анализ временных рядов
- •4.1.1. Метод подвижного среднего
- •4.1.2. Метод экспоненциального сглаживания
- •4.1.3. Метод проецирования тренда
- •4.2. Казуальные методы прогнозирования
- •4.3. Качественные методы прогнозирования
- •4.4. Статистическое моделирование (метод Монте–Карло)
- •4.4.1. Основные положения
- •4.4.2. Практические приложения метода Монте – Карло
4.1 Анализ временных рядов
Различают два вида временных рядов:
- моментные, когда значения рассматриваемого показателя X(x1, x2, .., xn) отнесены к определенным моментам времени T(t1, t2, …, tn), при tn > tn - 1,
- интервальные, когда указаны соответствующие промежутки (интервалы) времени: (t0 – t1), (t1 – t2), …, (tn – 1 – tn).
Временные ряды часто задаются при помощи таблиц (табл. 4.1) или графика (рис. 4.3):
Таблица 4.1
В
задачах прогнозирования временные ряды
используются при наличии значительного
количества реальных значений
рассматриваемого показателя при
условии, что наметившаяся в прошлом
тенденция ясна и относительно
стабильна. Анализ временного ряда
позволяет предположить, что должно
произойти при отсутствии вмешательства
дополнительных факторов извне.
Рис. 4.3. Моментные (а) и интервальные (б) временные ряды
Развитие
процессов реально наблюдаемых в жизни
складываются из некоторой устойчивой
тенденции (тренда) и некоторой случайной
составляющей, выраженной в колебании
значений показателя вокруг линии
тренда (рис. 4.4). Кривые тренда сглаживают
динамический ряд значений показателя,
выделяя общую тенденцию. Именно выбор
кривой тренда, сам по себе являющийся
довольно трудной задачей, во многом
определяет результаты прогнозирования.
На тренд могут влиять также сезонные и циклические составляющие.
Рис. 4.4. Тендеры (тренды) продаж в начале (а) и в конце (б) жизненного цикла продукции
Циклические
составляющие отличаются от сезонных
большей продолжительностью и
непостоянностью амплитуды. Обычно
сезонные составляющие измеряются
неделями и днями, а циклические – годами
и более. Для простоты изложения в
дальнейшем циклические составляющие
рассматриваться в данной работе не
будут. Одновременно принимаем, что тренд
характеризуется линейной зависимостью.
Рассмотрим на примерах три метода анализа временного ряда (рис. 4.5).
Рис. 4.5. Классификация методов анализа временных рядов
Пример. Допустим, что выявленные дефекты изготовления продукции в цехе описываются следующим временным рядом (табл. 4.2):
Таблица 4.2
Тот же временной ряд опишем короче (табл.4.3), в табличной форме, заменяя время порядковым номером дня (календарного или рабочего):
Таблица 4.3
4.1.1. Метод подвижного среднего
Этот метод разделяют на метод подвижного (скользящего) среднего и метод взвешенного (скользящего) среднего.
а) Метод подвижного (скользящего) среднего. Этот метод состоит в том, что расчет показателя на прогнозируемый момент времени строится путем усреднения значений этого показателя за несколько предшествующих дней.
Допустим, что у нас имеются данные показателя только за первые три дня. Вычислим прогнозируемое число дефектов на четвертый день недели (6 апреля, четверг). Для этого определим среднее значение числа дефектов за предшествующие три дня:
В общем случае расчетная формула прогноза выглядит следующим образом: (4.1)
где xk-i – реальное значение показателя в момент времени tk-i,
N – число предшествующих моментов времени,
fk – прогноз на момент времени tk.
Сделаем аналогичные прогнозы на каждый день до понедельника следующей недели и сведем данные в табл. 4.4:
Таблица 4.4
Отразим полученные результаты также на графике (рис. 4.6).
Оценим
точность прогнозирования. Любой отрезок
динамического ряда, охваченный
наблюдением, можно уподобить выборке.
Увеличение или уменьшение длины ряда
или плотности наблюдений в каждом
временном интервале изменяет объем
наблюдения и средние значения показателей.
Следовательно, значение «средней» для каждого отрезка ряда можно рассматривать как выборочную оценку некоторой «истинной» (генеральной) средней. С учетом этого можно определить погрешность и доверительные интервалы «выборочной» средней. Ее доверительные границы fmax и fmin при небольшом числе наблюдений будем оценивать с использованием распределения Стьюдента.
Рис. 4.6. График временного ряда (х) и прогноза (f) по методу подвижного среднего
Учитывая, что среднее значение x членов ряда, предшествующих моменту tk, является значением прогноза fk, уравнение для доверительных границ выборочного среднего будет иметь вид
где
(4.2)
где
νs
– табличное значение статистики
Стьюдента с (n – 1) степенями свободы и
уровнем доверительной вероятности P,
– средняя квадратическая ошибка
«средней» (прогноза).
В
свою очередь среднеквадратическое
отклонение Sx
выборки n равно: (4.3)
Определим
по приведенным уравнениям доверительные
границы и погрешность прогноза
числа
дефектов на четверг 6 апреля (табл.4.2).
Подставляя
в уравнение (4.3) показатели первых
трех моментов ряда, получим
=
2,64. Из уравнения (4.2) при n = 3 имеем
=
1,52. Принимаем доверительную вероятность
P = 0,90. Тогда νs
= 1,9. При этом по формуле (4.1) имеем:
fk max = 7 + 1,9 · 1,52 = 9,9; fk min = 4,1.
Как видно по рис. 4.6, при расчете прогноза по первым трем наблюдениям в приведенные интервалы не попали показатели числа дефектов, допущенных работниками цеха в понедельник 3 апреля и в четверг 6 апреля, что может быть связано с принятой нами в расчет низкой доверительной вероятностью наблюдений. Расчеты показывают, что верхняя граница прогноза в 11 дефектов может быть получена при доверительной вероятности Р= 0,94.
б) Метод взвешенного (скользящего) среднего. При составлении прогноза методом усреднения часто приходится наблюдать, что степень влияния использованных при расчете реальных показателей оказывается неодинаковой, при этом обычно более «свежие» данные имеют больший вес.
Так, например, для нашего примера в предыдущем разделе а), практически невероятно, чтобы руководство цеха не предпринимало усилий по снижению дефектности изготавливаемых изделий. В этом случае последние данные динамического ряда носят более достоверную информацию о качестве продукции. С учетом изложенного выше, введем в формулу (4.1) весовой показатель ξi:
(4.4)
Проведем численный расчет прогноза при условии, что вес сегодняшнего показателя равен 0,6, вчерашнего – 0,3, позавчерашнего – 0,1. Тогда по формуле (4.4) получим:
Отразим полученные результаты на графике (рис. 4.7) и сведем в табл.4.5 результаты расчета прогнозов до 10 апреля.
Рис. 4.7. График временного ряда (х) и прогноза (f) по методу взвешенного среднего
Таблица 4.5