
- •В.В. Нешитой
- •Методы статистического анализа
- •На базе
- •Обобщенных распределений
- •Предисловие
- •Введение
- •I. Случайные события и их вероятности
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •II. Основные теоремы теории вероятностей
- •2.1. Теорема сложения вероятностей (несовместных событий)
- •2.2. Теорема умножения вероятностей (независимых событий)
- •2.3. Формула полной вероятности
- •2.4. Теорема гипотез (формула Бейеса)
- •III. Дискретные случайные величины
- •3.1. Закон распределения вероятностей дискретной случайной величины
- •3.2. Числовые характеристики дискретной случайной величины
- •3.2.1. Математическое ожидание
- •3.2.2. Свойства математического ожидания
- •3.2.3. Дисперсия дискретной случайной величины
- •3.2.4. Свойства дисперсии
- •3.2.5. Среднее квадратическое отклонение
- •3.2.6. Одинаково распределенные взаимно независимые случайные величины
- •3.2.7. Моменты (начальные, центральные) дискретной случайной величины
- •4.2. Плотность распределения
- •4.3. Числовые характеристики непрерывных случайных величин
- •4.4. Примеры непрерывных распределений
- •4.4.1. Нормальный закон
- •5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •5.4. Метод моментов для точечной оценки параметров распределения
- •5.5. Метод наибольшего правдоподобия
- •VI. Обобщенные распределения. Системы непрерывных распределений
- •6.1. Методы построения обобщенных распределений
- •6.2. Построение системы непрерывных распределений методом обобщения
- •6.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •6.4. Распределения функций случайного аргумента
- •6.5. Три основные и три дополнительные системы непрерывных распределений в. Нешитого
- •VII. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •7.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •7.2. Метод наибольшего правдоподобия
- •7.3. Классический метод моментов
- •7.3.3. Симметричные распределения Ic-iiIc типов
- •7.3.4. Критерии для классификации кривых по методу моментов
- •7.4. Универсальный метод моментов
- •7.4.1. Законы распределения суммы независимых случайных величин
- •7.4.2. Центральная предельная теорема для трех систем непрерывных распределений
- •7.4.3. Законы распределения среднего выборочного
- •7.5. Общий устойчивый метод
- •VIII. Выравнивание и прогнозирование статистических распределений
- •8.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •8.2. Построение выравнивающей кривой распределения по статистическим данным
- •8.2.1. Выравнивание по классическому методу моментов
- •8.2.2. Выравнивание по универсальному методу моментов
- •8.2.3. Выравнивание по общему устойчивому методу
- •8.2.4. Выравнивающее распределение суммы независимых случайных величин
- •8.2.5. Выравнивающее распределение среднего выборочного
- •8.3. Прогнозирование распределений
- •8.3.1. Первая система непрерывных распределений
- •8.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
- •8.3.3. Показатели стабильности и качества выборки
- •Iх. Статистический анализ точности и стабильности технологических процессов на базе обобщенных распределений
- •9.1. Показатели состояния технологического процесса
- •9.2. Пример статистической обработки результатов замера контролируемого параметра по программе
- •Контрольный листок Деталь №_____(название) ø50 мм ±0,012 Точность си 0,002 Дата________ Время_______
- •Отклонения от номинального размера детали «nn» ø50 ±0,012
- •Показатели статистического распределения ( )
- •9.3. Экономическая эффективность применения обобщенных распределений
- •9.4. Особенности применения статистических методов в области строительства
- •Х. Надежность как особый критерий качества
- •10.1. Некоторые показатели надежности для невосстанавливаемых объектов
- •Плотность распределения отказов
- •Интенсивность отказов
- •Гамма-процентный ресурс
- •10.2. Вычисление показателей надежности по обобщенным распределениям
- •Результаты наблюдений о наработке до отказа двигателей панелевозов (ti – пробег до отказа в тыс. Км.; mi – число панелевозов, имеющих наработку ti)
- •Показатели статистического распределения (snr2v97)
- •Логарифмическое распределение типа 1.1 с параметрами
- •XI. Временные (динамические) ряды
- •11.1. Методы выделения тренда
- •11.2. Построение кривых роста для выравнивания временных рядов
- •11.2.1. Построение кривых роста с заданными свойствами
- •11.2.2. Метод обобщения
- •11.2.3. Кривые роста на базе обобщенных распределений
- •11.3. Оценивание параметров кривых роста
- •11.3.1. Уравнение прямой
- •11.3.2. Экспонента
- •11.3.3. Обобщенная кривая роста
- •11.4. Прогнозирование временных рядов
- •11.4.1. Параметрический метод прогнозирования
- •11.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по методу моментов
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по общему устойчивому методу
- •Значения квантили в зависимости от уровня вероятности и числа степеней свободы r
- •Приложение 5
- •Литература
- •Содержание
11.3.2. Экспонента
Рассмотрим
еще пример, когда среднее логарифма
случайной величины Yt,т.е.
растет во времени по линейному закону,
, (11.3.8)
а
сама случайная величина Yt
(точнее, ее среднее геометрическое
)
– по показательному закону
.
В этом случае рассеяние отдельных значений случайной величины Y относительно экспоненты при каждом значении t должно описываться второй системой непрерывных распределений (см. свойства SNR2), а в частном случае – логарифмически нормальным законом
,
или с учетом (11.3.8)
. (11.3.9)
Оценки параметров А, В, σ распределения (11.3.9) легко находятся по методу наибольшего правдоподобия:
(11.3.10)
(11.3.11)
, (11.3.12)
где
S2
– оценка
дисперсии σ2.
Нижняя и верхняя границы при заданной доверительной вероятности Р определятся по формулам
(11.3.13)
11.3.3. Обобщенная кривая роста
Найдем для примера оценки параметров кривой роста, заданной четырехпараметрической формулой (11.2.3). Для этого приведем ее к линейному виду
. (11.3.14)
Примем обозначение
.
Тогда последняя формула перепишется в виде
. (11.3.15)
Рассеяние эмпирических значений случайной величины Y относительно теоретической прямой (11.3.15) будет описываться первой системой непрерывных распределений, в частности, нормальным законом.
Распределение случайной величины y при заданных значениях t можно найти по распределению случайной величины Y:
Теперь
можно воспользоваться формулами (11.3.3)
– (11.3.5) для нахождения оценок параметров
α, β, S2,
заменив величины
соответственно на
.
Несмещенная оценка остаточной дисперсии
случайной величины Yt
в этом случае будет вычисляться по
формуле
,
где величина
рассчитывается
по статистическим значениям уровней
временного ряда y
при каждом значении t
и заданном значении параметра u.
Параметр y0
должен быть либо известен из опыта, либо
задан. Меняя
значения параметра u
(например, с шагом 0,1 или 0,01), в итоге
найдем тот вариант кривой роста, параметры
которого минимизируют остаточную
дисперсию.
Найдем формулы для вычисления верхней и нижней доверительных границ уровней временного ряда. На основании формулы (11.3.14) имеем
,
откуда
,
где
.
11.4. Прогнозирование временных рядов
11.4.1. Параметрический метод прогнозирования
При найденных оценках параметров математическая модель позволяет осуществлять прогнозирование временного ряда. Такой метод прогнозирования естественно назвать параметрическим методом.
Для временных рядов, имеющих закономерный характер роста, неизменный на длительном интервале, параметрические модели являются наиболее приемлемыми, поскольку с их помощью можно получать достаточно уверенный прогноз даже при наличии сезонной составляющей.
Однако реальные временные ряды экономических показателей крайне нестабильны, подвержены резким колебаниям и т.д. В связи с этим прогнозирование таких рядов может осуществляться лишь на коротких интервалах, где они имеют закономерный характер роста.
Чтобы в некоторой степени избавиться от случайной составляющей временного ряда и более надежно выявить тренд, осуществляют сглаживание эмпирических данных. Далее этот сглаженный ряд (или исходный, несглаженный) может быть использован для параметрического прогнозирования, т.е. для подбора наилучшей выравнивающей кривой роста, имеющей параметры, по которой затем осуществляется прогноз на заданный период упреждения.
Для выявления тренда временного ряда, в том числе содержащего сезонную составляющую, необходимо вычислить наилучшую выравнивающую кривую роста за период 1.5, 2, 3 и т.д. года, начиная с начала года или полугодия.
После нахождения оценок параметров выравнивающей кривой можно рассчитать прогнозные значения уровня ряда (тренда) на заданный период упреждения. Методика расчета сезонной волны изложена в книге [18].
Иногда требуется спрогнозировать средний коэффициент роста уровня временного ряда на некоторый период. Его можно вычислить по уравнению кривой роста с известными оценками параметров.
Рассмотрим два случая.
Случай 1. Временной ряд описывается экспонентой
.
Здесь величина y0 = y при t = 0. Параметр α равен мгновенному темпу прироста
,
а величина
ежемесячному
темпу роста
Отметим, что в данном случае мгновенный темп прироста (α ) меньше ежемесячного темпа прироста (q – 1).
Отношение
есть не что иное, как коэффициент роста
уровня ряда к начальному его значению.
Найдем среднегодовое значение коэффициента
роста уровня ряда
, (11.4.1)
где
.
Аналогично можно найти
за любой другой период. Расчет
осуществляется по формуле
,
откуда после интегрирования имеем
. (11.4.2)
Вычислим по формуле (11.4.1) среднегодовой коэффициент роста при ежемесячном темпе роста q = 1.1 (мгновенный темп прироста α = lnq = 0.09531):
.
При этом коэффициент роста при t = 0 равен единице
,
а при t = 12
.
Среднее геометрическое значение коэффициентов роста в начале и конце года равно
.
Случай 2. Временной ряд описывается формулой (11.2.1)
.
Мгновенный темп прироста равен
и зависит от времени t - при u > 0 уменьшается, а при u < 0 растет.
Ежемесячный темп роста задается формулой
.
В частном случае, при
.
Коэффициент роста равен
.
Найдем среднее значение коэффициента роста уровня временного ряда на период a < t < b:
.
(11.4.3)
Формула (11.4.3) позволяет рассчитывать среднегодовой коэффициент роста уровня временного ряда с переменным темпом роста.
При a = 0, b = 12 последняя формула принимает вид
.
(11.4.4)
В частном случае при u→0 из (11.4.4) следует формула (11.4.1).