
- •В.В. Нешитой
- •Методы статистического анализа
- •На базе
- •Обобщенных распределений
- •Предисловие
- •Введение
- •I. Случайные события и их вероятности
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •II. Основные теоремы теории вероятностей
- •2.1. Теорема сложения вероятностей (несовместных событий)
- •2.2. Теорема умножения вероятностей (независимых событий)
- •2.3. Формула полной вероятности
- •2.4. Теорема гипотез (формула Бейеса)
- •III. Дискретные случайные величины
- •3.1. Закон распределения вероятностей дискретной случайной величины
- •3.2. Числовые характеристики дискретной случайной величины
- •3.2.1. Математическое ожидание
- •3.2.2. Свойства математического ожидания
- •3.2.3. Дисперсия дискретной случайной величины
- •3.2.4. Свойства дисперсии
- •3.2.5. Среднее квадратическое отклонение
- •3.2.6. Одинаково распределенные взаимно независимые случайные величины
- •3.2.7. Моменты (начальные, центральные) дискретной случайной величины
- •4.2. Плотность распределения
- •4.3. Числовые характеристики непрерывных случайных величин
- •4.4. Примеры непрерывных распределений
- •4.4.1. Нормальный закон
- •5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •5.4. Метод моментов для точечной оценки параметров распределения
- •5.5. Метод наибольшего правдоподобия
- •VI. Обобщенные распределения. Системы непрерывных распределений
- •6.1. Методы построения обобщенных распределений
- •6.2. Построение системы непрерывных распределений методом обобщения
- •6.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •6.4. Распределения функций случайного аргумента
- •6.5. Три основные и три дополнительные системы непрерывных распределений в. Нешитого
- •VII. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •7.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •7.2. Метод наибольшего правдоподобия
- •7.3. Классический метод моментов
- •7.3.3. Симметричные распределения Ic-iiIc типов
- •7.3.4. Критерии для классификации кривых по методу моментов
- •7.4. Универсальный метод моментов
- •7.4.1. Законы распределения суммы независимых случайных величин
- •7.4.2. Центральная предельная теорема для трех систем непрерывных распределений
- •7.4.3. Законы распределения среднего выборочного
- •7.5. Общий устойчивый метод
- •VIII. Выравнивание и прогнозирование статистических распределений
- •8.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •8.2. Построение выравнивающей кривой распределения по статистическим данным
- •8.2.1. Выравнивание по классическому методу моментов
- •8.2.2. Выравнивание по универсальному методу моментов
- •8.2.3. Выравнивание по общему устойчивому методу
- •8.2.4. Выравнивающее распределение суммы независимых случайных величин
- •8.2.5. Выравнивающее распределение среднего выборочного
- •8.3. Прогнозирование распределений
- •8.3.1. Первая система непрерывных распределений
- •8.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
- •8.3.3. Показатели стабильности и качества выборки
- •Iх. Статистический анализ точности и стабильности технологических процессов на базе обобщенных распределений
- •9.1. Показатели состояния технологического процесса
- •9.2. Пример статистической обработки результатов замера контролируемого параметра по программе
- •Контрольный листок Деталь №_____(название) ø50 мм ±0,012 Точность си 0,002 Дата________ Время_______
- •Отклонения от номинального размера детали «nn» ø50 ±0,012
- •Показатели статистического распределения ( )
- •9.3. Экономическая эффективность применения обобщенных распределений
- •9.4. Особенности применения статистических методов в области строительства
- •Х. Надежность как особый критерий качества
- •10.1. Некоторые показатели надежности для невосстанавливаемых объектов
- •Плотность распределения отказов
- •Интенсивность отказов
- •Гамма-процентный ресурс
- •10.2. Вычисление показателей надежности по обобщенным распределениям
- •Результаты наблюдений о наработке до отказа двигателей панелевозов (ti – пробег до отказа в тыс. Км.; mi – число панелевозов, имеющих наработку ti)
- •Показатели статистического распределения (snr2v97)
- •Логарифмическое распределение типа 1.1 с параметрами
- •XI. Временные (динамические) ряды
- •11.1. Методы выделения тренда
- •11.2. Построение кривых роста для выравнивания временных рядов
- •11.2.1. Построение кривых роста с заданными свойствами
- •11.2.2. Метод обобщения
- •11.2.3. Кривые роста на базе обобщенных распределений
- •11.3. Оценивание параметров кривых роста
- •11.3.1. Уравнение прямой
- •11.3.2. Экспонента
- •11.3.3. Обобщенная кривая роста
- •11.4. Прогнозирование временных рядов
- •11.4.1. Параметрический метод прогнозирования
- •11.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по методу моментов
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по общему устойчивому методу
- •Значения квантили в зависимости от уровня вероятности и числа степеней свободы r
- •Приложение 5
- •Литература
- •Содержание
11.2.2. Метод обобщения
Рассмотрим уравнения экспоненты и прямой:
.
Найдем такую обобщенную формулу, которая будет включать множество частных случаев, в том числе уравнения прямой и экспоненты.
Обобщим две последние формулы путем введения нового параметра u. Используя замечательный предел
,
представим обобщенное уравнение в виде
(11.2.1)
При u = 1 из (11.2.1) имеем прямую, при u→0 – экспоненту.
Если из опыта величина y0 неизвестна, то формулу (11.2.1) целесообразно представить в другом виде
, (11.2.2)
где
.
Чтобы увеличить аппроксимирующие возможности формул (11.2.1) и (11.2.2), введем в них дополнительный параметр β
(11.2.3)
. (11.2.4)
Исследуем темп прироста кривой (11.2.3). Для этого вначале прологарифмируем ее:
.
Тогда
. (11.2.5)
В частном случае, при u→0
. (11.2.6)
Из последней формулы следует, что при β = 1 (u→0) мгновенный темп прироста (и, следовательно, темп роста) не зависит от времени t. При β>1 темп прироста со временем растет, при β<1 – убывает. Это значит, что параметр β является показателем ускорения или замедления темпа прироста (и темпа роста) кривой (11.2.3), которая при u→0 имеет вид
. (11.2.7)
Из (11.2.5) следует, что при β = 1, u < 0 темп прироста кривой (11.2.3) со временем растет, а при u > 0 – убывает.
По характеру темпа прироста эмпирического временного ряда может быть установлена выравнивающая кривая, обладающая нужными свойствами.
На основании формул (11.2.3) и (11.2.4) можно получить другие кривые роста. Например, при t = ex
, (11.2.8)
. (11.2.9)
При
(11.2.10)
. (11.2.11)
Приведенные четырехпараметрические кривые роста содержат множество частных случаев и могут использоваться в различных областях знания для выравнивания и прогнозирования различных статистических зависимостей, в том числе временных рядов.
11.2.3. Кривые роста на базе обобщенных распределений
Широкую систему кривых роста можно построить на базе функций распределения:
(11.2.12)
, (11.2.13)
где N – некоторый параметр. Свойства этих кривых полностью определяются свойствами функции распределения F(t) (см. табл. 6.3.2).
Формула (11.2.12) может описывать, например, количество разных статей по определенной теме, опубликованных в первых t журналах, при условии, что последние упорядочены по убыванию количества таких статей; количество заболеваний при эпидемиях за время t от начала эпидемии, а также множество других кривых, в том числе кривых роста числа отказов за время t в испытаниях на надежность.
Другая, еще более широкая система кривых роста может быть построена на основе обобщенных распределений, заданных плотностями p(t), p(x), p(y). Вводя другие обозначения переменных и освобождаясь от ограничений, накладываемых на параметры кривых распределения, можем записать следующие уравнения для описания различного рода кривых роста, в том числе временных рядов:
11.3. Оценивание параметров кривых роста
11.3.1. Уравнение прямой
Оценки параметров кривых роста вычисляются по методу наименьших квадратов. При этом уравнение кривой должно быть приведено к линейному виду
. (11.3.1)
Рассеяние отдельных значений случайной величины Х относительно прямой (11.3.1) должно описываться первой системой непрерывных распределений (SNR1), поскольку здесь последующие значения случайной величины Хt+1 образуются из предыдущих Хt путем прибавления постоянной величины В (см. свойства SNR1).
Если фактические уровни временного ряда Хt получены как средние значения в моменты времени t (условные средние), то их рассеяние относительно прямой (11.3.1) может быть описано нормальным законом, который является частным случаем SNR1
или с учетом (11.3.1)
. (11.3.2)
Плотность (11.3.2) представляет собой вариационно-динамическую модель и содержит три параметра: А, В, σ. Их оценки можно найти по методу наибольшего правдоподобия. Для этого вначале прологарифмируем выражение (11.3.2)
и запишем логарифмическую функцию правдоподобия, представляющую собой математическое ожидание логарифма плотности распределения
.
Далее из условий
найдем уравнения правдоподобия:
Из первого уравнения имеем
.
Величина
представляет собой остаточную дисперсию,
несмещенная оценка которой равна
.
(11.3.3)
Из второго и третьего уравнений путем замены соответствующих математических ожиданий их оценками получим систему двух уравнений с двумя неизвестными А, В:
Решение этой системы дает
(11.3.4)
. (11.3.5)
Сделаем некоторые выводы.
Оценки
параметров А,
В, полученные
по методу наибольшего правдоподобия,
совпадают с оценками метода наименьших
квадратов. Оценка дисперсии
совпадает с ее оценкой по методу моментов.
В качестве критерия точности выравнивания временного ряда может быть принят минимум остаточной дисперсии
или минимум суммы квадратов отклонений эмпирических значений уровней ряда от теоретической прямой
.
В этом случае коэффициент корреляции должен быть максимальным.
Полученные результаты позволяют оценить нижнюю и верхнюю границы уровня временного ряда при заданной доверительной вероятности Р
, (11.3.6)
где величина Z зависит от доверительной вероятности Р и числа степеней свободы ν, которое связано с числом точек n. При малых n величина Z определяется по таблицам распределения Стьюдента.
При Р = 0,9 величину Z можно рассчитать по формуле
, (11.3.7)
которая получена автором путем выравнивания табличных данных по формуле (11.2.3).
Произведение ZS является показателем точности аппроксимации при заданной надежности (доверительной вероятности) Р.