- •В.В. Нешитой
- •Методы статистического анализа
- •На базе
- •Обобщенных распределений
- •Предисловие
- •Введение
- •I. Случайные события и их вероятности
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •II. Основные теоремы теории вероятностей
- •2.1. Теорема сложения вероятностей (несовместных событий)
- •2.2. Теорема умножения вероятностей (независимых событий)
- •2.3. Формула полной вероятности
- •2.4. Теорема гипотез (формула Бейеса)
- •III. Дискретные случайные величины
- •3.1. Закон распределения вероятностей дискретной случайной величины
- •3.2. Числовые характеристики дискретной случайной величины
- •3.2.1. Математическое ожидание
- •3.2.2. Свойства математического ожидания
- •3.2.3. Дисперсия дискретной случайной величины
- •3.2.4. Свойства дисперсии
- •3.2.5. Среднее квадратическое отклонение
- •3.2.6. Одинаково распределенные взаимно независимые случайные величины
- •3.2.7. Моменты (начальные, центральные) дискретной случайной величины
- •4.2. Плотность распределения
- •4.3. Числовые характеристики непрерывных случайных величин
- •4.4. Примеры непрерывных распределений
- •4.4.1. Нормальный закон
- •5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •5.4. Метод моментов для точечной оценки параметров распределения
- •5.5. Метод наибольшего правдоподобия
- •VI. Обобщенные распределения. Системы непрерывных распределений
- •6.1. Методы построения обобщенных распределений
- •6.2. Построение системы непрерывных распределений методом обобщения
- •6.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •6.4. Распределения функций случайного аргумента
- •6.5. Три основные и три дополнительные системы непрерывных распределений в. Нешитого
- •VII. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •7.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •7.2. Метод наибольшего правдоподобия
- •7.3. Классический метод моментов
- •7.3.3. Симметричные распределения Ic-iiIc типов
- •7.3.4. Критерии для классификации кривых по методу моментов
- •7.4. Универсальный метод моментов
- •7.4.1. Законы распределения суммы независимых случайных величин
- •7.4.2. Центральная предельная теорема для трех систем непрерывных распределений
- •7.4.3. Законы распределения среднего выборочного
- •7.5. Общий устойчивый метод
- •VIII. Выравнивание и прогнозирование статистических распределений
- •8.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •8.2. Построение выравнивающей кривой распределения по статистическим данным
- •8.2.1. Выравнивание по классическому методу моментов
- •8.2.2. Выравнивание по универсальному методу моментов
- •8.2.3. Выравнивание по общему устойчивому методу
- •8.2.4. Выравнивающее распределение суммы независимых случайных величин
- •8.2.5. Выравнивающее распределение среднего выборочного
- •8.3. Прогнозирование распределений
- •8.3.1. Первая система непрерывных распределений
- •8.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
- •8.3.3. Показатели стабильности и качества выборки
- •Iх. Статистический анализ точности и стабильности технологических процессов на базе обобщенных распределений
- •9.1. Показатели состояния технологического процесса
- •9.2. Пример статистической обработки результатов замера контролируемого параметра по программе
- •Контрольный листок Деталь №_____(название) ø50 мм ±0,012 Точность си 0,002 Дата________ Время_______
- •Отклонения от номинального размера детали «nn» ø50 ±0,012
- •Показатели статистического распределения ( )
- •9.3. Экономическая эффективность применения обобщенных распределений
- •9.4. Особенности применения статистических методов в области строительства
- •Х. Надежность как особый критерий качества
- •10.1. Некоторые показатели надежности для невосстанавливаемых объектов
- •Плотность распределения отказов
- •Интенсивность отказов
- •Гамма-процентный ресурс
- •10.2. Вычисление показателей надежности по обобщенным распределениям
- •Результаты наблюдений о наработке до отказа двигателей панелевозов (ti – пробег до отказа в тыс. Км.; mi – число панелевозов, имеющих наработку ti)
- •Показатели статистического распределения (snr2v97)
- •Логарифмическое распределение типа 1.1 с параметрами
- •XI. Временные (динамические) ряды
- •11.1. Методы выделения тренда
- •11.2. Построение кривых роста для выравнивания временных рядов
- •11.2.1. Построение кривых роста с заданными свойствами
- •11.2.2. Метод обобщения
- •11.2.3. Кривые роста на базе обобщенных распределений
- •11.3. Оценивание параметров кривых роста
- •11.3.1. Уравнение прямой
- •11.3.2. Экспонента
- •11.3.3. Обобщенная кривая роста
- •11.4. Прогнозирование временных рядов
- •11.4.1. Параметрический метод прогнозирования
- •11.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по методу моментов
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по общему устойчивому методу
- •Значения квантили в зависимости от уровня вероятности и числа степеней свободы r
- •Приложение 5
- •Литература
- •Содержание
7.5. Общий устойчивый метод
Проверка показала, что универсальный метод моментов в принципе решает задачу оценивания параметров обобщенных распределений. Однако существенным его недостатком является неустойчивость, поскольку эмпирические моменты высоких порядков ( ) сильно зависят от значений частот на концах распределения.
Поэтому автором обобщенных распределений был разработан общий устойчивый метод оценивания параметров [10-13], который по точности не уступает методу наибольшего правдоподобия, но значительно проще последнего.
Здесь так же, как и в случае универсального метода моментов, вводятся два показателя – асимметрии В и островершинности Н, которые зависят от двух параметров формы k=γ/β,u. По этим показателям устанавливается тип выравнивающей кривой распределения и находятся оценки параметров k, u. Оценки двух других параметров рассчитываются по простым формулам.
Достоинством метода является его устойчивость, т.е. он мало чувствителен к выбросам на концах статистического распределения.
К недостаткам его следует отнести то, что для оценивания параметров выравнивающей кривой он требует группирования статистических данных, так же как и метод наибольшего правдоподобия.
Если обобщенное распределение задано плотностью р(x), то показатели В, Н равны
, (7.5.1) где
. (7.5.2)
Исследования показали, что величина Н задана на интервале , а величина В – на интервале –1/4<B<1/4.
Вычислим для разных типов распределений значения показателей В, Н при различных значениях параметров k, u. Далее построим номограмму (Приложение 3). Она справедлива для трех основных систем непрерывных распределений, заданных первыми плотностями. При этом они должны быть приведены к форме плотности р(х).
На номограмме распределения II, II и IV типов представлены кривыми. Типы I, I , III, V занимают определенные области. Симметричные распределения IIIc, Vc типов представлены отрезками на оси ОН: для IIIc типов ; для Vc типа . Распределения IVс типа представлены точкой . Распределения IIс типа также представлены точкой .
На номограмме изображены области распределений с левосторонней асимметрией, для которых . Сюда относится часть распределений III-V типов при 0<k<(1–1/u)/2, а также распределения I, II типов. При этом распределения приведены к форме плотности р(х).
Распределения I, II типов, а также часть распределений III-V типов при (1–1/u)/2<k<1–1/u имеют правостороннюю асимметрию. Для них –1/4<B<0, причем для распределений I, II и I, II типов справедливы равенства: .
Таким образом, показатели В, Н однозначно определяют тип распределения, приведенного к форме плотности р(х). Более того, с помощью этих показателей могут быть найдены оценки параметров u, k непосредственно из номограммы.
Для распределений III-V типов при В < 0 из номограммы вначале находятся оценки параметров k, u (при В > 0), затем вычисляется величина k=1–1/u–k.
Оценка параметра β для всех типов равна [11]
. (7.5.3)
Тогда γ = kβ.
Оценки параметра для распределений II, II типов и произведения αu для остальных типов равны [10-12]:
(7.5.4) где в зависимости от типа распределения величины и рассчитываются по формулам:
Типы I, I:
(7.5.5)
Типы II, II:
(7.5.6)
Типы III-V:
(7.5.7)
Величина
(7.5.8) может быть вычислена по приближенным формулам:
- при x > 4
(7.5.9)
- при 0<x<4
, (7.5.10) где
(7.5.11)
Для облегчения расчетов в Приложении 1 приводятся также значения функции g(x).
Для установления типа выравнивающей кривой распределения и нахождения оценок параметров по общему устойчивому методу достаточно найти значения статистических показателей и приравнять их соответствующим теоретическим. Эти показатели для каждой системы непрерывных распределений вычисляются по-своему. Но номограмма применима ко всем трем системам непрерывных распределений.
Оценки статистических показателей в случае выравнивающих распределений, заданных плотностью р(х), вычисляются по формулам:
(7.5.12) где рi=mi/(Mhi) – эмпирическая плотность распределения; mi – наблюденная частота случайной величины Х в i-ом интервале - наблюденная частота во всех n интервалах (объем выборки); hi – ширина i-го интервала; хi – значение случайной величины Х в середине i-го интервала.
Формулы (7.5.12) можно выразить через абсолютные частоты mi:
(7.5.13)
Показатель островершинности Н* при hi = const примет вид
, (7.5.14) т.е. ширина интервала не входит в формулу (7.5.14). Отсюда следует вывод, что ширину интервала группирования статистических данных лучше принимать постоянной (по крайней мере для распределений, близких к симметричным).
Если выравнивающее распределение задано обобщенной плотностью p(t), статистические показатели рассчитываются по формулам:
(7.5.15)
При hi = const
. (7.5.16)
Для установления типа выравнивающей кривой и нахождения оценок параметров по общему устойчивому методу автором созданы программы .
В заключение отметим, что общий устойчивый метод основан на взаимосвязи между законами распределения случайных величин Х и Z.
Запишем обобщенную плотность р(х)
.
Пусть для определенности параметр u > 0.
Введем случайную величину
. (7.5.17)
Тогда плотность р(z) будет равна
.
Поскольку на основании (7.5.17)
,
то
, (7.5.18)
откуда имеем замечательное равенство
βzp(z)=p(x). (7.5.19)
На его базе строится общий устойчивый метод оценивания параметров.
Поскольку плотность р(z) является функцией двух параметров формы , то последняя формула позволяет ввести критерии, зависящие от этих двух параметров.
Запишем на основании формулы (7.5.19) следующее равенство:
.
Введем обозначения
.
Тогда последнее равенство перепишется в виде
. (7.5.20)
Формула (7.5.20) позволяет найти значение параметра β (например, при r =1), а также получить критерий островершинности, зависящий от двух параметров k, u. Для этого необходимо взять отношение либо . Последнее оказалось наиболее подходящим.
Таким путем был получен показатель островершинности Н.
Показатель асимметрии В найден из условия, чтобы для симметричных распределений он был равен нулю и в то же время использовал ранее введенные величины. Такой показатель может иметь вид
или
.
Покажем, что он зависит от двух параметров k, u.
Поскольку , то
.
По показателям В, Н строится номограмма, позволяющая устанавливать тип выравнивающей кривой распределения и находить оценки параметров k, u. Оценка параметра β вычисляется по величинам . Оценка параметра α или произведения αu вычисляется по тем же формулам, что и в случае универсального метода моментов.
Если в качестве показателей асимметрии и островершинности использовать величины
где xс – мода, то можно построить аналогичную номограмму для установления типа выравнивающей кривой распределения и нахождения в первом приближении оценок параметров k, u по координатам одной характерной точки С и среднему значению плотности р(х).