- •В.В. Нешитой
- •Методы статистического анализа
- •На базе
- •Обобщенных распределений
- •Предисловие
- •Введение
- •I. Случайные события и их вероятности
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •II. Основные теоремы теории вероятностей
- •2.1. Теорема сложения вероятностей (несовместных событий)
- •2.2. Теорема умножения вероятностей (независимых событий)
- •2.3. Формула полной вероятности
- •2.4. Теорема гипотез (формула Бейеса)
- •III. Дискретные случайные величины
- •3.1. Закон распределения вероятностей дискретной случайной величины
- •3.2. Числовые характеристики дискретной случайной величины
- •3.2.1. Математическое ожидание
- •3.2.2. Свойства математического ожидания
- •3.2.3. Дисперсия дискретной случайной величины
- •3.2.4. Свойства дисперсии
- •3.2.5. Среднее квадратическое отклонение
- •3.2.6. Одинаково распределенные взаимно независимые случайные величины
- •3.2.7. Моменты (начальные, центральные) дискретной случайной величины
- •4.2. Плотность распределения
- •4.3. Числовые характеристики непрерывных случайных величин
- •4.4. Примеры непрерывных распределений
- •4.4.1. Нормальный закон
- •5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •5.4. Метод моментов для точечной оценки параметров распределения
- •5.5. Метод наибольшего правдоподобия
- •VI. Обобщенные распределения. Системы непрерывных распределений
- •6.1. Методы построения обобщенных распределений
- •6.2. Построение системы непрерывных распределений методом обобщения
- •6.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •6.4. Распределения функций случайного аргумента
- •6.5. Три основные и три дополнительные системы непрерывных распределений в. Нешитого
- •VII. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •7.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •7.2. Метод наибольшего правдоподобия
- •7.3. Классический метод моментов
- •7.3.3. Симметричные распределения Ic-iiIc типов
- •7.3.4. Критерии для классификации кривых по методу моментов
- •7.4. Универсальный метод моментов
- •7.4.1. Законы распределения суммы независимых случайных величин
- •7.4.2. Центральная предельная теорема для трех систем непрерывных распределений
- •7.4.3. Законы распределения среднего выборочного
- •7.5. Общий устойчивый метод
- •VIII. Выравнивание и прогнозирование статистических распределений
- •8.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •8.2. Построение выравнивающей кривой распределения по статистическим данным
- •8.2.1. Выравнивание по классическому методу моментов
- •8.2.2. Выравнивание по универсальному методу моментов
- •8.2.3. Выравнивание по общему устойчивому методу
- •8.2.4. Выравнивающее распределение суммы независимых случайных величин
- •8.2.5. Выравнивающее распределение среднего выборочного
- •8.3. Прогнозирование распределений
- •8.3.1. Первая система непрерывных распределений
- •8.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
- •8.3.3. Показатели стабильности и качества выборки
- •Iх. Статистический анализ точности и стабильности технологических процессов на базе обобщенных распределений
- •9.1. Показатели состояния технологического процесса
- •9.2. Пример статистической обработки результатов замера контролируемого параметра по программе
- •Контрольный листок Деталь №_____(название) ø50 мм ±0,012 Точность си 0,002 Дата________ Время_______
- •Отклонения от номинального размера детали «nn» ø50 ±0,012
- •Показатели статистического распределения ( )
- •9.3. Экономическая эффективность применения обобщенных распределений
- •9.4. Особенности применения статистических методов в области строительства
- •Х. Надежность как особый критерий качества
- •10.1. Некоторые показатели надежности для невосстанавливаемых объектов
- •Плотность распределения отказов
- •Интенсивность отказов
- •Гамма-процентный ресурс
- •10.2. Вычисление показателей надежности по обобщенным распределениям
- •Результаты наблюдений о наработке до отказа двигателей панелевозов (ti – пробег до отказа в тыс. Км.; mi – число панелевозов, имеющих наработку ti)
- •Показатели статистического распределения (snr2v97)
- •Логарифмическое распределение типа 1.1 с параметрами
- •XI. Временные (динамические) ряды
- •11.1. Методы выделения тренда
- •11.2. Построение кривых роста для выравнивания временных рядов
- •11.2.1. Построение кривых роста с заданными свойствами
- •11.2.2. Метод обобщения
- •11.2.3. Кривые роста на базе обобщенных распределений
- •11.3. Оценивание параметров кривых роста
- •11.3.1. Уравнение прямой
- •11.3.2. Экспонента
- •11.3.3. Обобщенная кривая роста
- •11.4. Прогнозирование временных рядов
- •11.4.1. Параметрический метод прогнозирования
- •11.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по методу моментов
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по общему устойчивому методу
- •Значения квантили в зависимости от уровня вероятности и числа степеней свободы r
- •Приложение 5
- •Литература
- •Содержание
7.5. Общий устойчивый метод
Проверка
показала, что универсальный метод
моментов в принципе решает задачу
оценивания параметров обобщенных
распределений. Однако существенным
его недостатком является неустойчивость,
поскольку эмпирические моменты высоких
порядков (
)
сильно зависят от значений частот на
концах распределения.
Поэтому автором обобщенных распределений был разработан общий устойчивый метод оценивания параметров [10-13], который по точности не уступает методу наибольшего правдоподобия, но значительно проще последнего.
Здесь так же, как и в случае универсального метода моментов, вводятся два показателя – асимметрии В и островершинности Н, которые зависят от двух параметров формы k=γ/β,u. По этим показателям устанавливается тип выравнивающей кривой распределения и находятся оценки параметров k, u. Оценки двух других параметров рассчитываются по простым формулам.
Достоинством метода является его устойчивость, т.е. он мало чувствителен к выбросам на концах статистического распределения.
К недостаткам его следует отнести то, что для оценивания параметров выравнивающей кривой он требует группирования статистических данных, так же как и метод наибольшего правдоподобия.
Если обобщенное распределение задано плотностью р(x), то показатели В, Н равны
, (7.5.1)
где
. (7.5.2)
Исследования
показали, что величина Н
задана на интервале
,
а величина В
– на интервале –1/4<B<1/4.
Вычислим для разных типов распределений значения показателей В, Н при различных значениях параметров k, u. Далее построим номограмму (Приложение 3). Она справедлива для трех основных систем непрерывных распределений, заданных первыми плотностями. При этом они должны быть приведены к форме плотности р(х).
На
номограмме распределения II, II
и IV типов представлены кривыми. Типы I,
I
, III, V занимают определенные области.
Симметричные распределения IIIc, Vc типов
представлены отрезками на оси ОН: для
IIIc типов
;
для Vc типа
.
Распределения IVс типа представлены
точкой
.
Распределения IIс типа также представлены
точкой
.
На
номограмме
изображены области распределений с
левосторонней асимметрией, для которых
.
Сюда относится часть распределений
III-V типов при 0<k<(1–1/u)/2,
а также распределения I, II типов. При
этом распределения приведены к форме
плотности р(х).
Распределения
I,
II
типов, а также часть распределений III-V
типов при (1–1/u)/2<k<1–1/u
имеют правостороннюю
асимметрию.
Для них
–1/4<B<0,
причем для распределений I, II и I,
II
типов справедливы равенства:
.
Таким образом, показатели В, Н однозначно определяют тип распределения, приведенного к форме плотности р(х). Более того, с помощью этих показателей могут быть найдены оценки параметров u, k непосредственно из номограммы.
Для распределений III-V типов при В < 0 из номограммы вначале находятся оценки параметров k, u (при В > 0), затем вычисляется величина k=1–1/u–k.
Оценка параметра β для всех типов равна [11]
.
(7.5.3)
Тогда γ = kβ.
Оценки параметра для распределений II, II типов и произведения αu для остальных типов равны [10-12]:
(7.5.4)
где
в зависимости от типа распределения
величины
и
рассчитываются
по формулам:
Типы I, I:
(7.5.5)
Типы II, II:
(7.5.6)
Типы III-V:
(7.5.7)
Величина
(7.5.8)
может
быть вычислена по приближенным формулам:
- при x > 4
(7.5.9)
- при 0<x<4
, (7.5.10)
где
(7.5.11)
Для облегчения расчетов в Приложении 1 приводятся также значения функции g(x).
Для
установления типа выравнивающей кривой
распределения и нахождения оценок
параметров по общему устойчивому методу
достаточно найти значения статистических
показателей
и приравнять их соответствующим
теоретическим. Эти
показатели для каждой системы непрерывных
распределений вычисляются по-своему.
Но номограмма
применима ко всем трем системам
непрерывных распределений.
Оценки статистических показателей в случае выравнивающих распределений, заданных плотностью р(х), вычисляются по формулам:
(7.5.12)
где
рi=mi/(Mhi)
– эмпирическая плотность распределения;
mi
– наблюденная
частота случайной величины Х
в i-ом
интервале
- наблюденная частота во всех n
интервалах (объем выборки); hi
– ширина i-го
интервала; хi
– значение случайной величины Х
в середине i-го
интервала.
Формулы (7.5.12) можно выразить через абсолютные частоты mi:
(7.5.13)
Показатель островершинности Н* при hi = const примет вид
, (7.5.14)
т.е.
ширина интервала не входит в формулу
(7.5.14). Отсюда
следует вывод, что ширину
интервала группирования статистических
данных лучше принимать постоянной
(по крайней мере для распределений,
близких к симметричным).
Если выравнивающее распределение задано обобщенной плотностью p(t), статистические показатели рассчитываются по формулам:
(7.5.15)
При hi = const
. (7.5.16)
Для
установления типа выравнивающей кривой
и нахождения оценок параметров по общему
устойчивому методу автором созданы
программы
.
В заключение отметим, что общий устойчивый метод основан на взаимосвязи между законами распределения случайных величин Х и Z.
Запишем обобщенную плотность р(х)
.
Пусть для определенности параметр u > 0.
Введем случайную величину
. (7.5.17)
Тогда плотность р(z) будет равна
.
Поскольку на основании (7.5.17)
,
то
, (7.5.18)
откуда имеем замечательное равенство
βzp(z)=p(x). (7.5.19)
На его базе строится общий устойчивый метод оценивания параметров.
Поскольку
плотность р(z)
является функцией двух параметров формы
,
то последняя формула позволяет ввести
критерии, зависящие от этих двух
параметров.
Запишем на основании формулы (7.5.19) следующее равенство:
.
Введем обозначения
.
Тогда последнее равенство перепишется в виде
. (7.5.20)
Формула
(7.5.20) позволяет найти значение параметра
β (например,
при r
=1), а также
получить критерий островершинности,
зависящий от двух параметров k,
u. Для этого
необходимо взять отношение
либо
.
Последнее оказалось наиболее подходящим.
Таким путем был получен показатель островершинности Н.
Показатель асимметрии В найден из условия, чтобы для симметричных распределений он был равен нулю и в то же время использовал ранее введенные величины. Такой показатель может иметь вид
или
.
Покажем, что он зависит от двух параметров k, u.
Поскольку
,
то
.
По
показателям В,
Н строится
номограмма, позволяющая устанавливать
тип выравнивающей кривой распределения
и находить оценки параметров k,
u. Оценка
параметра β вычисляется по величинам
.
Оценка параметра α или произведения αu
вычисляется по тем же формулам, что и в
случае универсального метода моментов.
Если в качестве показателей асимметрии и островершинности использовать величины
где xс – мода, то можно построить аналогичную номограмму для установления типа выравнивающей кривой распределения и нахождения в первом приближении оценок параметров k, u по координатам одной характерной точки С и среднему значению плотности р(х).
