- •В.В. Нешитой
- •Методы статистического анализа
- •На базе
- •Обобщенных распределений
- •Предисловие
- •Введение
- •I. Случайные события и их вероятности
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •II. Основные теоремы теории вероятностей
- •2.1. Теорема сложения вероятностей (несовместных событий)
- •2.2. Теорема умножения вероятностей (независимых событий)
- •2.3. Формула полной вероятности
- •2.4. Теорема гипотез (формула Бейеса)
- •III. Дискретные случайные величины
- •3.1. Закон распределения вероятностей дискретной случайной величины
- •3.2. Числовые характеристики дискретной случайной величины
- •3.2.1. Математическое ожидание
- •3.2.2. Свойства математического ожидания
- •3.2.3. Дисперсия дискретной случайной величины
- •3.2.4. Свойства дисперсии
- •3.2.5. Среднее квадратическое отклонение
- •3.2.6. Одинаково распределенные взаимно независимые случайные величины
- •3.2.7. Моменты (начальные, центральные) дискретной случайной величины
- •4.2. Плотность распределения
- •4.3. Числовые характеристики непрерывных случайных величин
- •4.4. Примеры непрерывных распределений
- •4.4.1. Нормальный закон
- •5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •5.4. Метод моментов для точечной оценки параметров распределения
- •5.5. Метод наибольшего правдоподобия
- •VI. Обобщенные распределения. Системы непрерывных распределений
- •6.1. Методы построения обобщенных распределений
- •6.2. Построение системы непрерывных распределений методом обобщения
- •6.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •6.4. Распределения функций случайного аргумента
- •6.5. Три основные и три дополнительные системы непрерывных распределений в. Нешитого
- •VII. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •7.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •7.2. Метод наибольшего правдоподобия
- •7.3. Классический метод моментов
- •7.3.3. Симметричные распределения Ic-iiIc типов
- •7.3.4. Критерии для классификации кривых по методу моментов
- •7.4. Универсальный метод моментов
- •7.4.1. Законы распределения суммы независимых случайных величин
- •7.4.2. Центральная предельная теорема для трех систем непрерывных распределений
- •7.4.3. Законы распределения среднего выборочного
- •7.5. Общий устойчивый метод
- •VIII. Выравнивание и прогнозирование статистических распределений
- •8.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •8.2. Построение выравнивающей кривой распределения по статистическим данным
- •8.2.1. Выравнивание по классическому методу моментов
- •8.2.2. Выравнивание по универсальному методу моментов
- •8.2.3. Выравнивание по общему устойчивому методу
- •8.2.4. Выравнивающее распределение суммы независимых случайных величин
- •8.2.5. Выравнивающее распределение среднего выборочного
- •8.3. Прогнозирование распределений
- •8.3.1. Первая система непрерывных распределений
- •8.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
- •8.3.3. Показатели стабильности и качества выборки
- •Iх. Статистический анализ точности и стабильности технологических процессов на базе обобщенных распределений
- •9.1. Показатели состояния технологического процесса
- •9.2. Пример статистической обработки результатов замера контролируемого параметра по программе
- •Контрольный листок Деталь №_____(название) ø50 мм ±0,012 Точность си 0,002 Дата________ Время_______
- •Отклонения от номинального размера детали «nn» ø50 ±0,012
- •Показатели статистического распределения ( )
- •9.3. Экономическая эффективность применения обобщенных распределений
- •9.4. Особенности применения статистических методов в области строительства
- •Х. Надежность как особый критерий качества
- •10.1. Некоторые показатели надежности для невосстанавливаемых объектов
- •Плотность распределения отказов
- •Интенсивность отказов
- •Гамма-процентный ресурс
- •10.2. Вычисление показателей надежности по обобщенным распределениям
- •Результаты наблюдений о наработке до отказа двигателей панелевозов (ti – пробег до отказа в тыс. Км.; mi – число панелевозов, имеющих наработку ti)
- •Показатели статистического распределения (snr2v97)
- •Логарифмическое распределение типа 1.1 с параметрами
- •XI. Временные (динамические) ряды
- •11.1. Методы выделения тренда
- •11.2. Построение кривых роста для выравнивания временных рядов
- •11.2.1. Построение кривых роста с заданными свойствами
- •11.2.2. Метод обобщения
- •11.2.3. Кривые роста на базе обобщенных распределений
- •11.3. Оценивание параметров кривых роста
- •11.3.1. Уравнение прямой
- •11.3.2. Экспонента
- •11.3.3. Обобщенная кривая роста
- •11.4. Прогнозирование временных рядов
- •11.4.1. Параметрический метод прогнозирования
- •11.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по методу моментов
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по общему устойчивому методу
- •Значения квантили в зависимости от уровня вероятности и числа степеней свободы r
- •Приложение 5
- •Литература
- •Содержание
5.4. Метод моментов для точечной оценки параметров распределения
Метод предложен английским статистиком К. Пирсоном в конце прошлого века.
Его достоинство – чрезвычайная простота, особенно при небольшом числе параметров. Суть его сводится к приравниванию теоретических моментов, выраженных через параметры распределения, к эмпирическим.
Пусть задана плотность распределения с одним параметром, например, показательный закон
.
Требуется найти методом моментов точечную оценку параметра по выборке t1,t2,…,tn.
Решение. Выразим математическое ожидание через параметр
.
Приравняем далее эмпирический и теоретический моменты , откуда .
Оценка двух параметров. Запишем нормальный закон распределения
.
Здесь .
По выборке t1,t2,…,tn находим и и приравниваем теоретические моменты эмпирическим.
Следовательно, ; .
При бóльшем числе параметров необходимо составить r уравнений (по числу параметров) с r неизвестными и решить эту систему.
5.5. Метод наибольшего правдоподобия
Метод предложен английским статистиком Р. Фишером в 1912 г.
Обозначим вероятность того, что в результате испытания величина Х примет значение , через (для дискретной величины).
Функцией правдоподобия дискретной случайной величины называют функцию аргумента :
.
В качестве точечной оценки параметра принимают такое его значение *, при котором функция правдоподобия достигает максимума. Оценку * называют оценкой наибольшего правдоподобия.
Обычно вместо L используют логарифм функции правдоподобия , поскольку обе функции достигают максимума при одном и том же значении .
Оценка находится из условия .
Оценки метода наибольшего правдоподобия (МНП) не всегда совпадают с оценками метода моментов и часто требуют сложных вычислений.
Пример. Найти для показательного закона оценку параметра по МНП.
Видоизменим несколько МНП.
В качестве логарифмической функции правдоподобия используем величину .
Для этого вначале логарифмируем плотность р(t):
.
Далее находим математическое ожидание
.
Берем первую производную по α
.
Приравнивая полученное выражение нулю, находим =1/М(t).
Теперь осталось приравнять М(t) среднему выборочному и записать оценку параметра в виде: .
VI. Обобщенные распределения. Системы непрерывных распределений
В теории вероятностей и математической статистике известно большое количество непрерывных распределений. Однако, как показала практика, они не могут с достаточной точностью описать все многообразие статистических распределений. Кроме того, их использование затруднено тем, что они не сведены в систему.
Сложившаяся в настоящее время в прикладной статистике ситуация сравнима с той, которая была в химии накануне создания «Периодической системы элементов» Д.И. Менделеева – было известно достаточно много элементов, в некоторой степени изучены их свойства, но еще не было главного – «Периодического Закона», позволявшего предсказывать существование еще не открытых элементов и их свойства.
Следовательно, главная задача теории вероятностей и математической статистики на данном этапе – создание своего рода «Периодической системы распределений», исследование их свойств, разработка общих критериев для установления закона распределения случайной величины по статистическому распределению и разработка общих методов оценивания параметров.
Задача построения универсальных вероятностных моделей для аппроксимации (выравнивания) широкого класса статистических распределений в настоящей работе ставится не впервые.
Еще в 1895 г. английский статистик К. Пирсон предложил свое семейство непрерывных распределений, заданное в виде дифференциального уравнения [14, c.129].
.
Это семейство распределений он получил путем выравнивания дискретного гипергеометрического распределения. Им же был предложен метод моментов (назовем его классическим методом моментов) для нахождения оценок параметров выравнивающих распределений.
Существенным недостатком семейства распределений К. Пирсона является отсутствие обобщенной плотности, представленной в явном виде, что сильно ограничивает возможности его использования на практике. Кроме того, метод моментов не позволяет находить оценки параметров тех распределений, в том числе принадлежащих семейству К. Пирсона, которые не имеют моментов высших порядков (3-го или 4-го).
В 1912 г. английский статистик Р. Фишер предложил другой метод оценивания параметров практически любых распределений – метод наибольшего правдоподобия. Однако для использования этого метода необходимо заранее знать тип выравнивающего распределения. Кроме того, он требует совместного решения весьма сложных уравнений правдоподобия, число которых равно числу оцениваемых параметров.
Таким образом, задача установления типа выравнивающей кривой распределения и нахождения оценок параметров к настоящему времени до конца не решена. Поэтому разработка системы непрерывных распределений, более широкой, чем семейство кривых К. Пирсона, а также новых методов оценивания параметров имеет большое значение как в теоретических, так и прикладных исследованиях. Другими словами, требуется создание теории обобщенных распределений. Ниже излагаются элементы этой теории.