- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
2.5. Построение систем кривых роста и непрерывных распределений новых событий
Выше было установлено взаимно однозначное соответствие между кривой роста новых событий y = f (x) и законами распределения вероятностей новых событий, которые могут быть заданы невозрастающими средними плотностями распределения или функциями распределения. Эта взаимосвязь выражается формулами (2.2.11) – (2.2.14) и (2.2.16), (2.2.17), которые позволяют по одному известному закону распределения вероятностей новых событий строить систему непрерывных распределений и, следовательно, систему кривых роста новых событий. Построение систем распределений и кривых роста новых событий может быть осуществлено в следующем порядке.
1. Задаем среднюю плотность распределения вероятностей новых событий Она должна быть невозрастающей.
2. Находим кривую роста новых событий y = f (x).
3. По данной кривой находим среднюю плотность распределения , т.е. получаем новый вид распределения.
4. Предполагаем, что средняя плотность распределения задается формулой, которая получена на предыдущем этапе для средней плотности распределенияи возвращаемся к п. 2.
Этот процесс продолжаем до тех пор, покуда не получим достаточного количества данных для нахождения закона распределения вероятностей новых событий, а также кривой y = f (x) в общем виде.
Начнем с рассмотрения частных случаев.
Случай 1. Пусть все n событий, составляющих полную группу, имеют равные вероятности . Следовательно, плотностьp(t), аппроксимирующая вероятности , также постоянна –p(t) = . При этом условии формула (2.2.14′) дает:
Итак, один закон распределения вероятностей новых событий задан. Восстановим по этому закону кривую роста новых событий y = f (x) и среднюю плотность , для чего используем формулы (2.2.13), (2.2.17), (2.2.11). Функция распределения здесь равнаТогда согласно (2.2.17) имеем
,
откуда
.(2.5.1)
Далее по формуле (2.2.11) находим
, (2.5.2)
т.е. получен второй закон распределения.
Случай 2. Пусть теперь средняя плотность задается формулой (2.5.2) с тем же параметром, т.е.Проделавту же последовательность операций, что и в первом случае, найдем
,
, (2.5.3)
(2.5.4)
Случай 3. Пусть средняя плотность задается формулой (2.5.4)
Тогда
,
, (2.5.5)
Полученные результаты для большей наглядности сведены в таблицу.
Теперь нетрудно сделать обобщение. Оно достигается путем введения нового параметра u (см. табл. 2.5.1, столбец 7), при определенных значениях которого из общих формул будут следовать рассмотренные выше частные случаи.
Итак, в общем случае имеем
(2.5.6)
, (2.5.7)
(2.5.8)
. (2.5.9)
Таблица 2.5.1
Построение систем кривых роста и непрерывных распределений новых событий
№ п/п |
|
|
y =f(x) |
|
|
u |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1 |
α |
|
|
|
|
1 |
2 |
|
|
|
|
|
0 |
3 |
|
|
|
|
|
–1 |
Подставляя (2.5.9) в (2.2.16), после интегрирования найдем
. (2.5.10)
Рассмотрим плотность (2.5.6). Будем относить распределения к I типу при 0 < u < ∞; ко II типу – при u → 0; к III типу – при (– ∞ < u < 0).
При u = 1 формула (2.5.6) дает , т.е. имеем равномерное распределение, рассмотренное вслучае 1.
При u → 0 , т.е. плотность убывает по показательному закону(случай 2).
При u= -1 , т.е. имеемслучай 3. Здесь – масштабный параметр;u – параметр формы.
При переходе от плотности к плотностипараметр формыu уменьшается на единицу. Плотность является убывающей приu < 1, а плотность – приu < 2.
Итак, если новые события распределены по закону, заданному средней плотностью (2.5.6) с масштабным параметром и параметром формыu, то длительность интервалов (количество испытаний x) от начала испытаний до наступления нового события распределена по закону (2.5.8) с тем же масштабным параметром , но с параметром формы на единицу меньше(u-1); кривая роста новых событий описывается общим уравнением (2.5.10).
Представим уравнение, описывающее кривую роста новых событий, в дифференциальной форме. Поскольку на основании (2.2.12), (2.2.13)
, (2.5.11)
то из (2.6.7), (2.6.9) соответственно имеем
, (2.5.12)
(2.5.12')
Кривая роста новых событий, задаваемая дифференциальным уравнением (2.5.12), при u < 1 удовлетворяет всем пунктам условий (2.2.19), т.е. порождает только убывающие плотности распределения. Для получения более широкого семейства распределений необходимо снять ограничение (2.2.19,4), наложенное на кривую роста новых событий. Структура дифференциального уравнения (2.5.12) позволяет это сделать двумя способами: считать допустимыми значения параметра u > 1; ввести новый параметр.
Для расширения системы непрерывных распределений используем обе отмеченные возможности.
Итак, пусть – кривая роста новых событий, удовлетворяющая только первым трем пунктам условий (2.2.19). Эту кривую по аналогии с формулой (2.5.12) можно описать следующим дифференциальным уравнением
, (2.5.13)
где – параметры кривой;t – среднее значение числа разных событий, наступающих при испытаниях.
Дифференциальное уравнение (2.5.13) отличается от уравнения (2.5.12) прежде всего наличием параметра . Кроме того, на параметрu здесь не наложено ограничение u 1.
Тогда функция распределения будет равна
(2.5.14)
откуда дифференцированием по t получим выражение для плотности распределения вероятностей разных событий:
(2.5.15)
Последние две формулы задают семейство трехпараметрических непрерывных распределений.
Сделаем некоторые выводы.
Рассмотрен класс случайных функций, описывающих статистическую зависимость между количеством произведенных испытаний и количеством наступивших при этом разных событий.
По заданным вероятностям разных событий, составляющих полную группу, находится математическое ожидание случайной функции, а также аппроксимирующая его непрерывная кривая роста разных (новых) событий, которые принимаются в качестве вероятностных моделей текста.
Однако полученные результаты не дают возможности решать обратную задачу – по кривой роста новых событий находить закон распределения вероятностей разных событий, что было бы чрезвычайно важно для построения системы непрерывных распределений.
В связи с этим рассматривается другая форма закона распределения – распределение вероятностей новых событий. Последнее однозначно определяется кривой роста новых событий (новым считается любое из n разных событий, составляющих полную группу, при первом его появлении от начала испытаний).
Устанавливается связь между кривой роста новых событий и законами распределения вероятностей разных и новых событий, а также со статистической структурой выборки.
Наконец, строятся системы кривых роста и законов распределения новых событий, которые в свою очередь позволяют построить систему дискретных распределений [26, 27], а также более широкую систему непрерывных распределений. Выше получено семейство трехпараметрических распределений, для которого существует в явном виде функция распределения. Это семейство включает такие известные распределения, как показательное, Релея, Вейбулла и некоторые другие.
Таким образом, кривые роста новых событий рассмотрены во взаимосвязи с непрерывными законами распределения вероятностей разных и новых событий, а также с дискретными законами, устанавливающими связь между частотой m и количеством разных событий , наступающих с данной частотой приx испытаниях.