- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
4.4.1. Расширение трех систем непрерывных распределений
Построенная номограмма состоит из двух частей. Верхняя часть (выше прямой ) относится к распределениям с плотностьюр(x) или к распределениям с плотностью p(t), p(y), которые приведены соответственно к форме
tp(t) = p(lnt); ylnyp(y) = p(lnlny).
Нижняя часть номограммы относится к распределениям I типа с плотностью p(t) при β=1 (т.е. типа 1.1) и является продолжением верхней части. Прямой припредставлены распределения второго типа с параметром(гамма-распределения).
Это дает возможность расширить основные системы непрерывных распределений за счет включения в них распределений типов 1.1 и 2.1, которые относятся к дополнительным системам непрерывных распределений (с параметром β=1) [24].
Тогда первая (основная) система непрерывных распределений SNR1 в общем случае будет включать три обобщенные плотности
. (4.4.17)
Первая система непрерывных распределений включает две группы симметричных распределений. Одна из них (типы IIIc–Vc) задана первой плотностью при k. Другая (типы Ic–Vc) – третьей плотностью. Кроме того, симметричны распределения I типа, заданные второй плотностью, приku = 1.
Первая система непрерывных распределений может быть также задана двумя плотностями (без последней) или даже одной плотностью р(x).
Аналогично во вторую основную систему непрерывных распределений SNR2 войдут обобщенные плотности
, (4.4.18)
которые получены из первой системы как распределения функций случайных аргументов: Х=lnT – для первой плотности; T=lnY – для двух других плотностей.
Наконец, в третью основную систему непрерывных распределений SNR3 войдут обобщенные плотности
. (4.4.19)
Вторая и третья основные системы непрерывных распределений также могут быть заданы либо двумя плотностями (без третьей), либо одной первой плотностью распределения.
Для нахождения оценок параметров трех основных систем непрерывных распределений по методу моментов автором созданы программы .
Номограмма, представленная в приложении 2, остается справедливой для трех основных систем непрерывных распределений.
4.4.2. Законы распределения суммы независимых случайных величин
Системы непрерывных распределений, заданные обобщенными плотностями, а также методы оценивания параметров, доведенные до программной реализации, позволяют более просто решать различные задачи.
Пусть, например, требуется установить закон распределения суммы n независимых одинаково распределенных случайных величин Х=Х1+Х2+…+Хn, т.е. композицию n распределений. Среднее каждой случайной величины равно 1.
Распределение случайной величины Хi может быть задано как аналитически, так и таблично. Для нахождения закона распределения суммы n независимых случайных величин в обоих случаях можно использовать общий метод.
Для этого достаточно вычислить моменты суммы n независимых случайных величин 1(n), μ2(n), μ3(n), μ4(n), а также показатели β1(n) и β2(n) по известным моментам случайной величины Хi.
Далее по методу моментов (универсальному или классическому) с помощью программы устанавливается тип выравнивающей кривой и находятся оценки параметров.
Пусть моменты случайной величины Хi известны. Обозначим их соответственно, 1, μ2, μ3 μ4.
Тогда среднее суммы n независимых случайных величин будет равно
. (4.4.20)
Если случайные величины Хi равны и подчиняются одному и тому же закону распределения, то
. (4.4.21)
Найдем далее центральный момент второго порядка суммы n независимых одинаково распределенных случайных величин μ2(n).
Начнем с рассмотрения суммы двух независимых случайных величин:
,
где .
Обозначим для краткости . Тогда
.
Поскольку для двух независимых случайных величин М(ху)= М(х)М(у), последнее выражение можно представить в виде
или
.
Но центральный момент первого порядка равен нулю. Поэтому второе слагаемое здесь равно нулю, и последняя формула примет вид
. (4.4.22)
На основании рассмотренного примера можно сформулировать следующее правило: при возведении в r-ю степень суммы случайных величин х=Х–mx; y=Y–my,… в итоге следует учесть только те члены, которые не содержат первых степеней сомножителей, так как их математические ожидания равны нулю.
Используя это правило, найдем центральный момент второго порядка суммы трех случайных величин
,
где х=Х–mx; y=Y–my; z=Z–mz.
Итак,
.
Здесь не записаны члены, математические ожидания которых равны нулю. Следовательно,
. (4.4.23)
В случае суммы n независимых одинаково распределенных случайных величин
. (4.4.24)
Найдем далее выражение для центрального момента третьего порядка суммы n независимых одинаково распределенных случайных величин.
Рассмотрим вначале сумму двух независимых случайных величин
,
откуда
. (4.4.25)
Аналогично для суммы трех случайных величин имеем
Математические ожидания остальных членов в квадратных скобках равны нулю. Таким образом,
. (4.4.26)
Для суммы n независимых одинаково распределенных случайных величин
. (4.4.27)
И, наконец, найдем выражение для центрального момента четвертого порядка суммы n независимых одинаково распределенных случайных величин.
Начнем с суммы двух случайных величин
,
где по-прежнему . Итак,
Отсюда имеем
. (4.4.28)
Если Х=Y, то
. (4.4.29)
Найдем далее центральный момент четвертого порядка суммы трех случайных величин
откуда
(4.4.30)
Если Х=Y=Z, то
. (4.4.31)
На основании формул (4.4.29) и (4.4.31) можно записать общее выражение для центрального момента 4-го порядка суммы n независимых одинаково распределенных случайных величин
. (4.4.32)
Действительно, произведение приn=2 равно 6, а при n=3 равно 18.
Таким образом, моменты суммы n независимых одинаково распределенных случайных величин Х=Хi равны
(4.4.33)
и легко вычисляются по моментам отдельной случайной величины Хi. Далее по известным моментам можно найти выравнивающее распределение суммы n независимых одинаково распределенных случайных величин.
При этом найденное выравнивающее распределение может совпадать с композицией законов распределения слагаемых (например, в случае n показательных законов), но может и не совпадать с ней (например, если случайные величины распределены по закону равномерной плотности). Это связано с тем, что моменты не определяют полностью распределения. Кроме того, следует иметь в виду, что композиция двух равномерных распределений дает треугольное симметричное распределение, которого в системе непрерывных распределений просто не существует. Поэтому задача по нахождению распределения суммы n независимых одинаково распределенных случайных величин с помощью обобщенных распределений в общем случае может быть решена лишь приближенно, особенно при небольших значениях n, как, например, в случае двух равномерных распределений. С ростом n точность решения этой задачи быстро возрастает. В некоторых частных случаях, например, в случае гамма-распределения, эта задача решается точно при любых n.