- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
Распределения группы а
Тип кривой |
Функция распределения |
Плотность распределения |
Границы кривой |
I |
|
|
|
II |
|
|
|
III |
|
|
|
I |
|
|
|
II |
|
|
|
III |
|
|
|
Таблица 3.3.3
Распределения группы б
Тип кривой |
Плотность распределения |
Границы кривой |
I |
|
|
I |
|
|
II |
|
|
II |
|
|
III–V |
|
|
Таблица 3.3.4
Группа симметричных распределений
Тип кривой |
Плотность симметричного распределения |
Границы кривой |
Ic |
|
|
IIc |
|
|
IIIc–Vc |
|
|
3.4. Распределения функций случайного аргумента
Из обобщенной плотности (3.2.8) можно получить другие распределения как функции случайного аргумента.
Если две случайные величины Х, Т связаны между собой функциональной зависимостью X=f(T), причем с ростом Х растет Т, то вероятность P(X < x) = F(x) должна быть равна вероятности P(T < t) = F(t), т.е.
F(x) = F(t). (3.4.1)
Найдем зависимость между плотностями распределения р(х) и р(t).
По правилу дифференцирования сложной функции из (3.4.1) имеем
. (3.4.2)
Воспользуемся последней формулой для нахождения других обобщенных плотностей.
Пусть между двумя случайными величинами Т, Х существует взаимосвязь Т = еХ. Тогда и, следовательно,
. (3.4.3)
Характерной особенностью этой обобщенной плотности является то, что кривые III-V типов при являются симметричными.
Если , то таким же путем получим еще одну обобщенную плотность
. (3.4.4)
Кривые распределения, заданные тремя обобщенными плотностями p(x), p(t), p(y), имеют разнообразную форму. Например, для кривой I типа, заданной плотностью p(t), существуют формы начала и конца кривой, которые представлены ниже.
Рис.3.4.1. Формы начала кривой в зависимости
от значений параметра =k.
Рис. 3.4.2. Формы конца кривой в зависимости
от значений параметра u.
3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
Полученные выше обобщенные плотности распределения
(3.5.1) образуют три основные системы непрерывных распределений В.Нешитого.
Вторая основная система непрерывных распределений, заданная плотностью p(t), представлена в таблицах 3.3.3 и 3.3.4.
Введем в плотность р(t) дополнительный параметр сдвига l и перепишем ее в виде
. (3.5.2)
На основании плотности (3.5.2) можно получить три дополнительные системы непрерывных распределений.
Первая дополнительная система непрерывных распределений в общем случае задается формулой (3.5.2) при || = 1, а в случае симметричных распределений – при = 2, = 1.
Ее легко получить из второй основной системы непрерывных распределений. Для этого достаточно в табл.3.3.3 принять || = 1, t заменить на , а в табл. 3.3.4 заменить величинуt2 на .
Для обозначения типов кривых дополнительной системы непрерывных распределений будем использовать двузначный код, записанный арабскими цифрами через точку: 1.1, 1.1, 2.1 и т.д., где первая цифра обозначает тип кривой, а вторая (единица) указывает на то, что параметр =1; единица со штрихом соответствует параметру (см. табл.3.5.1).
В большинстве случаев в тексте используется единое обозначение типов, но при необходимости указывается, что || = 1.
В таблице 3.5.1. приведены существующие типы первой дополнительной системы непрерывных распределений.
Из симметричных распределений приведен один нормальный закон.
Распределения типа 1.1 при k = 1/u также являются симметричными. Первая дополнительная система непрерывных распределений представляет собой основную часть семейства кривых К. Пирсона.
Вторая дополнительная система непрерывных распределений получается из первой при t = ln y и прежних значениях параметров , . При этом обобщенная плотность имеет вид
. (3.5.3)
Третья дополнительная система непрерывных распределений получается из второй при
. (3.5.4)
Плотность (3.5.4), записанную без параметра сдвига l, (т.е. при l = 0) следует отнести к четвертой основной системе непрерывных распределений
(3.5.5)
Таблица 3.5.1
Первая дополнительная система непрерывных распределений
Тип кривой |
Плотность распределения (k==) |
Границы кривой |
1.1 |
|
|
1.1 |
|
|
2.1 |
|
|
2.1 |
|
|
3.1 |
|
|
IIc |
|
|
С учетом последней плотности имеем четыре основные системы непрерывных распределений.
Каждая из четырех систем отличается от других тем, что соответствующая случайная величина имеет свое начало отсчета:
X > - ; T > 0; Y > 1; W > e.
Между этими случайными величинами существуют соотношения
X = lnT; T = lnY; Y = lnW,
X = lnT = lnlnY = lnlnlnW,
T = eX = lnY = lnlnW.
Для всех четырех систем непрерывных распределений остается справедливой классификация распределений в зависимости от значений параметров α, u, а также от знака параметров β, γ.
Нормирующий множитель для заданного типа распределения во всех четырех системах вычисляется по одним и тем же формулам.