- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
Используя теорию производящих функций, можно показать, что для первой системы непрерывных распределений, заданной обобщенной плотностью
,
моменты суммы n независимых одинаково распределенных случайных величин связаны с моментами случайной величиныХi формулами (4.4.33).
Производящая функция в этом случае есть
где t – вспомогательный параметр.
Выразим на основании формул (4.4.33) показатели асимметрии и островершинности распределения суммы n независимых одинаково распределенных случайных величин ичерез аналогичные показатели отдельной случайной величиныХi , т.е. и :
. (4.4.34)
Из формул (4.4.34) немедленно следует центральная предельная теорема теории вероятностей (для первой системы непрерывных распределений): распределение суммы n независимых одинаково распределенных случайных величин с ростом n асимптотически приближается к нормальному закону или, другими словами, сумма n независимых случайных величин имеет асимптотически нормальное распределение
, (4.4.35)
для которого =0,=3. При этом на номограмме (приложение 2) точка с координатами с ростомn перемещается по прямой от точки (;) исходного распределения (случайной величиныХi) к точке (0;3) нормального закона, оценки параметров которого равны
. (4.4.36)
Формулы (4.4.33), (4.4.34) позволяют также переходить от распределения суммы n независимых одинаково распределенных случайных величин к распределению отдельной случайной величины Хi. Для этого в указанных формулах достаточно заменить величину n на n' = 1/n. Далее по методу моментов находится выравнивающее распределение.
Полученные выше результаты остаются в силе и для обобщенной плотности
,
т.е. в случае второй системы непрерывных распределений, если ее привести к форме плотности р(х), это значит представить в виде
.
Моменты случайной величины будут задаваться формулами
Формулировка центральной предельной теоремы несколько изменится: распределение суммы логарифмов n независимых одинаково распределенных случайных величин с ростомn асимптотически приближается к нормальному закону, а произведение n случайных величин Т=Т1Т2…Тn – к логарифмически нормальному закону
, (4.4.37)
для которого =0,=3. Оценки параметров ν1(n), α задаются формулами (4.4.36).
И, наконец, в случае третьей системы непрерывных распределений, заданных обобщенной плотностью
,
полученные выше результаты остаются справедливыми, если ее также привести к форме плотности р(х), т.е. представить в виде
.
Тогда моменты случайной величины будут задаваться формулами
Центральная предельная теорема сформулируется в виде: распределение суммы двойных логарифмов n независимых одинаково распределенных случайных величин с ростом n асимптотически приближается к нормальному закону, произведение – к логарифмически нормальному закону, а величина– к двойному логарифмически нормальному закону
, (4.4.38)
для которого =0,=3.
Здесь также оценки параметров 1(n) , α задаются формулами (4.4.36).
4.4.4. Законы распределения среднего выборочного
Рассмотрим n случайных величин, распределенных по одному и тому же закону, заданному, например, обобщенной плотностью р(х) (или p(t), или р(у)).
Найдем закон распределения среднего выборочного , (или, или) по заданному закону распределения случайной величиныХ (или илиlnlnY).
Для решения этой задачи достаточно найти центральные моменты (2–4)-го порядков среднего арифметического n независимых одинаково распределенных случайных величин и вычислить показатели асимметрии и островершинности. Далее по универсальному или классическому методу моментов с помощью программы легко устанавливается тип искомого распределения и вычисляются оценки его параметров.
Известно, что математическое ожидание среднего арифметического n независимых случайных величин с одинаковыми средними равно среднему отдельной случайной величины
. (4.4.39)
Найдем далее центральные моменты среднего выборочного. Для этого вначале докажем, что постоянный множитель можно выносить за знак центрального момента r-го порядка, возведя его в r-ю степень:
. (4.4.40)
Действительно,
.
На основании (4.4.40) имеем:
.
Поскольку для суммы n независимых одинаково распределенных случайных величин справедливо равенство (4.4.24)
,
то из предыдущего выражения получим
. (4.4.41)
Найдем центральный момент третьего порядка среднего выборочного. На основании равенства (4.4.40) можем записать
.
Поскольку (см. формулу (4.4.27)), то из предыдущего выражения получим
. (4.4.42)
Для центрального момента четвертого порядка среднего выборочного можем записать
.
Поскольку для суммы n независимых одинаково распределенных случайных величин справедливо равенство (4.4.32)
,
то из предыдущей формулы получим
. (4.4.43)
Таким образом, моменты среднего арифметического n независимых одинаково распределенных случайных величин выражаются через моменты отдельной случайной величины посредством формул [24]
. (4.4.44)
Из формул (4.4.33) и (4.4.44) найдем взаимосвязь между моментами суммы и среднего арифметического n независимых одинаково распределенных случайных величин:
. (4.4.45)
Из (4.4.45) следует, что показатели асимметрии и островершинностидля распределений суммы и среднего арифметическогоn независимых одинаково распределенных случайных величин одни и те же.
Зная центральные моменты, а также показатели асимметрии и островершинности, по универсальному или классическому методу моментов нетрудно найти закон распределения среднего арифметического и, следовательно, вычислить доверительные границы для среднего выборочного при заданной доверительной вероятности и любом заданном значении n. С ростом n распределение среднего выборочного (или ,или ) асимптотически приближается к нормальному закону или, другими словами, среднееn независимых одинаково распределенных случайных величин имеет асимптотически нормальное распределение (центральная предельная теорема в случае первой системы непрерывных распределений).
В случае второй системы – распределение среднего геометрического n независимых одинаково распределенных случайных величин
с ростом n асимптотически приближается к логарифмически нормальному закону.
В случае третьей системы – распределение среднего геометрического логарифмов n независимых случайных величин
с ростом n асимптотически приближается к логарифмически нормальному закону, а величина
– к двойному логарифмически нормальному закону.
При n > 100 распределение среднего выборочного (или, или) можно считать нормальным.
Действительно, если распределение случайной величины Х (или , или) характеризуется показателями(в случае трех основных систем непрерывных распределений), то распределение среднего арифметического n = 100 независимых одинаково распределенных случайных величин на основании формул (4.4.34) будет иметь показатели
, (4.4.46)
т.е. близкие к нормальному закону.
Отметим, что формулы (4.4.34) и (4.4.44) позволяют переходить от распределения среднего арифметического n независимых одинаково распределенных случайных величин к распределению отдельной случайной величины Xi. Для этого в указанных формулах достаточно заменить величину n на n' = 1/ n.
Полученные результаты вскрывают характер изменения показателей с изменением числаn независимых одинаково распределенных случайных величин: с ростом n точка с координатами приближается к точке (0; 3) по кратчайшему пути, т.е. по прямой
, (4.4.47)
которая следует из (4.4.34).
При этом степень приближения к нормальному закону при больших n зависит от исходных значений показателей случайной величиныХi.
Установим минимально необходимое значение n, при котором распределение среднего арифметического n независимых одинаково распределенных случайных величин можно считать нормальным.
Рассмотрим рис. 4.4.2. На нем точкой А() обозначено распределение случайной величиныХi.
Распределение среднего арифметического n независимых одинаково распределенных случайных величин представлено точкой В().
Заштрихованная площадь – это область нормального закона. Она ограничена двумя вертикальными и двумя наклонными отрезками прямых, тангенс угла наклона которых к горизонтальной оси принят равным 1,75. Область нормального закона может быть задана и другими способами.
Рис. 4.4.2. Фрагмент номограммы в области нормального закона
Если при некотором значении n точка В (или В) попадает на границу или внутрь заштрихованной области, то закон распределения среднего арифметического можно считать нормальным.
Пусть точка В находится на правой вертикальной границе области нормального закона (см. рис. 4.4.2). При этом условии минимально необходимое значение n можно найти из формулы
при :
. (4.4.48)
Если точка В займет положение В, то она будет являться точкой пересечения двух наклонных прямых, которые задаются уравнениями
; .
Приравнивая правые части этих уравнений, найдем
. (4.4.49)
Из двух полученных значений n выбираем большее.
Если в формулах (4.4.48), (4.4.49) принять , то значения параметраu выравнивающих распределений по абсолютной величине будут несколько меньше 0,02 (для нормального закона u→0).
Рассмотрим пример.
Пусть случайная величина Хi описывается распределением II типа:
(4.4.50)
с параметрами: α = 12; k = 5. Тогда теоретические моменты будут равны (см. формулы (4.3.24), (4.3.27) при u→0, γ = k):
Показатели асимметрии и островершинности на основании (4.3.37) равны:
Найдем по формулам (4.4.48), (4.4.49) минимально необходимое значение n (объем выборки), при котором распределение среднего арифметического n независимых одинаково распределенных случайных величин можно считать нормальным.
При имеем:
.
Принимаем n = 420.
На практике часто ограничиваются небольшими значениями n .
Пусть n = 25. Тогда распределение среднего арифметического n независимых одинаково распределенных случайных величин будет иметь моменты (см. формулу 4.4.44):
Показатели асимметрии и островершинности равны:
Контроль:
.
Выравнивающее распределение среднего арифметического при n=25 может быть описано обобщенной плотностью
(точнее, распределением III типа первой системы непрерывных распределений) с параметрами:
и нормирующим множителем N = 3,194777E–10.
Зададим доверительную вероятность P = 0,9973 и найдем по одной из программ (например, ) доверительный интервал для среднего арифметического:. Его ширина составляет.
Для сравнения по той же программе найдем доверительный интервал при условии справедливости нормального закона: . Его ширина составляет, т.е. ошибка в определении границ доверительного интервала по нормальному закону оказалась существенной.
Полученные выше формулы (4.4.48) и (4.4.49) можно использовать также для вычисления минимально необходимого значения n, при котором распределение среднего арифметического логарифмов n независимых одинаково распределенных случайных величин можно считать нормальным.
Используя универсальный метод моментов, для рассмотренной выше плотности II типа с параметрами , приведенной к форме, найдем:
Показатели асимметрии и островершинности равны:
.
Далее по формулам (4.4.48) и (4.4.49) имеем (при )
.
Принимаем n = 5.
Итак, если случайная величина Х задана плотностью (4.4.50), то распределение среднего арифметического логарифма случайной величины Х близко к нормальному закону уже при n = 5, а распределение среднего арифметического самой случайной величины Х близко к нормальному закону при значительно большей величине n (n = 420).
Если же центральные моменты высоких порядков не существуют (например, ), то и величина, т.е. распределение среднего арифметического случайной величиныХ ни при каком n не приближается к нормальному закону.