- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
4.1. Метод наименьших квадратов
Этим методом могут быть найдены оценки параметров распределений группы А.
Рассмотрим распределения I – III типов группы А, относящиеся ко второй системе непрерывных распределений. Преобразуем функцию распределения
к уравнению прямой
. (4.1.1)
Построив по эмпирической функции распределения график зависимости (4.1.1) (при известной оценке параметра u) и убедившись, что опытные точки рассеиваются вдоль прямой, по методу наименьших квадратов найдем оценки величин Введем обозначения:
Тогда вместо формулы (3.1.1) запишем
. (4.1.2)
Оценки параметров (при заданном значении параметраu) по методу наименьших квадратов будут равны
(4.1.3)
(4.1.4)
Для оценки тесноты линейной связи между переменными Y, X при различных значениях параметра u вычисляется выборочный коэффициент корреляции
, (4.1.5)
где σx, σy – средние квадратические отклонения случайных величин X, Y.
В качестве оценки параметра u следует принять то его значение, при котором коэффициент корреляции по модулю максимален.
Аналогично приводятся к уравнению прямой функции распределения остальных типов.
Тип II: .
Вводя обозначения , получим уравнение прямой (4.1.2).
Тип II: .
Типы I, III: .
Из рассмотренных примеров видно, что главная трудность здесь заключается в выборе подходящего значения параметра u. Его можно найти путем подбора и вычисления при каждом значении u коэффициента корреляции. Однако имеется возможность оценить его более простым и быстрым методом.
Если построить кривую распределения в форме и график функции распределения, то мода, т.е. точка, в которой произведениеtp(t) максимально, равна
,
откуда . Подставив значениеtc в функцию распределения, получим [11]
. (4.1.6)
Последняя формула справедлива для распределений I–III типов группы А. Для распределений I–III типов справедливо равенство
. (4.1.7)
В таблице 3.1.1 приведены значения F(tc), рассчитанные по формулам (4.1.6), (4.1.7).
На основании полученных результатов можно рекомендовать следующий порядок установления типа выравнивающего распределения группы А и нахождения оценок параметров на примере плотности p(t).
Выбрать за начало отсчета значений случайной величины Т начало кривой распределения.
Найти эмпирическую моду кривой распределения.
Найти эмпирическое значение функции распределения в точке C и приравнять теоретическому.
С помощью таблицы 4.1.1 определить два значения параметра u (в предположении, что выравнивающее распределение относится либо к I–III, либо к I–III типам).
Таблица 4.1.1
Значение функции распределения f(tc)
Параметр u |
|
|
Тип кривой |
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 |
1 0,9226 0,8663 0,8209 0,7828 0,7500 0,7211 0,6954 0,6723 0,6513 |
0 0,0774 0,1337 0,1791 0,2172 0,2500 0,2789 0,3046 0,3277 0,3487 |
I, I |
0 |
0,6321 |
0,3679 |
II, II |
-0,2 -0,4 -0,6 -0,8 -1,0 -1,5 -2 -2,5 -3 -4 -5 -10 -20 -30 -∞ |
0,5981 0,5688 0,5431 0,5204 0,5000 0,4571 0,4226 0,3941 0,3700 0,3313 0,3012 0,2132 0,1412 0,1082 0 |
0,4019 0,4312 0,4569 0,4796 0,5000 0,5429 0,5774 0,6059 0,6300 0,6687 0,6988 0,7868 0,8588 0,8918 1 |
III–III |
По двум значениям параметра u определить два типа возможных выравнивающих распределений.
Для обоих типов распределений путем построения графиков проверить, ложатся ли опытные точки на прямые.
В качестве выравнивающего принять наиболее подходящее распределение.
Таким же образом могут быть найдены оценки параметров распределений группы А, заданных плотностями р(х), р(у). При этом плотность р(у) должна быть приведена к форме .