- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
5.3.2. Вторая система непрерывных распределений
Пусть распределение случайной величины Т задано обобщенной плотностью
с известными оценками параметров. Пусть далее известно, что все значения ti (i = 1, 2,…, n) увеличатся в С раз.
Требуется найти распределение случайной величины Т*=ТС.
Поскольку t=t*/C, dt/dt*=1/C,
то (5.3.11)
или
. (5.3.12)
Введя обозначения
, (5.3.13)
последнюю плотность перепишем в виде
. (5.3.14)
Увеличение случайной величины Т в С раз приводит к уменьшению параметра α и нормирующего множителя N. При этом плотность распределения р(t) уменьшается в С раз, а произведение tp(t), а также среднее значение остаются без изменения. Это значит, что форма кривой распределения а также характеризующие ее показатели не изменяются, при этом остается справедливой формула (5.3.7), т.е. F(t*)=F(t).
Таким же путем найдем, что при увеличении в С раз случайной величины Y вторая и третья плотности второй системы непрерывных распределений примут вид
, (5.3.15)
где
; (5.3.16)
, (5.3.17)
где
. (5.3.18)
Рассмотрим характерный пример. В табл. 5.3.1. приведены статистические данные о распределении населения СССР по среднедушевому совокупному доходу [32] за 1980, 1985 и 1988 г.
Найдем выравнивающее распределение по статистическому интервальному ряду за 1980г. По программе SNR2V97 имеем:
.
Выравнивающее распределение задается обобщенной плотностью
(5.3.19)
и относится к III типу. Оценки параметров и нормирующего множителя равны:
Таблица 5.3.1.
Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
Интервал в руб. |
Год | ||
1980 |
1985 |
1988 | |
До 50 50-75 75-100 100-125 125-150 150-175 175-200 200-250 >250 |
7,3 18,5 23,2 19,5 13,2 8,2 4,7 4,1 1,3 |
4,3 13,6 19,8 19,3 15,0 10,4 6,7 6,9 4,0 |
2,9 9,7 15,7 17,6 15,7 12,2 9,0 10,1 7,1 |
Итого |
100% |
100% |
100% |
Рассчитаем по формуле (5.3.19) при известных оценках параметров значения плотности р(t) в серединах интервалов. Для того, чтобы сравнить выравнивающее и статистическое распределения, умножим значения плотности p(t) на ширину интервала (h = 25). Получим относительные частоты интервалов.
Результаты расчетов сведены в табл. 5.3.2, графы 1, 2.
Найдем далее по данным таблицы 5.3.1 средние значения логарифмов среднедушевого дохода за 1985 и 1988гг. Они оказались равными соответственно 4,732163 и 4,850433, откуда находим, что среднедушевой доход в 1985г. вырос в среднем в 1,145358 раза, а в 1988г. – в 1,289216 раза по сравнению с 1980 годом.
Чтобы спрогнозировать распределение среднедушевого дохода населения на 1985 и 1988г. по его распределению за 1980г., достаточно вычислить новые значения нормирующего множителя N и произведения αu
Таблица 5.3.2
Расчетные относительные частоты интервалов
Интервал в руб. |
Год | ||
1980 (выравнивание) |
1985 (прогноз) |
1988 (прогноз) | |
0-25 25-50 50-75 |
0,0019 0,0688 0,1871 |
0,0010 0,0418 0,1340 |
0,0006 0,0264 0,0959 |
75-100 100-125 125-150 |
0,2306 0,1948 0,1339 |
0,1952 0,1936 0,1544 |
0,1590 0,1789 0,1608 |
150-175 175-200 200-225 |
0,0816 0,0464 0,0254 |
0,1079 0,0695 0,0425 |
0,1257 0,0897 0,0602 |
225-250 250-275 275-300 300-325 |
0,0136 0,0072 0,0039 0,0021 |
0,0252 0,0146 0,0084 0,0049 |
0,0389 0,0245 0,0152 0,0093 |
(см. формулы (5.3.13), где kβ = γ):
.
При С = 1,145358 они равны:
.
При С = 1,289216 они равны:
.
Оценки параметров β, γ, u – те же, что и в выравнивающем распределении дохода за 1980 г.
В табл. 5.3.2 приведены расчетные значения относительных частот интервалов (прогноз) на 1985 и 1988 г. (графы 3,4).
Ожидаемые распределения на 1985 и 1988 г. можно также получить с помощью Программы по статистическому распределению за 1980 г., если середину и ширину каждого интервала увеличить в С раз, оставив без изменения частоту (долю) интервала, что вытекает из формулы (5.3.11).
Из нее же следует, что на базе статистического интервального ряда распределения населения по среднедушевому совокупному доходу за 1980 г. (см. табл. 5.3.1) можно построить новый (ожидаемый) интервальный ряд распределения с учетом коэффициента роста С. Для этого достаточно увеличить в С раз границы, середину и ширину всех интервалов, оставив без изменения долю интервалов. Тогда значения эмпирической плотности в связи с ростом ширины интервалов уменьшатся в С раз.
Полученное распределение и будет ожидаемым на некоторый период упреждения r, когда среднедушевой совокупный доход вырастет в С раз по сравнению с 1980-м годом.
На рис. 5.3.1 (а, б, в) представлены гистограммы, построенные по статистическим данным, и непрерывные кривые при h=25 (на рис. а – выравнивающая кривая, полученная непосредственно по статистическому интервальному ряду за 1980г.; на рис. б, в – прогнозируемые непрерывные кривые). Расчетные и статистические данные находятся в хорошем согласии между собой.
Чтобы оценить уровень жизни населения, необходимо сопоставить приведенные интервальные ряды распределения (эмпирические или расчетные) с минимальным потребительским бюджетом в одни и те же моменты времени.
Знание закона распределения совокупного дохода позволяет осуществлять различные расчеты, в том числе давать прогноз.
Выше отмечалось, что с ростом величины t в С раз () функция распределения не изменяется, т.е.F(t*) = F(t).
Это дает возможность прогнозировать долю населения с заданным совокупным доходом, например, до одного минимального потребительского бюджета (МПБ), двух МПБ, S МПБ.
Пусть совокупный доход населения (СД) растет по показательному закону с темпом роста QСД в единицу времени r (год, месяц), а МПБ – с темпом роста QМПБ.
Пусть далее доля населения с совокупным доходом СД0 на момент времени τ0 равна F(τ0) = α.
Минимальный потребительский бюджет на тот же момент времени равен МПБ0.
Найдем период времени r, через который будет выполняться равенство
. (5.3.20)
Через r единиц времени S-кратный МПБ будет равен
, (5.3.21)
а совокупный доход равен
. (5.3.22)
Рис. 5.3.1. Статистические (представлены гистограммами) и теоретические распределения среднедушевого дохода населения (на рис. а изображено выравнивающее непрерывное распределение; на рис. б, в – прогнозируемые распределения)
Приравнивая два последних равенства, найдем
. (5.3.23)
Проанализируем полученную формулу.
Пусть темп роста совокупного дохода превышает темп роста минимального потребительского бюджета. Тогда знаменатель в формуле (5.3.23) будет больше нуля, а величина r будет равна периоду времени, через который доля населения α будет иметь совокупный доход, равный S-кратному минимальному потребительскому бюджету. При этом структура совокупности изменяется в лучшую сторону, т.е. уменьшается доля населения с низким совокупным доходом.
При равенстве темпов роста совокупного дохода и минимального потребительского бюджета величина r = ∞, т.е. структура совокупности не улучшается (не уменьшается доля населения с низким совокупным доходом).
Для стабильного улучшения распределения совокупного дохода необходимо, чтобы темп роста совокупного дохода (или темп прироста, т.е. темп роста, уменьшенный на единицу) постоянно опережал темп роста (или прироста) минимального потребительского бюджета.
Закон распределения совокупного дохода, а также заработной платы – это зеркало экономики.
В совокупности с законами роста минимального потребительского бюджета и среднемесячной заработной платы он представляет собой весьма чувствительный инструмент, позволяющий оценивать состояние на данный момент времени и прогнозировать различные экономические явления и процессы.
Анализ закона распределения, заданного плотностью p(t) (см. формулу 3.2.8), позволяет сделать следующий вывод. Статистическую структуру совокупности можно улучшить путем переноса начала кривой распределения на некоторую величину l, равную, например, бюджету прожиточного минимума или некоторой его доле (см. плотность (3.5.2)).
Тогда кривая распределения сместится вправо на величину l без изменения формы. Значения параметров α, β, k, u останутся прежними. Средняя заработная плата для всех категорий работающих увеличится на постоянную величину l, но коэффициент ее роста при низком уровне заработной платы будет намного выше, чем при высоком уровне.