- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
1.11. Числовые характеристики непрерывных случайных величин
Для возможно более полного и всестороннего описания случайных величин используют различные показатели. К ним относятся:
– характеристики положения – математическое ожидание, мода, медиана;
– характеристики вариации – дисперсия, среднее квадратическое отклонение, коэффициент вариации;
– характеристики формы распределения – коэффициенты асимметрии и островершинности, которые выражаются через моменты.
Математическое ожидание непрерывной случайной величины Х задается интегралом
.
Свойства математического ожидания непрерывной случайной величины те же, что и дискретной случайной величины.
Мода – такое значение случайной величины, при котором плотность максимальна.
Медиана (Ме) случайной величины Х определяется соотношением
P(X<Me)=P(X>Me).
Она делит площадь под кривой распределения пополам.
Дисперсия непрерывной случайной величины Х задается формулой
,
где
Коэффициент вариации
– выраженное в процентах отношение среднего квадратического отклонения случайной величины Х к ее математическому ожиданию.
Центральные моменты r-го порядка (r = 2, 3, 4) задаются формулой
.
Заметим, что .
Коэффициент асимметрии (скошенность)
или .
Коэффициент островершинности (эксцесс)
или .
Ниже будут использоваться первые определения величин введенные К.Пирсоном.
1.12. Примеры непрерывных распределений
1.12.1. Нормальный закон
Нормальный закон распределения задается плотностью
Кривая распределения имеет симметричную колоколообразную форму и характеризуется показателями: β1=0; β2=3.
Вероятность попадания случайной величины Х, распределенной по нормальному закону, на интервал определяется по формуле [3, c.123]
,
где – функция Лапласа. Здесь величинапредставляет собой выраженное в долях «сигма» отклонение случайной величиныХ от центра распределения а.
В зависимости от значения t вероятность попадания случайной величины Х на заданный интервал равна:
При t = 1 Р = 0,6827.
При t = 2 Р = 0,9545.
При t = 3 Р = 0,9973.
Таким образом, вероятность выхода значений случайной величины Х за пределы очень мала и равна 1–0,9973=0,0027. Это значит, чтоиз 1000 значений случайной величины Х, распределенной по нормальному закону, в среднем только три могут выйти за границы трех стандартных отклонений (правило «трех сигма»). Это «правило» используется во многих практических расчетах, например, при статистическом анализе точности технологических процессов.
1.12.2. Показательный закон
Плотность вероятности и функция распределения задаются формулами
.
Это – один из простейших однопараметрических законов распределения.
1.12.3. Закон Вейбулла
Плотность вероятности и функция распределения задаются формулами
.
Из закона Вейбулла при следует показательный закон, а при– распределение Релея.
1.13. Элементы математической статистики
Основные задачи математической статистики заключаются в создании методов сбора и обработки статистических данных для получения научных и практических выводов [4, с. 187].
1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
Группа объектов, объединенных по некоторому качественному или количественному признаку, называется статистической совокупностью. Различают генеральную и выборочную совокупности.
Выборочная совокупность (выборка) – это совокупность случайно отобранных объектов.
Генеральная совокупность – совокупность всех возможных объектов, из которых производится выборка.
Объем выборки – число объектов в выборочной совокупности.
Репрезентативная (представительная) выборка – такая выборка, которая правильно отражает пропорции генеральной совокупности.
Методы отбора:
– простой случайной отбор – объекты извлекаются по одному из всей генеральной совокупности. Если выбранный объект перед отбором следующего объекта возвращается в генеральную совокупность, то отбор называется повторным. Если не возвращается – бесповторным;
– типический отбор – объекты извлекаются из отдельной части генеральной совокупности (например, продукция, изготовленная на одном станке);
– механический отбор – выбирают каждый 10-ый, 100-ый и т.д. элемент генеральной совокупности;
– серийный отбор – объекты отбирают не по одному, а сериями.
Статистическая совокупность, упорядоченная по возрастанию или убыванию значений признака, называется вариационным рядом, а ее объекты – вариантами.
Вариационный ряд характеризуют показатели:
– среднее значение вариант ;
– медиана – варианта, которая делит вариационный ряд на две части, равные по числу вариант;
– размах варьирования R .