- •В.В. Нешитой
- •Методы статистического анализа
- •На базе
- •Обобщенных распределений
- •Предисловие
- •Введение
- •I. Случайные события и их вероятности
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •II. Основные теоремы теории вероятностей
- •2.1. Теорема сложения вероятностей (несовместных событий)
- •2.2. Теорема умножения вероятностей (независимых событий)
- •2.3. Формула полной вероятности
- •2.4. Теорема гипотез (формула Бейеса)
- •III. Дискретные случайные величины
- •3.1. Закон распределения вероятностей дискретной случайной величины
- •3.2. Числовые характеристики дискретной случайной величины
- •3.2.1. Математическое ожидание
- •3.2.2. Свойства математического ожидания
- •3.2.3. Дисперсия дискретной случайной величины
- •3.2.4. Свойства дисперсии
- •3.2.5. Среднее квадратическое отклонение
- •3.2.6. Одинаково распределенные взаимно независимые случайные величины
- •3.2.7. Моменты (начальные, центральные) дискретной случайной величины
- •4.2. Плотность распределения
- •4.3. Числовые характеристики непрерывных случайных величин
- •4.4. Примеры непрерывных распределений
- •4.4.1. Нормальный закон
- •5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •5.4. Метод моментов для точечной оценки параметров распределения
- •5.5. Метод наибольшего правдоподобия
- •VI. Обобщенные распределения. Системы непрерывных распределений
- •6.1. Методы построения обобщенных распределений
- •6.2. Построение системы непрерывных распределений методом обобщения
- •6.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •6.4. Распределения функций случайного аргумента
- •6.5. Три основные и три дополнительные системы непрерывных распределений в. Нешитого
- •VII. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •7.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •7.2. Метод наибольшего правдоподобия
- •7.3. Классический метод моментов
- •7.3.3. Симметричные распределения Ic-iiIc типов
- •7.3.4. Критерии для классификации кривых по методу моментов
- •7.4. Универсальный метод моментов
- •7.4.1. Законы распределения суммы независимых случайных величин
- •7.4.2. Центральная предельная теорема для трех систем непрерывных распределений
- •7.4.3. Законы распределения среднего выборочного
- •7.5. Общий устойчивый метод
- •VIII. Выравнивание и прогнозирование статистических распределений
- •8.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •8.2. Построение выравнивающей кривой распределения по статистическим данным
- •8.2.1. Выравнивание по классическому методу моментов
- •8.2.2. Выравнивание по универсальному методу моментов
- •8.2.3. Выравнивание по общему устойчивому методу
- •8.2.4. Выравнивающее распределение суммы независимых случайных величин
- •8.2.5. Выравнивающее распределение среднего выборочного
- •8.3. Прогнозирование распределений
- •8.3.1. Первая система непрерывных распределений
- •8.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
- •8.3.3. Показатели стабильности и качества выборки
- •Iх. Статистический анализ точности и стабильности технологических процессов на базе обобщенных распределений
- •9.1. Показатели состояния технологического процесса
- •9.2. Пример статистической обработки результатов замера контролируемого параметра по программе
- •Контрольный листок Деталь №_____(название) ø50 мм ±0,012 Точность си 0,002 Дата________ Время_______
- •Отклонения от номинального размера детали «nn» ø50 ±0,012
- •Показатели статистического распределения ( )
- •9.3. Экономическая эффективность применения обобщенных распределений
- •9.4. Особенности применения статистических методов в области строительства
- •Х. Надежность как особый критерий качества
- •10.1. Некоторые показатели надежности для невосстанавливаемых объектов
- •Плотность распределения отказов
- •Интенсивность отказов
- •Гамма-процентный ресурс
- •10.2. Вычисление показателей надежности по обобщенным распределениям
- •Результаты наблюдений о наработке до отказа двигателей панелевозов (ti – пробег до отказа в тыс. Км.; mi – число панелевозов, имеющих наработку ti)
- •Показатели статистического распределения (snr2v97)
- •Логарифмическое распределение типа 1.1 с параметрами
- •XI. Временные (динамические) ряды
- •11.1. Методы выделения тренда
- •11.2. Построение кривых роста для выравнивания временных рядов
- •11.2.1. Построение кривых роста с заданными свойствами
- •11.2.2. Метод обобщения
- •11.2.3. Кривые роста на базе обобщенных распределений
- •11.3. Оценивание параметров кривых роста
- •11.3.1. Уравнение прямой
- •11.3.2. Экспонента
- •11.3.3. Обобщенная кривая роста
- •11.4. Прогнозирование временных рядов
- •11.4.1. Параметрический метод прогнозирования
- •11.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по методу моментов
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по общему устойчивому методу
- •Значения квантили в зависимости от уровня вероятности и числа степеней свободы r
- •Приложение 5
- •Литература
- •Содержание
5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
Статистическое распределение выборки – это соотношение между значениями вариант и соответствующими им частотами или частостями (относительными частотами) .
Статистическое распределение выборки можно представить в виде таблицы, в первую строку которой записываются варианты, а во вторую – соответствующие им частоты или частости.
-
xi
x1
x2
…
xk
mi
m1
m2
…
mk
wi
w1
w2
…
wk
Здесь сумма всех частот равна объему выборки n, т.е.
,
а сумма частотей равна единице
.
Для непрерывного вариационного ряда составляется таблица, в первой строке которой указываются интервалы изменения вариант, а во второй – частоты.
-
хi
х1–х2
х2-х3
…
mi
m1
m2
…
Дискретные распределения можно представить полигоном, непрерывные – гистограммой.
Весь вариационный ряд с размахом разбивают на несколько интервалов и подсчитывают число точек (частоту) на каждом интервале. Затем на каждом интервале строится прямоугольник, площадь которого равна относительной частоте интервала. Вся площадь гистограммы в этом случае равна единице.
Г истограмма Полигон
Эмпирической функцией распределения случайной величины Х называется функция
,
где mx – число вариант, меньших х; n – объем выборки.
Эмпирическая функция распределения является оценкой функции распределения F(x)=P(X<х).
5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
Выборку характеризуют такие показатели, как:
среднее выборочное значение
(n – объем выборки);
выборочная дисперсия
;
центральные выборочные моменты
(все характеристики приведены для несгруппированных данных).
Выборочная дисперсия является смещенной оценкой генеральной дисперсии. Несмещенной оценкой дисперсии будет исправленная выборочная дисперсия
.
При объеме выборки n > 30 можно использовать неисправленную выборочную дисперсию.
Среднее выборочное значение является точечной оценкой математического ожидания.
Если установить границы интервала , который с заданной вероятностью Р покрывает значение , то получим интервальную оценку.
Пусть 1– обозначает вероятность того, что результат измерения отличается от истинного значения mx на величину, не большую . Это записывается так:
,
где 1– - доверительная вероятность (надежность) оценки; – доверительный интервал.
Величина характеризует точность оценки (в данном случае среднего) и по абсолютной величине равна
,
где – среднеквадратическое отклонение; n – объем выборки.
Тогда предыдущую формулу можно переписать в виде
.
Величину 1– обычно выбирают 0,9; 0,95; 0,99.
Величину tn находят по таблице распределения Стьюдента в зависимости от числа степеней свободы ν = n и вероятности α.