- •В.В. Нешитой
- •Методы статистического анализа
- •На базе
- •Обобщенных распределений
- •Предисловие
- •Введение
- •I. Случайные события и их вероятности
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •II. Основные теоремы теории вероятностей
- •2.1. Теорема сложения вероятностей (несовместных событий)
- •2.2. Теорема умножения вероятностей (независимых событий)
- •2.3. Формула полной вероятности
- •2.4. Теорема гипотез (формула Бейеса)
- •III. Дискретные случайные величины
- •3.1. Закон распределения вероятностей дискретной случайной величины
- •3.2. Числовые характеристики дискретной случайной величины
- •3.2.1. Математическое ожидание
- •3.2.2. Свойства математического ожидания
- •3.2.3. Дисперсия дискретной случайной величины
- •3.2.4. Свойства дисперсии
- •3.2.5. Среднее квадратическое отклонение
- •3.2.6. Одинаково распределенные взаимно независимые случайные величины
- •3.2.7. Моменты (начальные, центральные) дискретной случайной величины
- •4.2. Плотность распределения
- •4.3. Числовые характеристики непрерывных случайных величин
- •4.4. Примеры непрерывных распределений
- •4.4.1. Нормальный закон
- •5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •5.4. Метод моментов для точечной оценки параметров распределения
- •5.5. Метод наибольшего правдоподобия
- •VI. Обобщенные распределения. Системы непрерывных распределений
- •6.1. Методы построения обобщенных распределений
- •6.2. Построение системы непрерывных распределений методом обобщения
- •6.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •6.4. Распределения функций случайного аргумента
- •6.5. Три основные и три дополнительные системы непрерывных распределений в. Нешитого
- •VII. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •7.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •7.2. Метод наибольшего правдоподобия
- •7.3. Классический метод моментов
- •7.3.3. Симметричные распределения Ic-iiIc типов
- •7.3.4. Критерии для классификации кривых по методу моментов
- •7.4. Универсальный метод моментов
- •7.4.1. Законы распределения суммы независимых случайных величин
- •7.4.2. Центральная предельная теорема для трех систем непрерывных распределений
- •7.4.3. Законы распределения среднего выборочного
- •7.5. Общий устойчивый метод
- •VIII. Выравнивание и прогнозирование статистических распределений
- •8.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •8.2. Построение выравнивающей кривой распределения по статистическим данным
- •8.2.1. Выравнивание по классическому методу моментов
- •8.2.2. Выравнивание по универсальному методу моментов
- •8.2.3. Выравнивание по общему устойчивому методу
- •8.2.4. Выравнивающее распределение суммы независимых случайных величин
- •8.2.5. Выравнивающее распределение среднего выборочного
- •8.3. Прогнозирование распределений
- •8.3.1. Первая система непрерывных распределений
- •8.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
- •8.3.3. Показатели стабильности и качества выборки
- •Iх. Статистический анализ точности и стабильности технологических процессов на базе обобщенных распределений
- •9.1. Показатели состояния технологического процесса
- •9.2. Пример статистической обработки результатов замера контролируемого параметра по программе
- •Контрольный листок Деталь №_____(название) ø50 мм ±0,012 Точность си 0,002 Дата________ Время_______
- •Отклонения от номинального размера детали «nn» ø50 ±0,012
- •Показатели статистического распределения ( )
- •9.3. Экономическая эффективность применения обобщенных распределений
- •9.4. Особенности применения статистических методов в области строительства
- •Х. Надежность как особый критерий качества
- •10.1. Некоторые показатели надежности для невосстанавливаемых объектов
- •Плотность распределения отказов
- •Интенсивность отказов
- •Гамма-процентный ресурс
- •10.2. Вычисление показателей надежности по обобщенным распределениям
- •Результаты наблюдений о наработке до отказа двигателей панелевозов (ti – пробег до отказа в тыс. Км.; mi – число панелевозов, имеющих наработку ti)
- •Показатели статистического распределения (snr2v97)
- •Логарифмическое распределение типа 1.1 с параметрами
- •XI. Временные (динамические) ряды
- •11.1. Методы выделения тренда
- •11.2. Построение кривых роста для выравнивания временных рядов
- •11.2.1. Построение кривых роста с заданными свойствами
- •11.2.2. Метод обобщения
- •11.2.3. Кривые роста на базе обобщенных распределений
- •11.3. Оценивание параметров кривых роста
- •11.3.1. Уравнение прямой
- •11.3.2. Экспонента
- •11.3.3. Обобщенная кривая роста
- •11.4. Прогнозирование временных рядов
- •11.4.1. Параметрический метод прогнозирования
- •11.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по методу моментов
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по общему устойчивому методу
- •Значения квантили в зависимости от уровня вероятности и числа степеней свободы r
- •Приложение 5
- •Литература
- •Содержание
11.4.2. Непараметрический метод прогнозирования
Полученный сглаженный ряд (см. п. 11.4.1) можно использовать для прогнозирования непосредственно, без подбора для каждого конкретного случая наилучшей выравнивающей кривой. Назовем этот метод непараметрическим.
Операция сглаживания временного ряда – весьма деликатная операция. Она, с одной стороны, должна в максимальной степени уменьшить случайную составляющую и, с другой стороны, не должна исказить тренд. Эти противоречивые требования могут быть выполнены лишь в том случае, если нам удастся найти такую теоретическую кривую, которая чаще других оказывается наиболее подходящей выравнивающей кривой. Ее следует использовать в качестве базы для сглаживания. Далее следует решить вопрос о числе сглаживаний, ибо с их ростом сглаженный ряд все более приближается к кривой, принятой в качестве базы для сглаживания, а она может оказаться не совсем подходящей. Опыт показывает, что в большинстве случаев достаточно однократного сглаживания.
Рост экономических показателей по крайней мере в первом приближении может быть описан экспонентой
или близкой к экспоненте кривой. Поэтому сглаживание временных рядов целесообразно проводить в системе координат (Т, ), так как в этом случае экспонента преобразуется к прямой
.
Сглаживание заключается в вычислении средних значений ординат по трем равноотстоящим точкам. При этом используются формулы (11.1.1), но в них следует заменить величину y на .
Проведем небольшое число сглаживаний (от 1 до 3). Получим некоторую кривую в полулогарифмическом масштабе, близкую к тренду. Эту кривую, которая должна быть близка к прямой, используем далее для прогнозирования.
Найдем средние темпы роста за последние три и шесть месяцев
.
При стабильном темпе роста оба значения величины q должны быть близкими между собой. Тогда прогнозируемые значения экономических показателей будут равны
, где r – интервал прогнозирования (период упреждения).
Описанный метод прогнозирования не требует вычисления оценок параметров, входящих в теоретический закон роста временных рядов, да и сам этот закон может быть известен лишь в первом приближении. Этот метод прогнозирования отличается исключительной простотой и в то же время по точности он почти не уступает параметрическому методу. Кроме того, непараметрический метод более гибко реагирует на изменение текущих темпов роста.
Метод в течение ряда лет (с 1995 г.) используется при краткосрочном прогнозировании индексов изменения стоимости строительно-монтажных работ и показал достаточно высокую надежность.
В заключение отметим, что как параметрический, так и непараметрический методы прогнозирования должны осуществляться на ПЭВМ в связи с большим объемом вычислительных работ.
Для рассмотренных выше кривых роста автором разработаны соответствующие программы.
Заключение
Эффективность статистических методов в решающей степени зависит от точности выравнивания статистических распределений производственных погрешностей.
Если статистическое распределение отличается от предполагаемого теоретического, в качестве которого часто принимают нормальный закон, то это может привести к непредсказуемым последствиям.
Нормальный закон на номограмме представлен точкой. Все остальное поле номограммы заполнено множеством других точек и каждая из них соответствует определенному распределению, подобно тому как в Периодической системе элементов Д.И. Менделеева каждая клетка соответствует определенному элементу. Поэтому необоснованная замена любого выравнивающего распределения нормальным недопустима, если расчеты по статистическим данным привели к другому выравнивающему закону распределения. Такая замена может значительно снизить точность выравнивания.
Спрашивается, зачем нужна максимально высокая точность выравнивания статистических распределений производственных погрешностей? Ответ заключается в том, что главный и наиболее общий показатель качества – ожидаемый процент брака – сосредоточен на концах распределения, причем, предельно допустимый его уровень в машиностроении составляет малую величину, равную 0.0027, или 0.27%. Поэтому грубое выравнивание просто не имеет смысла.
Теория обобщенных распределений, элементы которой изложены в настоящем учебном пособии, как нельзя лучше приспособлена для решения таких задач. Тем более, что она включает не только три системы непрерывных распределений, но и систему дискретных распределений, взаимосвязанную с системой кривых роста новых событий, методы установления типа выравнивающей кривой и нахождения оценок параметров.
Обобщенные распределения включают как частные случаи большинство известных распределений, в том числе семейство кривых К. Пирсона, и могут претендовать на роль универсальных законов распределения.
Для каждой системы распределений (непрерывных и дискретных), а также кривых роста автором разработаны соответствующие программы. Они вычисляют тип наилучшей выравнивающей кривой, выдают ее уравнение и точечные оценки параметров, вычисляют значения плотности и функции распределения, а также квантили, процентили, доверительные вероятности и доверительные интервалы, координаты моды и точек перегиба, строят кривую распределения (или кривую роста) и, наконец, вычисляют показатели качества продукции, в том числе – ожидаемый процент брака. Кроме того, программы вычисляют законы распределения суммы и среднего n независимых одинаково распределенных случайных величин, вычисляют прогнозируемые распределения (см.Приложение 5). Количество решаемых задач может быть расширено по желанию пользователя.
Читателю следует иметь в виду, что теория обобщенных распределений к настоящему времени опубликована лишь частично. Это не позволяет любому, даже весьма опытному программисту, создавать эффективные и надежные программы по статистической обработке данных на базе обобщенных распределений, а также сопутствующую документацию.
Поскольку других программ, кроме авторских, по этой теории не существует, то по вопросам приобретения программ для ПЭВМ, обработки статистических данных на базе обобщенных распределений и кривых роста и другим вопросам, связанным с применением обобщенных распределений, читателю следует обращаться непосредственно к автору теории, ибо только он может гарантировать выбор наиболее подходящей программы, метода оценивания параметров для решения конкретных задач пользователя, обучение, сопровождение, консультационные и другие услуги.
Автор предлагает принять его систему непрерывных распределений, методы оценивания параметров и серию программ в качестве основы для стандартизации статистической обработки данных, что гарантирует высокую экономическую эффективность статистических методов во всех практических приложениях, в том числе в системах управления качеством.
Приложение 1
Таблица значений функций
Г(х), Ψ(х) = dln(Г(х))/dx, Ψ΄(x), g(x) = Г(x+.5)/Г(х)
x |
Г(х) |
Ψ(х) |
Ψ΄(x) |
g(x) |
x |
Г(х) |
Ψ(х) |
Ψ΄(x) |
g(x) |
Приложение 2