- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
В.В. Нешитой
МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ
МЕТОДЫ АНАЛИЗА
В БИБЛИОТЕЧНО-ИНФОРМАЦИОННОЙ
ДЕЯТЕЛЬНОСТИ
Минск 2009
УДК 519.23(075.8)
ББК 22.17я73
Н59
Рецензенты
П.В.Гляков, кандидат физико-математических наук, доцент;
С.В.Гилевский, кандидат технических наук, доцент
Рекомендовано к изданию президиумом научно-методического совета Белорусского государственного университета культуры и искусств (протокол № 4 от 13.01.2009 г.)
Нешитой В.В.
Н 59 Математико-статистические методы анализа в библиотечно-информационной деятельности: учеб. пособие / В.В.Нешитой. – Мн., БГУ культуры и искусств, 2009. – 203 с.
ISBN 978-985-6798-58-3.
Строятся и исследуются системы непрерывных распределений, заданные многопараметрическими плотностями. Рассматриваются вопросы их практического применения. Устанавливаются универсальные законы рассеяния и старения публикаций.
Рекомендуется студентам, аспирантам, библиотечно-информационным работникам, инженерам, экономистам, использующим статистические методы при решении практических задач.
УДК 519.23(075.8)
ББК 22.17я73
ISBN 978-985-6798-58-3. © Нешитой В.В., 2009
Введение
При статистической обработке рядов распределения однородных случайных величин, например, технологических погрешностей, главной задачей является установление закона распределения вероятностей исследуемой случайной величины и нахождение оценок его параметров, поскольку закон распределения является наиболее полной характеристикой случайной величины.
Однако найти закон распределения или хотя бы наилучшее аппроксимирующее (выравнивающее) распределение оказывается весьма непросто. В литературе по теории вероятностей и математической статистике его рекомендуется подбирать исходя из формы статистического распределения, представленного в виде гистограммы. Подбор осуществляется путем выдвижения гипотез о виде теоретической кривой и проверки каждой из них по критериям согласия.
Такой метод не дает однозначного решения и его нецелесообразно использовать при статистической обработке данных.
Кроме того, практика показала, что известные распределения не могут с достаточной точностью описать все многообразие статистических распределений, встречающихся в различных областях знания, и поэтому их использование часто не дает ожидаемых результатов по совершенствованию технологических процессов.
О сложности решения задачи по установлению закона распределения случайной величины свидетельствует тот факт, что порядок обработки статистических данных, выбор математической модели из нескольких предлагаемых частных случаев в свое время был установлен специальным документом Госстандарта СССР МИ199-79. Этот порядок из-за сложности процедур предлагалось использовать лишь при особо ответственных измерениях, где требовалось определить закон распределения на основании статистических данных, причем, необходимость его использования требовалось экономически обосновать.
Для решения подобных задач автором cоздана теория обобщенных распределений, которая включает четыре системы непрерывных распределений, заданные четырехпараметрическими плотностями, систему дискретных распределений, взаимосвязанную с системой кривых роста новых событий, методы вычисления типа выравнивающей кривой и точечных оценок параметров, номограммы для графического определения типа выравнивающей кривой и оценок параметров и серию компьютерных программ под общим названием SNR (системы непрерывных распределений) для работы с указанными системами, а также ряд других программ по всем разделам теории. Подробнее о программах – см. Приложение 5.
Обобщенные распределения включают как частные случаи подавляющее большинство широко известных классических непрерывных распределений, в том числе семейство кривых К. Пирсона и могут претендовать на роль универсальных законов распределения теории вероятностей и математической статистики.
Отныне для установления теоретического закона распределения непрерывной случайной величины по ее статистическому распределению не требуется выдвижения многочисленных гипотез о выравнивающей кривой и проверки каждой из них по критериям согласия. Система непрерывных распределений выбирается в зависимости от свойств случайной величины, а тип кривой и оценки параметров определяются расчетом (без выдвижения гипотез!).
В настоящей книге кроме четырехпараметрических распределений приводятся еще более общие системы непрерывных распределений, заданные пяти – и шестипараметрическими плотностями.
Книга может оказаться полезной для всех категорий специалистов, вынужденных по характеру своей деятельности обрабатывать большое количество статистических рядов распределения, а также временных рядов при решении различных задач, например: статистический анализ точности и стабильности технологических процессов; статистическое регулирование технологических процессов; разработка различного рода нормативов; прогнозирование надежности механизмов и приборов; прогнозирование кривых роста (временных рядов); прогнозирование распределений случайных величин; статистическая обработка и анализ данных в научных исследованиях, экономике, банковском деле, технике, строительстве, экологии, медицине, социологии, библиотечно-информационной деятельности, в системах управления и контроля качества продукции с целью выработки рекомендаций для принятия обоснованных управленческих решений.
Применение обобщенных распределений и серии компьютерных программ в системах управления качеством позволяет с высокой точностью оценивать возможности технологических процессов и поддерживать их в статистически управляемом состоянии при любом законе распределения технологических погрешностей, что обеспечивает значительное снижение уровня брака.
Использование обобщенных распределений значительно повышает эффективность статистических методов и их роль в теоретических и прикладных исследованиях.