
- •Введение
- •Предмет теории вероятностей и математической статистики
- •Часть 1: Теория вероятностей
- •Глава 1: События и их вероятности
- •1. Понятие события
- •2. Элементарные события
- •3. Алгебра событий
- •4. Вероятность события
- •5. Свойства вероятности
- •6. Вероятностные схемы
- •Глава 2: Вероятности сложных событий
- •7. Условная вероятность. Независимые события
- •8. Вероятность произведения событий
- •9. Вероятность суммы событий
- •10. Формула полной вероятности. Формула Байеса
- •Глава 3: Системы независимых испытаний
- •11. Схема Бернулли
- •12. Наивероятнейшее число появления события
- •13. Приближения Лапласа
- •14. Приближение Пуассона
- •Глава 4: Цепи Маркова и случайные процессы
- •Глава 5: Случайные величины
- •Понятие случайной величины
- •Дискретные случайные величины
- •Непрерывные случайные величины
- •Параметры распределения случайных величин
- •Системы случайных величин
- •Глава 6: Основные виды распределений
- •Стандартные случайные величины
- •Равномерное распределение
- •Биномиальное распределение
- •Распределение Пуассона
- •Нормальное распределение
- •Глава 7: Закон больших чисел
- •Часть 2: математическая статистика
- •Глава8: Статистическая обработка данных
- •Понятие статистического исследования
- •Первичная обработка данных
- •Глава 9: Статистические оценки
- •Глава 10: Статистическая проверка гипотез
Часть 2: математическая статистика
Статистика занимается разработкой и применением статистических методов обработки данных о массовых явлениях. На основании полученных экспериментальных данных статистика решает следующие основные задачи:
определяет общий вид закона распределения случайной величины;
оценивает вероятности событий;
оценивает параметры распределения случайной величины при известной или неизвестной форме закона распределения.
Глава8: Статистическая обработка данных
При исследовании массовых явлений исследуемые объекты можно рассматривать двояко:
как объекты, обладающие некоторыми характеристиками;
как значения случайной величины.
Первый подход используется при практическом применении статистики и интерпретации полученных сведений. Второй подход используется при разработке и изучении методов статистической обработки данных.
Понятие статистического исследования
Всё множество объектов, которые необходимо изучить в рамках поставленной исследовательской задаче, называют генеральной совокупностью (в теории этому понятию соответствует исследуемая случайная величина).
Если исследовать каждый объект генеральной совокупности, то мы получим точные сведения относительно вида закона распределения и всех параметров этого распределения случайной величины. Это исследование носит название сплошного.
Пример: перепись населения является сплошным исследованием людей, находящихся на территории данной страны.
Проведению сплошных исследований препятствует ряд факторов. Сплошное исследование, как правило, требует большого количества ресурсов, что не позволяет его провести с соблюдением методики, а значит и с достаточной точностью (проведение переписи населения небольшим социологическим центром). Не все объекты генеральной совокупности доступны для исследования (нельзя взвесить зёрна, которые уже смололи в муку, и зёрна, которые вырастут в следующем году). Полученные в результате сплошного исследования данные теряют актуальность вследствие того, что процесс исследования портит объект исследования (сплошное исследование партии ламп на среднее время работы приведёт к тому, что все лампы перегорят).
Избежать указанных трудностей позволяет использование выборочного метода, когда исследуется не вся генеральная совокупность, а только её часть. Множество объектов генеральной совокупности, отобранное для исследования, называется выборкой. Количество выбранных объектов носит название объём выборки (обозначение: n)
Для того, чтобы по данным, полученным при исследовании выборки, можно было судить о свойствах генеральной совокупности, выборка должна быть представительной. Для этого необходимо соблюдение двух условий:
у каждого объекта генеральной совокупности есть равные шансы попасть в выборку (на практике для соблюдения этого условия достаточно, чтобы способ отбора не влиял на изучаемые характеристики);
объём выборки должен быть достаточным для того, чтобы начал действовать закон больших чисел (на практике с ростом объёма выборки растёт точность полученных данных, именно она должна быть достаточной для того, чтобы можно было пренебречь эффектом случайности).
В результате исследования выборки мы получаем совокупность значений исследуемой случайной величины: х1, х2, …, хn. Эти значения будут меняться от выборки к выборке, т.е. сами являются случайными величинами (в рамках теоретических рассуждений). Эти случайные величины обладают таким же законом распределения, как и исследуемая случайная величина, на этом основаны все статистические методы изучения свойств случайных величин.