- •Введение
- •1. Основные понятия теории вероятностей Операции над событиями
- •Частость наступления события
- •Свойства частости
- •Аксиоматика теории вероятности Построение вероятностного пространства
- •Теорема о продолжении меры
- •Определение вероятностного пространства
- •Классическое определение вероятности
- •Условная вероятность
- •Обоснование формулы условной вероятности в общем случае
- •Независимые события
- •Формула сложения вероятностей
- •Формула полной вероятности
- •Формула Байеса
- •Композиция испытаний
- •Композиция n испытаний
- •Композиция n независимых испытаний
- •Биномиальное распределение
- •Случайная величина Теорема Колмогорова
- •Дискретные случайные величины
- •Вероятностные характеристики дискретных случайных величин
- •Свойства математического ожидания
- •Производная функция
- •Первая модель распределения Пуассона
- •Вторая модель распределения Пуассона
- •Непрерывные случайные величины
- •Свойства плотности вероятности
- •Второе эквивалентное определение плотности вероятности
- •Вероятностные характеристики непрерывных случайных величин
- •Распределение Гаусса - нормальное
- •Функция Лапласа
- •Неравенство Чебышева
- •Многомерные случайные величины
- •Аксиоматика. Формальная вероятностная модель
- •Двумерные случайные величины
- •Двумерные непрерывные случайные величины
- •2. Основы математической статистики
- •2.1. Основные понятия математической статистики
- •Интервальная группировка и представление выборочных данных
- •Числовые характеристики распределения выборки
- •Точечные статистические оценки параметров распределения
- •2.1.5.3. "Исправленная" дисперсия и "исправленное" среднее квадратическое отклонение
- •Интервальные статистические оценки параметров распределения (доверительные интервалы)
- •2.1.6.3. Доверительный интервал для математического ожидания нормального распределения случайной величины
- •Основные законы распределения, используемые в статистических исследованиях
- •Асимметрия и эксцесс распределения
- •2.2. Основные методы математической статистики
- •2.2.1. Проверка статистических гипотез
- •Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий Колмогорова
- •2.2.2. Исследование статистических различий между двумя выборками
- •Список использованных источников
- •Содержание Справочные материалы
- •Значения функции
- •Значения нормально распределенной случайной величины z
- •На интервале [0,1]
- •Значения функции
- •Табличные (критические) значения функции распределения χ2
2. Основы математической статистики
2.1. Основные понятия математической статистики
Математическая статистика (МС) – прикладной раздел теории вероятностей (ТВ). Поэтому предмет изучения у них общий. ТВ и МС изучают закономерности в случайных явлениях (процессах). Вместе с тем ТВ изучает непосредственно не сами реальные случайные явления окружающего мира, а их абстрактные математические модели. При этом в задачах ТВ предполагается, что вероятностное пространство заранее задано. Однако в практических задачах в большинстве своем положение совершенно иное: как правило, априори законы распределения неизвестны. Единственное, что мы можем сделать при изучении случайных явлений – это ставить эксперименты (опыты) и производить наблюдения за случайными явлениями. Именно МС работает с экспериментальными данными и помогает восстановить строение вероятностного пространства, на основе чего строится вероятностная модель, адекватная реальному случайному явлению. Итак, в узком смысле МС изучает методы обработки экспериментальных данных с целью получения достоверной информации об интересующем исследователя случайном явлении (процессе). МС обеспечивает ТВ необходимой информацией для построения адекватной реальному процессу вероятностной модели, с помощью которой ТВ не только выявляет объективные закономерности, но и помогает осуществлять научный прогноз в своеобразной области случайных явлений.
Перечислим основные задачи МС:
1) первичная обработка результатов наблюдений (эксперимента);
2) проверка статистических гипотез;
3) статистические оценки параметров распределения;
4) исследование статистических зависимостей (связей).
Генеральная совокупность – множество всех объектов (субъектов), подлежащих изучению.
Выборочная совокупность (выборка) – ограниченное подмножество объектов, отобранных из генеральной совокупности.
Примем следующие обозачения:
N – объем генеральной совокупности (т.е. число объектов этой совокупности);
n – объем выборки.
Понятно, что объем
выборки значительно меньше объема
генеральной совокупности (n
N).
Суть выборочного метода статистического исследования некоторого признака генеральной совокупности состоит в том, что по результатам обследования объектов выборки требуется сделать объективное заключение о признаке всей генеральной совокупности. Но для этого выборка должна правильно представлять генеральную совокупность. Поэтому к выборке должны быть предъявлены определенные требования (они будут проясняться по мере развития необходимого аппарата). Здесь же мы отметим только основной принцип формирования выборки – принцип случайного отбора: выборка должна быть организована таким образом, чтобы каждый объект генеральной совокупности имел одинаковые шансы попасть в эту выборку.
Пусть из генеральной
совокупности объема
для изучения некоторого признака
(случайной величины)
извлечена
выборка объема n
и в результате проведенного обследования
объектов выборки обнаружилось, что
значение
признака
наблюдалось
,
–
,…,
–
раз. Очевидно,
.
Расположим все наблюдаемые значения
признака
в неубывающем порядке:
.
Вариационным рядом называется последовательность наблюдаемых значений признака , расположенных в неубывающем порядке:
.
Каждое значение вариационного ряда называется вариантой.
Числа
наблюдений различных вариант
называются частотами
этих вариант, а отношения
(где n
– объем выборки) называются относительными
частотами
соответствующих вариант и обозначаются
через
.
Итак,
.
Заметим, что
,
т.е. сумма относительных частот вариант
равна 1.
Статистическим рядом называется таблица следующего вида:
-
…
…
В
первой строке таблицы записываются
различные
варианты, а во второй – соответствующие
им частоты. Здесь
(наименьшая варианта),
(наибольшая варианта). Разность
обычно обозначают через R
и называют размахом
выборки:
.
Выборочный ряд распределения задается с помощью следующей таблицы:
-
…
…
В ней указывается
соответствие между наблюдаемыми
вариантами
и их относительными частотами
.
Отметим, что выборочный ряд распределения
является аналогом ряда распределения
дискретной случайной величины.
Полигоном частот называется графическое изображение статистического ряда (рис.1).
0
Рисунок 1 – Полигон частот
По оси абсцисс
откладываются различные варианты
,
а по оси ординат соответствующие им
частоты
.
Ломаная линия, соединяющая точки
,
является полигоном частот.
Полигон относительных частот – графическое представление выборочного ряда распределения (рис.2).
Р
исунок
2 - Полигон относительных частот
Заметим, что полигон относительных частот является аналогом многоугольника распределения дискретной случайной величины.
Эмпирическая функция распределения
Эмпирической
функцией распределения признака
называется
функция
,
значением которой при каждом фиксированном
значении аргумента x
является относительная частота события
,
т.е. функция вида
,
где
– число вариант, меньших рассматриваемого
значения аргумента x
(причем здесь каждая варианта считается
столько раз, сколько она наблюдалась);
n – объем выборки.
Свойства
аналогичны свойствам теоретической
функции распределения
и вытекают непосредственно из определения
:
1. Значения
эмпирической функции распределения
заключены между 0 и 1:
;
2. есть неубывающая функция;
3.
=0
при
(
– наименьшая варианта),
=1
при
(
– наибольшая варианта).
Общий вид графика эмпирической функции распределения приведен на рис.3.
Р
исунок
3 - Общий вид графика эмпирической фукции
распределеия
Заметим, что эмпирическая функция распределения служит в качестве подходящего приближенного описания теоретической функции распределения изучаемого признака генеральной совокупности.
