- •Теория вероятностей и математическая статистика
- •Теория вероятностей
- •1. Общие понятия
- •1.1. Предмет теории вероятностей
- •1.2. Пространство элементарных событий
- •1.3. Операции над событиями
- •1.4. Статистический подход к понятию вероятности
- •1.5. Элементы комбинаторики
- •1. Перестановки.
- •2. Сочетания.
- •3. Размещения.
- •1.6. Классическое определение вероятности
- •1.7. Аксиоматическое определение вероятности
- •2. Основные теоремы теории вероятностей
- •2.1. Теорема умножения вероятностей
- •2.2. Теорема сложения вероятностей
- •2.3. Формула полной вероятности
- •2.4. Формула Бейеса
- •3. Повторение испытаний
- •3.1. Независимые испытания. Формула Бернулли
- •3.2. Локальная теорема Муавра – Лапласа
- •3.3. Интегральная теорема Лапласа
- •3.4. Теорема Пуассона
- •3.5. Вероятность отклонения частоты от постоянной вероятности в независимых испытаниях
- •4. Случайные величины и функции распределения
- •4.1. Случайные величины
- •4.2. Функция распределения вероятностей для дискретной св
- •4.3. Функция распределения вероятностей для непрерывной св.
- •4.4. Функция плотности распределения вероятностей
- •5. Числовые характеристики случайных величин
- •5.1. Математическое ожидание случайной величины
- •5.2. Дисперсия и среднее квадратическое отклонение св
- •5.3. Моменты и другие числовые характеристики случайной величины
- •6. Основные законы распределения случайных величин
- •6.1. Законы распределения дискретных случайных величин
- •6.1.1. Биномиальное распределение
- •6.1.2. Распределение Пуассона
- •6.1.3. Геометрическое распределение
- •6.2. Законы распределения непрерывных случайных величин
- •6.2.1. Равномерное распределение
- •6.2.2. Показательное распределение
- •6.2.3. Нормальное распределение
- •7. Закон больших чисел
- •7.1. Неравенства Чебышева
- •7.2. Теорема Чебышева
- •8. Многомерные случайные величины
- •8.1. Многомерные случайные величины и их функции распределения
- •X и y независимые случайные величины.
- •8.2. Вероятность попадания двумерной случайной величины
- •8.3. Числовые характеристики двумерной случайной величины
- •Математическая статистика
- •1. Статистические законы распределения выборки
- •1.1. Вариационный ряд
- •1.2. Полигон и гистограмма
- •1.3. Эмпирическая функция распределения
- •2. Статистические оценки параметров распределения
- •2.1. Точечные оценки
- •2.2. Интервальные оценки
- •2.3. Оценка вероятности появления события через его частоту
- •3. Проверка статистических гипотез.
- •3.1. Статистические гипотезы
- •3.2. Критерии проверки гипотезы
- •3.3. Критерий согласия Пирсона
- •3.4. Критерий согласия Романовского
- •4. Элементы теории корреляции
- •4.1. Статистические зависимости
- •4.2. Линейная регрессия
- •4.3. Корреляционная таблица
- •4.4. Выборочный коэффициент корреляции
- •Литература
- •С о д е р ж а н и е
2.3. Оценка вероятности появления события через его частоту
Пусть осуществлена серия из п последовательных независимых испы-таний и в k случаях произошло событие А. Считая, что вероятность р появления события А одинакова в каждом испытании, оценим искомую вероятность.
Применим к задаче оценки вероятности наблюдаемого события следствиеиз интегральной теоремы Лапласа:
(2.3)
Если нам задан уровень надежности , то по таблице (Прил. 5) най-дем tиз условия. Тогда соотношение (2.3) можно записать
где величина определяется из условия
(2.4)
так как (см. п.7.2). В итоге соотношение (2.3) примет вид
Замечание. Если вероятность p из неравенства (2.4) оценить реальной
частотой наблюдаемого события, а не, то величина уменьшится, а, следовательно, сузится и доверительный интервал.
Пример 2.3. Монету подбросили 900 раз и при этом герб выпал 540 раз. Полагая уровень надежности , выяснить, согласуется ли этот результат с предположением о том, что монета изготовлена из однородного материала и имеет стандартные размеры.
Из таблицы (Прил. 5) находим t = 3,291, поэтому
Если бы наше предположение было верным, то с вероятностью 0,999
разность должна быть не больше чем0,0549. Но по данным
опытов герб выпал 540 раз из 900 бросаний, а, поскольку вероятность выпадения герба то имеем
Таким образом, с вероятностью 0,999 можно утверждать, что исполь-зуемая при бросании монета не является стандартной.
Учитывая статистический смысл понятия вероятности, полученному результату можно дать такое объяснение: если осуществлять много серий бросаний монеты (по 900 раз в каждой серии), то в среднем не более чем в 0,1% серий (1 серия из 1000) может выполняться неравенство
или
Поэтому, можно считать практически невозможным, что в одной из серий из 900 бросаний монеты герб выпадет больше чем 500 раз.
Пример 2.4. В пруд выпустили 100 меченых рыб (n). Незадолго пос-ле этого было выловлено 400 рыб, среди которых было выявлено ровно 5 меченых (k). Оценить общее количество рыб N в пруду с заданной надеж-ностью .
Оценим вероятность вылова меченой рыбы по частоте .
Находим t=1,96 из таблицы (прил.5) и по формуле (2.4) с учетом приведенного выше замечания имеем
Таким образом, для общего количества рыб в пруду с заданной вероятностью должно выполняться неравенство
Отсюда получаем искомую оценку общего количества рыб в пруду
3. Проверка статистических гипотез.
3.1. Статистические гипотезы
Часто в задачах практики на основании тех или иных данных делается предположение (гипотеза) о виде закона распределения интересующей нас случайной величины или о параметрах известных распределений. Однако для окончательного решения вопроса о виде закона распределения или предполагаемой величине исследуемого параметра нужно проверить насколько сделанные предположения (гипотезы) согласуются с имеющимися опытными данными. Поскольку такую проверку осуществляют статисти-ческими методами, то выдвинутую гипотезу принято также называть статистической. Здесь мы будем рассматривать только гипотезы о виде закона распределения случайной величины.
Вместе с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Выдвинутую гипотезу обычно называют нулевой или основной и обозначают , а гипотезу , противоречащую нулевой, называют альтернативной или конкурирующей.
Выдвинутая гипотеза может быть как верной, так и неверной, поэтому при ее проверке может быть принято как верное, так и неверное решение. Если будет отвергнута верная гипотеза, то это ошибка первого рода, а если будет принята неверная гипотеза это ошибка второго рода.
Вероятность совершить ошибку первого рода называют уровнем значимости и обычно обозначают через . Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Это означает, что если, например, уровень значимости принят равным = 0,01, то вероятность совершить ошибку первого рода равна 0,01.
Отметим, что правильное решение может быть принято в двух случаях:
гипотеза принимается и в действительности она верна;
гипотеза отвергается и в действительности она неверна.
Если нулевая гипотеза принята, то это еще не означает, что она верна. Один единственный рассмотренный пример, подтверждающий нашу гипотезу, ее верность не доказывает. В данном случае, следует считать, что данные выборки согласуются с нулевой гипотезой и, следовательно, нет никаких оснований ее отвергнуть. Другими словами, верность гипотезы следует подтвердить другими способами, например, увеличив объем выборки. А вот для отклонения нулевой гипотезы достаточно привести единственный пример, который ей противоречит.