
- •Пространство элементарных событий.
- •Совместные и несовместные события.
- •Операции над событиями (сумма, разность, произведение).
- •Свойства операций над событиями.
- •Алгебра и сигма-алгебра событий.
- •Классическое определение вероятности события. Случаи равновероятных исходов.
- •Статистическое определение вероятности события. Случаи неравновероятных исходов.
- •Геометрические вероятности.
- •Аксиоматическое построение теории вероятностей.
- •Полная группа событий.
- •Условная вероятность.
- •Формула умножения вероятностей.
- •Формула сложения вероятностей.
- •Независимость событий.
- •Основные понятия комбинаторики.
- •Правила суммы и произведения.
- •Случай непостоянной вероятности появления события в опытах
- •Предельные теоремы для схемы Бернулли.
- •Теорема Пуассона.
- •Понятие потока событий.
- •Локальная теорема Муавра –Лапласа.
- •Интегральная (глобальная) теорема Муавра – Лапласа.
- •Закон распределения дискретной случайной величины.
- •Свойства функции распределения
- •Свойства математического ожидания:
- •Дисперсия случайной величины и ее свойства.
- •Среднее квадратическое отклонение.
- •Распределение Пуассона.
- •Геометрическое распределение
- •Гипергеометрическое распределение (урновая схема)
- •Равномерное распределение.
- •Показательное распределение.
- •Свойства функции Гаусса.
- •Вероятность попадания нормальной случайной величины в заданный интервал.
- •Функция Лапласа и ее свойства.
- •Отклонение нормальной случайной величины от ее математического ожидания. Правило «трех сигм».
- •Закон распределения вероятностей двумерной случайной величины
- •Свойства совместной функции распределения двух случайных величин
- •Плотность совместного распределения вероятностей непрерывной двумерной случайной величины
- •Свойства двумерной плотности вероятности
- •Независимые случайные величины
- •Для независимых случайных величин справедливы соотношения
- •Корреляционный момент
- •Коэффициент корреляции Коэффициентом корреляции случайных величин X и y называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин:
- •Свойства коэффициента корреляции
- •Способы отбора На практике применяются различные способы отбора, которые можно подразделить на два вида:
- •Выборочные среднее и дисперсия
- •Доверительный интервал для математического ожидания нормального распределения при известной дисперсии.
- •Доверительный интервал для математического ожидания нормального распределения при известной дисперсии.
- •Статистический критерий
- •A. Понятие о корреляционном анализе
- •Линейная регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Логарифмическая модель.
- •Обратная модель.
- •Степенная модель.
- •Показательная модель.
- •Однородные цепи Маркова
- •Понятие о системах массового обслуживания
Независимые случайные величины
Две случайные величины называются независимыми, если закон распределения одной из них не зависит от того, какие возможные значения приняла другая величина.
Теорема.
Для того чтобы случайные величины
и
были
независимыми, необходимо и достаточно,
чтобы функция распределения системы
(
,
)
была равна произведению функций
распределения составляющих:
.
Следствие.
Для того чтобы случайные величины
и
были
независимыми, необходимо и достаточно,
чтобы плотность совместного распределения
системы (
,
)
была равна произведению плотностей
распределения составляющих:
.
Для независимых случайных величин справедливы соотношения
.
Числовые характеристики системы двух случайных величин
Для системы двух случайных величин, кроме математических ожиданий и дисперсий составляющих используют и другие характеристики, такие как корреляционный момент и коэффициент корреляции.
Корреляционный момент
Характеристикой зависимости между случайными величинами и служит математическое ожидание произведения отклонений и от их математических ожиданий. Это так называемый корреляционный момент или ковариация:
Для вычисления корреляционного момента дискретных величин используют формулу:
а для непрерывных
величин – формулу:
Если корреляционный момент случайных величин X и Y отличен от нуля, то данные величины являются зависимыми.
Теорема. Корреляционный момент двух независимых случайных величин и равен нулю.
Доказательство.
Так как
и
– независимые
случайные величины, то их отклонения
и
также независимы. Пользуясь свойствами
математического ожидания (математическое
ожидание произведения независимых
случайных величин равно произведению
математических ожиданий сомножителей)
и отклонения (математическое ожидание
отклонения равно нулю), получим:
.
Из определения корреляционного момента следует, что он имеет размерность, равную произведению размерностей величин и . Другими словами, величина корреляционного момента зависит от единиц измерения случайных величин и для одних и тех же двух величин величина корреляционного момента имеет различные значения в зависимости от того, в каких единицах были измерены величины.
Для устранения этого недостатка вводят новую числовую характеристику – коэффициент корреляции.
Коэффициент корреляции Коэффициентом корреляции случайных величин X и y называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин:
Для независимых и коэффициент корреляции равен нулю.
Свойства коэффициента корреляции
Если
, то
, где k и b — константы, k>0.
Если,
, то
, где k<0.
Коэффициент корреляции достигает своих предельных значений –1 и 1 в том и только в том случае, если между и имеется линейная зависимость.
При
<1
линейная зависимость отсутствует, хотя
по мере приближения
к единице совместное распределение
,
имеет тенденцию концентрироваться
вблизи некоторой прямой линии и величину
можно считать мерой близости к полной
линейной зависимости между
и
.
Введем понятие корреляционной зависимости между и . Две случайные величины называют коррелированными, если их ковариация или коэффициент корреляции отличны от нуля, и некоррелированными в противном случае.
Говорят, что между и существует прямая корреляционная зависимость, если с ростом случайная величина имеет тенденцию возрастать (при больших с большей вероятностью встречаются большие значения ). Если с ростом случайная величина имеет тенденцию убывать, говорят, что между и существует обратная корреляционная зависимость.
Чем ближе
к единице, тем теснее глубина корреляционной
зависимости.
Пример: Найти коэффициент корреляции между величинами X и Y, совместный закон распределения которых задан следующей таблицей
-
1
2
3
4
10
0,2
0,02
0,01
0
0,23
20
0,03
0,3
0,02
0
0,35
30
0,02
0,1
0,2
0,1
0,42
0,25
0,42
0,23
0,1
1
Находим:
Аналогично,
найдем
и по ним
.
Окончательно получим
Лекция 11. Неравенство Чебышева. Теорема Чебышева. Центральная предельная теорема.
Несмотря на то, что заранее нельзя предсказать, какое из возможных значений примет случайная величина в результате опыта, при некоторых условиях суммарное поведение достаточно большого числа случайных величин становится закономерным. Иными словами, при очень большом числе случайных явлений их средний результат практически перестает быть случайным и может быть предсказан с большой степенью определенности.
Для практики очень важно знание условий, при выполнении которых это может происходить. Эти условия указываются в теоремах, носящих общее название закона больших чисел, важнейшей из которых является теорема Чебышева. Для доказательства теоремы Чебышева используется неравенство Чебышева, которое мы сейчас рассмотрим.
Неравенство Чебышева
Вероятность того,
что отклонение случайной величины X
от ее математического ожидания по
абсолютной величине меньше положительного
числа e, не меньше,
чем
,
т.е.
Пример.
Номинальное значение диаметра втулки равно 5 мм, а дисперсия, из-за погрешностей изготовления, не превосходит 0,01. Оценить вероятность того, что размер втулки будет отличаться от номинала не более чем на 0,5 мм.
Решение:
По неравенству Чебышева
Неравенство Чебышева дает только верхнюю границу вероятности данного отклонения. Выше этой границы вероятность не может быть ни при каком законе распределения. Например, если мы захотим выяснить, какова вероятность того, что случайная величина X отклонится от своего математического ожидания не меньше, чем на 3 среднеквадратических отклонения, то неравенство Чебышева даст нам верхнюю границу этого значения 1/9 @ 0,111. В то же время, например для нормального распределения вероятность такого отклонения намного меньше - 0,0027 (правило трех сигм).
Теорема Чебышева.
Если
- попарно независимые случайные величины,
причем их дисперсии ограничены (не
превышают постоянного числа С), то, как
бы мало ни было положительное число e,
вероятность выполнения неравенства
будет как угодно близка к единице при достаточно большом числе n. Иначе говоря
Таким образом, теорема Чебышева утверждает, что для достаточно большого числа независимых случайных величин, имеющих ограниченные дисперсии, почти достоверным можно считать событие, состоящее в том, что отклонение среднего арифметического случайных величин от среднего арифметического их математических ожиданий будет по абсолютной величине сколь угодно малым.
Доказательство. Введем в рассмотрение новую случайную величину – среднее арифметическое случайных величин
Найдем математическое
ожидание
.
Пользуясь свойствами математического
ожидания, получим
Применяя к величине неравенство Чебышева, имеем
Или
(1)
Пользуясь свойствами дисперсии (постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат; дисперсия суммы независимых случайных величин равна сумме дисперсий слагаемых), получим
Так как по условию дисперсии всех случайных величин ограничены постоянным числом С, то
Таким образом
Подставляя правую часть последнего неравенства в (1) (отчего оно может быть только усилено), получим
Отсюда, переходя
к пределу при
и учитывая, что вероятность не может
превосходить единицы, получим
доказательство:
.
В важном частном случае, когда случайные величины имеют одно и то же математическое ожидание (обозначим его a) формула, выражающая теорему Чебышева, принимает вид
Сущность теоремы Чебышева такова: хотя отдельные независимые случайные величины могут принимать значения, далекие от своих математических ожиданий, среднее арифметическое достаточно большого числа случайных величин с большой вероятностью принимает значения, близкие к определенному
постоянному числу
или – в частном случае, к числу . Иными словами, отдельные случайные величины могут иметь значительный разброс, а их среднее арифметическое рассеяно мало. Объясняется это тем, что отклонения каждой из величин от своих математических ожиданий могут быть как положительными, так и отрицательными, а в среднем арифметическом они взаимно погашаются.
Пусть производится процесс измерения некоторой величины. Будем рассматривать результаты каждого измерения как случайные величины . Если результат каждого измерения не зависит от результатов остальных (т.е. величины попарно независимы), а случайные величины имеют одинаковое математическое ожидание и их дисперсии ограничены, то, применяя теорему Чебышева, получим, что при достаточно большом n среднее арифметическое результатов измерений сколь угодно мало отличается от истинного значения измеряемой величины (математического ожидания a).
На теореме Чебышева основан широко применяемый в статистике выборочный метод, суть которого состоит в том, что по сравнительно небольшой случайной выборке судят о всей совокупности (генеральной совокупности) исследуемых объектов.
Центральная предельная теорема.
Причину чрезвычайно широкой распространенности случайных величин, описывающихся нормальным распределением, объясняет центральная предельная теорема, доказанная А.М. Ляпуновым.
Центральная предельная теорема: Если случайная величина X представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то X имеет распределение, близкое к нормальному распределению.
Пусть - последовательность независимых случайных величин, каждая из которых имеет конечные математическое ожидание и дисперсию
.
Введем обозначения для суммы случайных величин, суммы их математических ожиданий и суммы их дисперсий
.
Рассмотрим
функцию
,
которая, как легко показать, имеет
математическое ожидание и дисперсию,
равные нулю и единице соответственно
(нормированная сумма).
Действительно,
,
Обозначим функцию распределения нормированной суммы
.
Говорят,
что к последовательности
применима центральная предельная
теорема, если при любом x
функция распределения нормированной
суммы при
стремится к нормальной функции
распределения:
В
частности, если все случайные величины
одинаково распределены, то к этой
последовательности применима центральная
предельная теорема, при условии, что
дисперсии всех величин конечны и отличны
от нуля. В частном случае, когда
математические ожидания и дисперсии
всех
одинаковы (
),
в последнем равенстве нужно положить
.
Центральная предельная теорема находит чрезвычайно широкое применение в математической статистике, в частности, при обосновании выбора закона распределения генеральной совокупности.
В заключение отметим, что использование теоремы Чебышева и центральной предельной теоремы позволяет не только осуществлять научные прогнозы в области случайных явлений, но и оценивать точность этих прогнозов.
Лекция 12. Выборочный метод анализа свойств генеральной
совокупности.
Предметом математической статистики является изучение случайных событий и случайных величин по результатам наблюдений. Совокупность предметов или явлений, объединенных каким-либо общим признаком, называется статистической совокупностью. Результатом наблюдений над статистической совокупностью являются статистические данные – сведения о том, какие значения принял в итоге наблюдений интересующий нас признак (случайная величина X).
Обработка статистических данных методами математической статистики приводит к установлению определенных закономерностей, присущих массовым явлениям. При этом точность статистических выводов повышается с ростом числа наблюдений.
Статистические
данные, как правило, представляют собой
ряд значений
некоторой случайной величины. Обработка
этого ряда значений представляет собой
первый этап исследования случайной
величины.
Первая задача математической статистики – указать способы сбора и группировки статистических данных, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Второй задачей математической статистики является разработка методов анализа статистических данных в зависимости от целей исследования. К этой задаче относятся:
Оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких случайных величин и т.п.
Проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.
В современной математической статистике есть много общего с наукой о принятии решений в условиях неопределенности, так как она разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в процессе исследования (последовательный анализ) и решает многие другие аналогичные задачи.
Выборочный метод и его основные понятия. Случайная выборка, объем выборки.
Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, для партии деталей качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали.
В принципе, возможно проведение сплошного обследования, т.е. обследование всех объектов. На практике такое обследование применяется редко, например,
из–за большого числа объектов
из–за дороговизны проведения операции контроля,
из–за того, что контроль часто связан с разрушением объекта (проверка электролампы на долговечность ее работы), и т.д.
В таких случаях случайно отбирается и изучается ограниченное число объектов из совокупности.
Выборочной совокупностью или случайной выборкой называют совокупность случайно отобранных объектов.
Генеральной совокупностью называют совокупность объектов, из которых производится выборка.
Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отбирается для обследования 100, то объем генеральной совокупности N=1000, а объем выборки n = 100.
Пример: Число единиц товара N, произведенного некоторым предприятием в течение года, есть генеральная совокупность. Для исследования качества продукции на практике рассматривается выборка, состоящая из n единиц товара. Признаком, или случайной величиной, может быть число единиц товара, удовлетворяющих сертификационным требованиям.
При составлении выборки можно поступать двумя способами: после того как объект отобран и исследован, его можно возвратить или не возвращать в генеральную совокупность. В связи с этим выборки подразделяются на повторные и бесповторные.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. При бесповторной выборке отобранный объект в генеральную совокупность не возвращается.
Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Выборка должна правильно представлять пропорции генеральной совокупности, т.е. выборка должна быть репрезентативной (представительной). Пример – изучение общественного мнения.
В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.
Если объем выборки достаточно велик, а выборка составляет лишь незначительную часть совокупности, то различие между повторной и бесповторной выборкой стирается.