Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции Теория вероятностей и мат.статистика.doc
Скачиваний:
551
Добавлен:
17.04.2014
Размер:
4.46 Mб
Скачать

Для независимых случайных величин справедливы соотношения

.

Числовые характеристики системы двух случайных величин

Для системы двух случайных величин, кроме математических ожиданий и дисперсий составляющих используют и другие характеристики, такие как корреляционный момент и коэффициент корреляции.

Корреляционный момент

Характеристикой зависимости между случайными величинами ислужит математическое ожиданиепроизведения отклонений иот их математических ожиданий. Это так называемыйкорреляционный момент или ковариация:

Для вычисления корреляционного момента дискретных величин используют формулу:

а для непрерывных величин – формулу:

Если корреляционный момент случайных величин X и Y отличен от нуля, то данные величины являются зависимыми.

Теорема. Корреляционный момент двух независимых случайных величин иравен нулю.

Доказательство. Так как и – независимые случайные величины, то их отклонения итакже независимы. Пользуясь свойствами математического ожидания (математическое ожидание произведения независимых случайных величин равно произведению математических ожиданий сомножителей) и отклонения (математическое ожидание отклонения равно нулю), получим:.

Из определения корреляционного момента следует, что он имеет размерность, равную произведению размерностей величин и . Другими словами, величина корреляционного момента зависит от единиц измерения случайных величин и для одних и тех же двух величин величина корреляционного момента имеет различные значения в зависимости от того, в каких единицах были измерены величины.

Для устранения этого недостатка вводят новую числовую характеристику – коэффициент корреляции.

Коэффициент корреляции Коэффициентом корреляции случайных величинX и y называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин:

Для независимыхикоэффициент корреляции равен нулю.

Свойства коэффициента корреляции

  1. Если , то, где k и b — константы, k>0.

  2. Если, , то, гдеk<0.

Коэффициент корреляции достигает своих предельных значений –1 и 1 в том и только в том случае, если междуиимеется линейная зависимость.

При <1 линейная зависимость отсутствует, хотя по мере приближенияк единице совместное распределение,имеет тенденцию концентрироваться вблизи некоторой прямой линии и величинуможно считать мерой близости к полной линейной зависимости междуи.

Введем понятие корреляционной зависимостимеждуи. Две случайные величины называюткоррелированными, если их ковариация или коэффициент корреляции отличны от нуля, инекоррелированными в противном случае.

Говорят, что между исуществует прямая корреляционная зависимость, если с ростомслучайная величинаимеет тенденцию возрастать (при большихс большей вероятностью встречаются большие значения). Если с ростомслучайная величинаимеет тенденцию убывать, говорят, что междуисуществует обратная корреляционная зависимость.

Чем ближе к единице, тем теснее глубина корреляционной зависимости.

Пример: Найти коэффициент корреляции между величинамиXиY, совместный закон распределения которых задан следующей таблицей

1

2

3

4

10

0,2

0,02

0,01

0

0,23

20

0,03

0,3

0,02

0

0,35

30

0,02

0,1

0,2

0,1

0,42

0,25

0,42

0,23

0,1

1

Находим:

Аналогично, найдем и по ним. Окончательно получим

Лекция 11. Неравенство Чебышева. Теорема Чебышева. Центральная предельная теорема.

Несмотря на то, что заранее нельзя предсказать, какое из возможных значений примет случайная величина в результате опыта, при некоторых условиях суммарное поведение достаточно большого числа случайных величин становится закономерным. Иными словами, при очень большом числе случайных явлений их средний результат практически перестает быть случайным и может быть предсказан с большой степенью определенности.

Для практики очень важно знание условий, при выполнении которых это может происходить. Эти условия указываются в теоремах, носящих общее название закона больших чисел, важнейшей из которых является теорема Чебышева. Для доказательства теоремы Чебышева используется неравенство Чебышева, которое мы сейчас рассмотрим.

Неравенство Чебышева

Вероятность того, что отклонение случайной величины Xот ее математического ожидания по абсолютной величине меньше положительного числаe, не меньше, чем, т.е.

Пример.

Номинальное значение диаметра втулки равно 5 мм, а дисперсия, из-за погрешностей изготовления, не превосходит 0,01. Оценить вероятность того, что размер втулки будет отличаться от номинала не более чем на 0,5 мм.

Решение:

По неравенству Чебышева

Неравенство Чебышева дает только верхнюю границувероятности данного отклонения. Выше этой границы вероятность не может бытьни при каком законе распределения. Например, если мы захотим выяснить, какова вероятность того, что случайная величинаXотклонится от своего математического ожидания не меньше, чем на 3 среднеквадратических отклонения, то неравенство Чебышева даст нам верхнюю границу этого значения 1/9@0,111. В то же время, например для нормального распределения вероятность такого отклонения намного меньше - 0,0027 (правило трех сигм).

Теорема Чебышева.

Если - попарно независимые случайные величины, причем их дисперсии ограничены (не превышают постоянного числа С), то, как бы мало ни было положительное числоe, вероятность выполнения неравенства

будет как угодно близка к единице при достаточно большом числе n. Иначе говоря

Таким образом, теорема Чебышева утверждает, что для достаточно большого числа независимых случайных величин, имеющих ограниченные дисперсии, почти достоверным можно считать событие, состоящее в том, что отклонение среднего арифметического случайных величин от среднего арифметического их математических ожиданий будет по абсолютной величине сколь угодно малым.

Доказательство. Введем в рассмотрение новую случайную величину – среднее арифметическое случайных величин

Найдем математическое ожидание . Пользуясь свойствами математического ожидания, получим

Применяя к величиненеравенство Чебышева, имеем

Или

(1)

Пользуясь свойствами дисперсии (постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат; дисперсия суммы независимых случайных величин равна сумме дисперсий слагаемых), получим

Так как по условию дисперсии всех случайных величин ограничены постоянным числом С, то

Таким образом

Подставляя правую часть последнего неравенства в (1) (отчего оно может быть только усилено), получим

Отсюда, переходя к пределу при и учитывая, что вероятность не может превосходить единицы, получим доказательство:

.

В важном частном случае, когда случайные величины имеют одно и то же математическое ожидание (обозначим его a) формула, выражающая теорему Чебышева, принимает вид

Сущность теоремы Чебышева такова: хотя отдельные независимые случайные величины могут принимать значения, далекие от своих математических ожиданий, среднее арифметическое достаточно большого числа случайных величин с большой вероятностью принимает значения, близкие к определенному

постоянному числу

или – в частном случае, к числу . Иными словами,отдельныеслучайные величины могут иметь значительный разброс, а ихсреднее арифметическоерассеяно мало. Объясняется это тем, что отклонения каждой из величин от своих математических ожиданий могут быть как положительными, так и отрицательными, а в среднем арифметическом они взаимнопогашаются.

Пусть производится процесс измерения некоторой величины. Будем рассматривать результаты каждого измерения как случайные величины . Если результат каждого измерения не зависит от результатов остальных (т.е. величины попарно независимы), а случайные величины имеют одинаковое математическое ожидание и их дисперсии ограничены, то, применяя теорему Чебышева, получим, что при достаточно большомnсреднее арифметическое результатов измерений сколь угодно мало отличается от истинного значения измеряемой величины (математического ожиданияa).

На теореме Чебышева основан широко применяемый в статистике выборочный метод, суть которого состоит в том, что по сравнительно небольшой случайной выборке судят о всей совокупности (генеральной совокупности) исследуемых объектов.

Центральная предельная теорема.

Причину чрезвычайно широкой распространенности случайных величин, описывающихся нормальным распределением, объясняет центральная предельная теорема, доказанная А.М. Ляпуновым.

Центральная предельная теорема: Если случайная величина X представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то X имеет распределение, близкое к нормальному распределению.

Пусть - последовательность независимых случайных величин, каждая из которых имеет конечные математическое ожидание и дисперсию

.

Введем обозначения для суммы случайных величин, суммы их математических ожиданий и суммы их дисперсий

.

Рассмотрим функцию , которая, как легко показать, имеет математическое ожидание и дисперсию, равные нулю и единице соответственно (нормированная сумма).

Действительно,

,

Обозначим функцию распределения нормированной суммы

.

Говорят, что к последовательности применима центральная предельная теорема, если при любомx функция распределения нормированной суммы при стремится к нормальной функции распределения:

В частности, если все случайные величины одинаково распределены, то к этой последовательности применима центральная предельная теорема, при условии, что дисперсии всех величин конечны и отличны от нуля. В частном случае, когда математические ожидания и дисперсии всеходинаковы (), в последнем равенстве нужно положить.

Центральная предельная теорема находит чрезвычайно широкое применение в математической статистике, в частности, при обосновании выбора закона распределения генеральной совокупности.

В заключение отметим, что использование теоремы Чебышева и центральной предельной теоремы позволяет не только осуществлять научные прогнозы в области случайных явлений, но и оценивать точность этих прогнозов.

Лекция 12. Выборочный метод анализа свойств генеральной

совокупности.

Предметом математической статистикиявляется изучение случайных событий и случайных величин по результатам наблюдений. Совокупность предметов или явлений, объединенных каким-либо общим признаком, называетсястатистической совокупностью. Результатом наблюдений над статистической совокупностью являютсястатистические данные – сведения о том, какие значения принял в итоге наблюдений интересующий нас признак (случайная величинаX).

Обработка статистических данных методами математической статистики приводит к установлению определенных закономерностей, присущих массовым явлениям. При этом точностьстатистических выводов повышается с ростом числа наблюдений.

Статистические данные, как правило, представляют собой ряд значений некоторой случайной величины. Обработка этого ряда значений представляет собой первый этап исследования случайной величины.

Первая задачаматематической статистики – указатьспособы сбора и группировки статистических данных, полученных в результате наблюдений или в результате специально поставленных экспериментов.

Второй задачейматематической статистики является разработкаметодов анализастатистических данных в зависимости от целей исследования. К этой задаче относятся:

    • Оценка неизвестной вероятности события; оценка неизвестнойфункции распределения; оценкапараметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких случайных величин и т.п.

    • Проверка статистических гипотез о виде неизвестногораспределения или овеличине параметров распределения, вид которого известен.

В современной математической статистике есть много общего с наукой о принятии решений в условиях неопределенности, так как она разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в процессе исследования (последовательный анализ) и решает многие другие аналогичные задачи.

Выборочный метод и его основные понятия. Случайная выборка, объем выборки.

Пусть требуется изучить совокупность однородныхобъектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, для партии деталей качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали.

В принципе, возможно проведение сплошного обследования, т.е. обследование всех объектов. На практике такое обследование применяется редко, например,

  • из–за большого числа объектов

  • из–за дороговизны проведения операции контроля,

  • из–за того, что контроль часто связан с разрушением объекта (проверка электролампы на долговечность ее работы), и т.д.

В таких случаях случайно отбирается и изучается ограниченноечисло объектов из совокупности.

Выборочной совокупностьюилислучайной выборкойназывают совокупность случайно отобранных объектов.

Генеральной совокупностьюназывают совокупность объектов, из которых производится выборка.

Объемомсовокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отбирается для обследования 100, то объем генеральной совокупностиN=1000, а объем выборкиn= 100.

Пример:Число единиц товараN, произведенного некоторым предприятием в течение года, есть генеральная совокупность. Для исследования качества продукции на практике рассматривается выборка, состоящая изnединиц товара. Признаком, или случайной величиной, может быть число единиц товара, удовлетворяющих сертификационным требованиям.

При составлении выборки можно поступать двумя способами: после того как объект отобран и исследован, его можно возвратить или не возвращать в генеральную совокупность. В связи с этим выборки подразделяются на повторныеибесповторные.

Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. Прибесповторнойвыборке отобранный объект в генеральную совокупность не возвращается.

Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Выборка должна правильно представлять пропорции генеральной совокупности, т.е. выборка должна быть репрезентативной (представительной). Пример– изучение общественного мнения.

В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.

Если объем выборки достаточно велик, а выборка составляет лишь незначительную часть совокупности, то различие между повторной и бесповторной выборкой стирается.