Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры по твимс.docx
Скачиваний:
10
Добавлен:
25.04.2019
Размер:
1.09 Mб
Скачать

26. Вероятность попадания в заданный интервал и вероятность заданного отклонения нормальной случайной величины. Правило 3-х сигм. Коэффициент асимметрии. Эксцесс.

Уже известно, что если случайная величина X задана плотностью распределения f (х), то вероятность того, что X примет значение, принадлежащее интервалу такова:

Пусть случайная величина X распределена по нормальному закону. Тогда вероятность того, что X примет значение, принадлежащее интервалу равна

Преобразуем эту формулу Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии Wi/h. Площадь i-го частичного прямоугольника равна hWi/h=Wi — относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т. е. единице.

так, чтобы можно было пользоваться готовыми таблицами. Введем новую переменную Отсюда Найдем новые пределы интегрирования. Если , если Таким образом, имем

Пользуясь функцией Лапласа окончательно получим (*)

Пример. Случайная величина X распределена по нормальному закону. Математическое ожидание и среднее квадратическое отклонение этой величины соответственно равны 30 и 10. Найти вероятность того, что X примет значение, принадлежащее интервалу (10, 50).

Решение. Воспользуемся формулой (*). По условию, следовательно,

По таблице приложения 2 находим Ф (2) = 0,4772. Отсюда, искомая вероятность Р(10 < X < 50) = 2-0,4772 = 0,9544.

Вычисление вероятности заданного отклонения

Ч асто требуется вычислить вероятность того, что отклонение нормально распределенной случайной величины X по абсолютной величине меньше заданного положительного числа δ, т. е. требуется найти вероятность осуществления неравенства׀X-a׀ <δ. Заменим это неравенство равносильным ему двойным неравенством -δ<׀X-a׀<δ или a-δ <X<a+δ Пользуясь формулой (*), получим

Приняв во внимание равенство (функция Лапласа - нечетная), окончательно имеем В частности, при а = 0

На рис. 9 наглядно показано, что если две случайные величины нормально распределены и а = 0, то вероятность принять значение, принадлежащее интервалу больше у той величины, которая имеет меньшее значение а. Этот факт полностью соответствует вероятностному смыслу параметра есть среднее квадратическое отклонение; оно характеризует рассеяние случайной величины вокруг ее математического ожидания).

Замечание. Очевидно, события, состоящие в осуществлении неравенств δ ,—противоположные. Поэтому, если вероятность осуществления неравенства равна р, то вероятность неравенства равна 1—р.

Пример. Случайная величина X распределена нормально. Математическое ожидание и среднее квадратическое отклонение X соответственно равны 20 и 10. Найти вероятность того, что отклонение по абсолютной величине будет меньше трех. Решение. Воспользуемся формулой

По условию, а = 20, Следовательно, 2Ф (3/10) =2Ф (0,3). По таблице приложения 2 находим Ф (0,3) = 0,1179. . Искомая вероятность Р (|Х-20|<3)=0,2358.

Правило трех сигм

Преобразуем формулу положив . В итоге получим Если t = 3 и, следовательно, , то 2Ф (3) = 2 • 0,49865 = 0,9973, т. е. вероятность того, что отклонение по абсолютной величине будет меньше утроенного среднего квадратического отклонения, равна 0,9973. Другими словами, вероятность того, что абсолютная величина отклонения превысит утроенное среднее квадратическое отклонение, очень мала, а именно равна 0,0027. Это означает, что лишь в 0,27% случаев так может произойти. Такие события исходя из принципа невозможности маловероятных событий можно считать практически невозможными. В этом и состоит сущность правила трех сигм: если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения. На практике правило трех сигм применяют так: если распределение изучаемой случайной величины неизвестно, но условие, указанное в приведенном правиле, выполняется, то есть основание предполагать, что изучаемая величина распределена нормально; в противном случае она не распределена нормально.

Оценка отклонения теоретического распределения от нормального. Асимметрия и эксцесс

Эмпирическим называют распределение относительных частот. Эмпирические распределения изучает математическая статистика.

Теоретическим называют распределение вероятностей. Теоретические распределения изучает теория вероятностей. В этом параграфе рассматр-ся теоретические распределения. При изучении распределений, отличных от нормального, возникает необх-сть колич-но оценить это различие. С этой целью вводят специальные характеристики, в частности асимметрию и эксцесс. Для нормального распределения эти характеристики равны нулю. Поэтому если для изучаемого распределения асимметрия и эксцесс имеют небольшие значения, то можно предположить близость этого распределения к нормальному. Наоборот, большие знач-я асим-ии и эксцесса указывают на значительное отклонение от нормального.

Как оценить асимметрию? Можно доказать, что для симметричного распределения (график такого распределения симметричен относительно прямой х = М (X)) каждый центральный момент нечетного порядка равен нулю. Для несимметричных распределений центральные моменты нечетного порядка отличны от нуля. Поэтому любой из этих моментов (кроме момента первого порядка, который равен нулю для любого распределения) может служить для оценки асимметрии; естественно выбрать простейший из них, т. е. момент третьего порядка . Однако принять этот момент для оценки асимметрии неудобно потому, что его величина зависит от единиц, в которых измеряется случайная величина. Чтобы устранить этот недостаток, делят на и таким образом получают безразмерную характеристику.

Асимметрией теоретического распределения называют отношение центрального момента третьего порядка к кубу среднего квадратического отклонения: Асимметрия положительна, если «длинная часть» кривой распределения расположена справа от математического ожидания ; асимметрия отрицательна, если «длинная часть» кривой расположена слева от математического ожидания . Практически ожидания и дисперсии.

27. Понятие о теореме Ляпунова. Формулировка центральной предельной теоремы. Известно, что нормально распределенные случайные величины широко распространены на практике. Чем это объясняется? Ответ на этот вопрос был дан выдающимся рус.мат-м А. М. Ляпуновым (центральная предельная теорема): если случайная величина X представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние, каждой из которых на всю сумму ничтожно мало, то X имеет распределение, близкое к нормальному.Пр. Пусть производится измерение некоторой физической величины. Любое измерение дает лишь приближенное значение измеряемой величины,т.к.на результат измерения влияют очень многие независимые случайные факторы (температура, колебания прибора, влажность и др.). Каждый из этих факторов порождает ничтожную «частную ошибку». Однако, поскольку число этих факторов очень велико, их совокупное действие порождает уже заметную «суммарную ошибку». Рассматривая суммарную ошибку как сумму очень большого ч-а взаимно незав-х частных ошибок, мы вправе заключить, что суммарная ошибка имеет распределение, близкое к нормальному. Опыт подтверждает справедливость такого заключения. Приведем формулировку центральной предельной теоремы, к-я устанавливает условия, при которых сумма большого числа независимых слагаемых имеет распределение, близкое к нормальному.Пусть Х1,Х2,...,Хп,... — последовательность независимых случайных величин, каждая из к-х имеет конечные математическое ожидание и дисперсию: Введем обозначения: Обозначим ф-ю распределения нормированной суммы ч/з Говорят, что к послед-ти Х1,Х2,... приме¬нима центральная предельная теорема, если при любом x ф-я распределения нормированной суммы при п —>∞ стремится к нормальной функции распределения:В частности, если все случайные величины Х1 Х2,... одинаково распределены, то к этой последовательности применима центральная предельная теорема, если дисперсии всех величин Xi(i==1,2, ...) конечны и отличны от нуля. А. М. Ляпунов д-л, что если для при п —>∞ отношение Ляпунова где стремится к нулю (условие Ляпунова), то к послед-ти Х1 Х2,... применима центр-я предельная теорема. Сущность условия Ляпунова состоит в требовании, чтобы каждое слагаемое суммы (Sn — Ап)/Вп оказывало на сумму ничтожное влияние. Замечание. Д/док-ва центральной предельной теоремы А.М.Ляпунов использовал аппарат характеристических ф-й. Характер-ой ф-й случайной величины X наз-т ф-ию Д/дискретной случайной величины X с возможными значениями и их вероятностями характер-я ф-я. Д/непрерывной случайной величины X с плотностью распределения f(х) характер-я ф-я.М/о док-ть, что характер-я ф-я суммы независимых СВ = произведению характер-х ф-й слагаемых.

28. Функция одного случайного аргумента. Если каждому возможному значению случайной величины X соответствует одно возможное значение случайной величины Y, то Y называют функцией случайного аргумента X и записывают Y= (X). Если X-дискретная случайная величина и функция Y= (X) монотонна, то различным значениям X соответствуют различные значения Y, причем вероятности соответствующих значений X и Y одинаковы. Возможные значения Yнаходят из равенства , где -возможные значения X, вероятности возможных значений Y находят из равенства . Если же Y= (X)-немонотонная функция, то разным значения X могут соответствовать одинаковые значения Y. В этом случае для отыскания вероятностей возможных значений Y следует сложить вероятности тех возможных значений X, при которых Y принимает одинаковые значения. Другими словами, вероятность повторяющегося значения Y равна сумме вероятностей тех возможных значений X, при которых Y принимает одно и то же значение.

Если X-непрерывная случайная величина, заданная плотностью распределения f(x), и если -дифференцируемая строго возрастающая или строго убывающая функция, обратная функция которой , то плотность распределения g(y) случайной величины Y находят из равенства . Если функция в интервале возможных значений X не монотонна, то следует разбить этот интервал на такие интервалы, в которых функция монотонна, и найти плотности распределения для каждого из интервалов монотонности, а затем представить g(y) в виде суммы

.

Функция двух случайных аргументов. Если каждой паре возможных значений случайных величин X и Y соответствует одно возможное значение случайной величины Z, то Z называют функцией двух случайных аргументов X и Y и пишут .

Если X и Y-дискретные независимые случайные величины, то, для того чтобы найти распределение функции Z=X+Y, надо найти все возможные значения Z, для чего достаточно сложить каждое возможное значение Xсо всеми возможными значениями Y; вероятности найденных возможных значений Z равны произведениям вероятностей складываемых значений X и Y.

Если X и Y-непрерывные независимые случайные величины, то плотность распределения g(z) суммы Z=X+Y (при условии, что плотность распределения хотя бы одного из аргументов задана в интервале одной формулой) может найдена по формуле

Либо по равносильной формуле

где и -плотности распределения аргументов; если возможные значения аргументов неотрицательны, то плотность распределения g(z) величины Z=X+Y находят по формуле

либо по равносильной формуле

В том случае, когда обе плотности и заданы на конечных интервалах, для отыскания плотности g(x)

величины Z=X+Y целесообразно сначала найти функцию распределения G(z), а затем продифференцировать ее по z:

.

Если X и Y-независимые случайные величины, заданные соответствующими плотностями распределения и , то вероятность попадания случайной точки (X,Y) в область D равна двойному интегралу по этой области от произведения плотностей распределения :

29. Распределение «хи квадрат». Распределение Стьюдента. Распределение F Фишера ‑ Снедекора Пусть Xi (i = 1, 2, ..., n) ‑ нормальные независимые СВ, причем МО каждой из них равно нулю, а среднее квадратическое отклонение ‑ единице. Тогда сумма квадратов этих величин распределена по закону “хи квадрат” с k = n степенями свободы; если же эти величины связаны одним линейным соотношением, например тo число степеней свободы k = n - 1. Плотность этого распределения

Где - гамма-функция; в частности, . Отсюда видно, что распределение «хи квадрат» определяется одним параметром - числом степеней свободы k. С увеличением числа степеней свободы распределение медленно приближается к нормальному. Распределение Стьюдента Пусть Z—нормальная случайная величина, причем M(Z) = 0, σ(Z) = l, а V ‑ независимая от Z величина, которая распределена по закону χ2 с k степенями свободы.

Тогда величина

имеет распределение, к-е наз-т t-распределением или распределением Стьюдента (псевдоним английского статистика В. Госсета), с k степенями свободы. Итак, отношение нормированной нормальной величины к квадратному корню из независимой случайной величины, распределенной по закону «хи квадрат» с k степенями свободы, деленной на k, распределено по закону Стьюдента с k степенями свободы. С возрастанием числа степеней свободы распределение Стьюдента быстро приближается к нормальному. Распределение F Фишера ‑ Снедекора Если U и V—независимые СВ, распределенные по закону χ2 со степенями свободы k1 и k2, то величина имеет распределение, которое называют распределением F Фишера ‑ Снедекора со степенями свободы k1 и k2 (иногда его обозначают через V2). Плотность этого распределения

где .

Мы видим, что распределение F определяется двумя параметрами ‑ числами степеней свободы.