
- •Доверительный интервал для оценки ско σ нормального распределения. Распределение хи-квадрат.
- •Точечная и интервальная оценка вероятности биномиального распределения с заданной надежностью γ по относительной частоте.
- •Метод моментов для точечной оценки параметров распределения.
- •Метод наибольшего правдоподобия для дискретных и непрерывных случайных величин. Распределение Пуассона. Биномиальное распределение. Показательный закон. Нормальный закон.
- •Числовые характеристики вариационного ряда. Характеристики положения и характеристики рассеивания. Мода, Медиана. Размах варьирования. Коэффициент вариации. Асимметрия. Эксцесс.
- •14. Статистические моменты. Обычные, начальные и центральные эмрирические моменты. Условные эмпирические моменты. Нахождение центральных моментов по условным.
- •15. Метод произведений для вычисления выборочных средней и дисперсии. Сведение первоначальных вариант к равноотстоящим.
- •16. Эмпирические и выравнивающие частоты для дискретных и непрерывных распределений. Примеры.
- •17. Построение нормальной кривой по опытным данным. Оценка отклонения эмпирического распределения от нормального. Асимметрия. Эксцесс.
- •18. Построение статистической функцией распределения. Гистограмма.Назовите числовые характеристики статистического распределения. Дайте определение этих характеристик.
- •Точечная оценка параметра. Свойство точечной оценки. Состоятельная, несмещенная, эффективная оценка. Исправленная дисперсия.
- •Доверительный интервал и доверительная вероятность (надежность). Построение доверительного интервала для математического ожидания случайной величины, распределенной по нормальному закону.
- •§14. Точность оценки, доверительная вероятность (надежность). Доверительный интервал
- •§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
- •Понятие функциональной, статистической и корреляционной зависимости.
- •§ 2. Условные средние
- •§ 3. Выборочные уравнения регрессии
- •Сущность метода наибольшего правдоподобия для нахождения оценок параметров распределений.
- •Сущность метода наименьших квадратов при обработке результатов наблюдений.
- •Формулировка задачи статистической проверки гипотез. Приведите примеры задач на проверку гипотез. Вероятностные данные для применения метода минимума риска к решению задачи проверки гипотез.
- •3.1. Классический метод проверки гипотез
- •Сущность метода минимума риска при решении задачи проверки гипотез. Сформулируйте оптимальное решающее правило. Ошибки первого и второго рода. Сущность метода
- •§ 2. Ошибки первого и второго рода
- •28. Сравнение двух дисперсий нормальных генеральных совокупностей. Распределение Фишера-Снедекора.
- •29. Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсей нормальной совокупности. Критерий Стьюдента.
- •Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны. Выборки независимы. Функция Лапласа.
- •Сравнение двух вероятностей биномиальных распределений.
- •34. Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам одинакового объема. Критерий Кочрена.
- •35. Определение параметров выборочного уравнения прямой линии среднеквадратичной регрессии по несгрупированным и сгруппированным данным.
- •36. Выборочный коэффициент корреляции. Методика вычисления выборочного коэффициента корреляции. Выборочное корреляционное отношение и его свойство. Мера корреляционной связи.
- •42. Корреляционный анализ. Коррелированность и зависимость случайных величин. Численные характеристики системы двух случайных величин: корреляционный момент и коэффициент корреляции.
- •43. Регрессионный анализ. Линейная регрессия. Прямые линии среднеквадратической зависимости. Коэффициенты регрессии y на X и X на y.
- •[Править]Парная и множественная регрессия
- •Случайные числа. Генератор псевдослучайных чисел. Метод Монте-Карло. Применение метода Монте-Карло для вычисления определенного интеграла.
- •Случайные процессы. Процесс Пуассона и его свойства: стационарность, отсутствие последействия и ординарность.
- •48. Цепь Маркова. Переходная вероятность. Однородная цепь Маркова.Матрица перехода. Равенство Маркова.
- •Определение
- •[Править]Переходная матрица и однородные цепи
- •[Править]Конечномерные распределения и матрица перехода за n шагов
Метод моментов для точечной оценки параметров распределения.
Можно доказать, что начальные и центральные эмпирические моменты являются состоятельными оценками соответственно начальных и центральных теоретических моментов того же порядка. На этом основан метод моментов, предложенный К. Пирсоном. Достоинство метода — сравнительная его простота. Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов рассматриваемого распределения соответствующим эмпирическим моментам того же порядка.
А. Оценка одного параметра. Пусть задан вид плотности распределения f (х, θ), определяемой одним неизвестным параметром θ. Требуется найти точечную оценку параметра θ.
Для оценки одного параметра достаточно иметь одно уравнение относительно этого параметра. Следуя методу моментов, приравняем, например, начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка: v1 = M1. Учитывая,
что
v1
= М (X),
M1
=
в
(см. гл. XVII,
§ 2), получим
М (X) = в. (*)
Математическое ожидание М (X), как видно из соотношения
есть функция от θ, поэтому (*) можно рассматривать как уравнение с одним неизвестным θ. Решив это уравнение относительно параметра θ, тем самым найдем его точечную оценку θ*, которая является функцией от выборочной средней, следовательно, и от вариант выборки:
θ* =ψ (x1,x2,…xn).
Б. Оценка двух параметров. Пусть задан вид плотности распределения f (х;θ1,θ2), определяемой неизвестными параметрами θ1,θ2. Для отыскания двух параметров необходимы два уравнения относительно этих параметров. Следуя методу моментов, приравняем, например, начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка и центральный теоретический момент второго порядка центральному эмпирическому моменту второго порядка:
v1 = M, μ2 = m2.
Учитывая, что v1 = М (X), μ2 = D (X), М1 = в, m2 = Dв , получим
(**)
Математическое ожидание и дисперсия есть функции от θ1,θ2, поэтому (**) можно рассматривать как систему двух уравнений с двумя неизвестными θ1,θ2. Решив эту систему относительно неизвестных параметров, тем самым получим их точечные оценки θ*1,θ*2. Эти оценки являются функциями от вариант выборки:
θ*1 = ψ (x1,x2,…xn),
θ*2 = ψ (x1,x2,…xn).
Метод наибольшего правдоподобия для дискретных и непрерывных случайных величин. Распределение Пуассона. Биномиальное распределение. Показательный закон. Нормальный закон.
Метод наибольшего правдоподобия для дискретных и непрерывных случайных величин.
Кроме метода моментов, существуют и другие методы точечной оценки неизвестных параметров распределения. К ним относится метод наибольшего правдоподобия, предложенный Р. Фишером.
А. Дискретные случайные величины. Пусть X —дискретная случайная величина, которая в результате n испытаний приняла значения х1, х2...... хn. Допустим, что вид закона распределения величины X задан, но неизвестен параметр θ, которым определяется этот закон. Требуется найти его точечную оценку.
Обозначим вероятность того, что в результате испытания величина X примет значение xi(i= 1, 2, ..., n), через P(xi, θ).
Функцией правдоподобия дискретной случайной величины X называют функцию аргумента θ:
L, (х1, х2...... хn ;θ) = p (х1, θ) p (х2, θ)…. p (хn, θ),
где х1, х2...... хn —фиксированные числа.
В качестве точечной оценки параметра в принимают такое его значение θ* = θ*( х1, х2...... хn), при котором функция правдоподобия достигает максимума. Оценку θ* называют оценкой наибольшего правдоподобия.
Функции L и ln L достигают максимума при одном и том же значении θ, поэтому вместо отыскания максимума функции L ищут (что удобнее) максимум функции lnL.
Логарифмической функцией правдоподобия называют функцию lnL. Как известно, точку максимума функции ln L аргумента θ можно искать, например, так:
1) найти
производную
;
2) приравнять производную нулю и найти критическую точку—корень полученного уравнения (его называют уравнением правдоподобия);
3) найти
вторую производную
;
если вторая
производная при θ — θ* отрицательна, то θ*—точка максимума.
Найденную точку максимума θ* принимают в качестве оценки наибольшего правдоподобия параметра θ.
Метод наибольшего правдоподобия имеет ряд достоинств: оценки наибольшего правдоподобия, вообще говоря, состоятельны (но они могут быть смещенными), распределены асимптотически нормально (при больших значениях п приближенно нормальны) и имеют наименьшую дисперсию по сравнению с другими асимптотически нормальными оценками; если для оцениваемого параметра 6 существует эффективная оценка 0*, то уравнение правдоподобия имеет единственное решение 0*; этот метод наиболее полно использует данные выборки об оцениваемом параметре, поэтому он особенно полезен в случае малых выборок.
Недостаток метода состоит в том, что он часто требует сложных вычислений.
Р-е Пуассона
Пусть производится
п независимых
испытаний, в каждом из которых вероятность
появления события А
равна р.
Для определения
вероятности k
появлений
события в этих испытаниях используют
формулу Бернулли. Если же п
велико, то
пользуются асимптотической формулой
Лапласа. Однако эта формула непригодна,
если вероятность события мала (р
0,1).
В этих случаях
(п
велико, р
мало) прибегают
к асимптотической формуле Пуассона.
Итак, поставим
перед собой задачу найти вероятность
того,
что при очень
большом числе испытаний, в каждом из
которых вероятность события очень мала,
событие наступит ровно k
раз. Сделаем
важное допущение: произведение пр
сохраняет
постоянное значение, а именно пр
=
.
Как будет
следовать из дальнейшего (см. гл. VII,
§ 5), это означает, что среднее число
появлений события в различных сериях
испытаний, т. е. при различных значениях
п, остается
неизменным.
Воспользуемся формулой Бернулли для вычисления интересующей нас вероятности:
Pn(k)=
Так как рп = , то р= /п. Следовательно,
Pn(k)=
Приняв во внимание,
что п имеет
очень большое значение, вместо Рn
(к)
найдем
Pn
(k).
При этом
будет найдено лишь приближенное значение
отыскиваемой вероятности: п
хотя и велико,
но конечно, а при отыскании предела мы
устремим п
к бесконечности.
Заметим, что поскольку произведение пр
сохраняет
постоянное значение, то при п
вероятность р
.
Итак,
Таким образом (для простоты записи знак приближенного равенства опущен),
Pn(k)=
Эта формула выражает закон распределения Пуассона вероятностей массовых (п велико) и редких (р мало) событий.
Замечание. Имеются специальные таблицы, пользуясь которыми можно найти Pn(k), зная k и .
Биномиальное р-е
Пусть производится п независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность наступления события во всех испытаниях постоянна и равна р (следовательно, вероятность непоявления q=1—р). Рассмотрим в качестве дискретной случайной величины X число появлений события А в этих испытаниях.
Поставим перед собой задачу: найти закон распределения величины X. Для ее решения требуется определить возможные значения X и их вероятности. Очевидно, событие А в п испытаниях может либо не появиться, либо появиться 1 раз, либо 2 раза, ..., либо п раз. Таким образом, возможные значения X таковы: х1 = 0, x2=1, х3= 2, ..., хп+1 = п. Остается найти вероятности этих возможных значений, для чего достаточно воспользоваться формулой Бернулли:
Pn(k)=
(*)
где k = 0, 1, 2, .... п.
Формула (*) и является аналитическим выражением искомого закона распределения.
Биномиальным называют распределение вероятностей, определяемое формулой Бернулли. Закон назван «биномиальным» потому, что правую часть равенства (*) можно рассматривать как общий член разложения бинома Ньютона:
(p
+ q)n
=
pn
+
pn-1q
+… +
pkqn-k+…+
qn
Таким образом, первый член разложения рп определяет вероятность наступления рассматриваемого события п раз в п независимых испытаниях; второй член npn-1q определяет вероятность наступления события п—1 раз; . . .; последний член qn определяет вероятность того, что событие не появится ни разу.
Напишем биномиальный закон в виде таблицы:
X |
N |
n-1 |
… |
k |
… |
0 |
P |
pn |
npn-1q |
… |
|
… |
qn |
Показательный закон.
Показательным (экспоненциальным) называют распределение вероятностей непрерывной случайной величины Х1 которое описывается плотностью
где — постоянная положительная величина.
Мы видим, что показательное распределение определяется одним параметром . Эта особенность показательного распределения указывает на его преимущество по сравнению с распределениями, зависящими от большею числа параметров. Обычно параметры неизвестны и приходится находить их оценки (приближенные значения); разумеется, проще оценить один параметр, чем два или три и т. д. Примером непрерывной случайной величины, распределенной по показательному закону, может служить время между появлениями двух последовательных событий простейшего потока (см. § 5).
Найдем функцию распределения показательного закона (см. гл. XI, § 3):
Итак,
Мы определили показательный закон с помощью плотности распределения; ясно, что его можно определить, используя функцию распределения.
Графики плотности и функции распределения показательного закона изображены на рис. 12.
Нормальный закон.
Нормальным называют распределение вероятностей непрерывной случайной величины, которое описывается плотностью
Мы видим, что нормальное распределение определяется двумя параметрами: а и . Достаточно знать эти параметры, чтобы задать нормальное распределение. Покажем, что вероятностный смысл этих параметров таков: а есть математическое ожидание, —среднее квадратическое отклонение нормального распределения.
а) По определению математического ожидания непрерывной случайной величины,
M(X)=
Введем новую переменную z = (x—а)/. Отсюда x=z+a, dx=dz. Приняв во внимание, что новые пределы интегрирования равны старым, получим
M(X)=
Первое из слагаемых
равно нулю (под знаком интеграла нечетная
функция; пределы интегрирования
симметричны относительно начала
координат). Второе из слагаемых равно
a
( интеграл Пуассона
).
Итак, М(Х) = а, т. е. математическое ожидание нормального распределения равно параметру а.
б) По определению дисперсии непрерывной случайной величины, учитывая, что М(Х) = а, имеем
D(X)=
Введем новую переменную z = (x—а)/. Отсюда х—a = z, dx = dz. Приняв во внимание, что новые пределы интегрирования равны старым, получим
D(X)=
Интегрируя по
частям, положив u
= z,
dv=
,
найдем
D(X)=
Следовательно,
(X)=
.
Итак, среднее квадратическое отклонение нормального распределения равно параметру .