Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
teoria_veroyatnosti.docx
Скачиваний:
1
Добавлен:
10.09.2019
Размер:
350.57 Кб
Скачать

32Точечные оценки параметров распределения.

Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки, полученные в результате n наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр. Рассматривая значения количественного признака как независимые случайные величины, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения - это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра. Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям: оценка должна быть несмещенной, эффективной и состоятельной.

Поясним каждое из понятий.   Несмещенной называют статистическую оценку Q*, математическое ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т. е.

M(Q*) = Q. Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.   Эффективной называют статистическую оценку, которая (при заданном объеме выборки п) имеет наименьшую  возможную дисперсию. При рассмотрении выборок большого объема (n велико!) к статистическим оценкам предъявляется требование состоятельности.   Состоятельной называют статистическую оценку, которая при п стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при п  стремится к нулю, то такая оценка оказывается и состоятельной. Рассмотрим точечные оценки параметров распределения, т.е. оценки, которые определяются одним числом Q* =f( x1, x2,…,xn), где x1, x2,…,xn- выборка.

32. Выборочные числовые характеристики распределения: Среднее квадратичное отклонение — это статистическая величина, описывающая разброс значений изучаемой величины вокруг ее ожидаемого значения. Чтобы рассчитать среднее квадратичное отклонение, необходимо рассчитать дисперсию (величину разброса результатов); затем извлечь из этого числа квадратный корень (с1/2).Расчет дисперсии проводится следующим образом:Шаг 1: Сначала вычисляем отклонение каждого потенциального результата от ожидаемого (xt — х). Тогда в случае проекта 3 первый результат равен (-16) (это наш  х.), а ожидаемый результат (х) равен 26. Вычитая второе значение из первого, получаем (-42).Шаг 2: Возводим в квадрат результат, полученный на шаге 1, для каждого из результатов (х. — х)2. Итак, для первого результата проекта 3 берем (-42) и возводим в квадрат: (-42)2 = 1 764.Шаг 3: Умножаем число, полученное в результате шага 2, на вероятность получения результата. В случае первого результата проекта 3 мы умножаем 1 764 на 0,25 = 441. То есть (xt — xj2prШаг 4: Наконец, складываем вместе результаты всех этих расчетов по отдельному проекту. Так, для проекта 3 складываем (441 + 50 + 121). Получаем дисперсию с = 612.Заметьте, что дисперсия — это очень большое число по сравнению с первоначальным возможным результатом: для проекта 3 были результаты (-16), 36 × 48, между тем как дисперсия больше 600; это потому, что дисперсия измеряется в фунтах в квадрате, или ЧПС (NPV) в квадрате и т.д. Следующий шаг — получить среднее квадратичное отклонение (о) путем извлечения квадратного корня из значения дисперсии. Таким образом, вычисляется отклонение от ожидаемого значения непосредственно в фунтах или в единицах прибыли. Среднее квадратичное отклонение дает общий критерий для сравнения дисперсии возможных результатов для множества проектов. Таким образом, среднее отклонение для проекта 3 равно (600)1/2 = 24,49.Выборочная средняя. Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n. Выборочной средней называют среднее арифметическое значение признака выборочной совокупности. Если все значения признака выборки различны, то если же все значения имеют частоты n1, n2,…,nk, то

Выборочная средняя является несмещенной и состоятельной  оценкой генеральной средней.

Замечание: Если выборка представлена интервальным вариационным рядом, то за xi принимают середины частичных интервалов. ДисперсияПонятие дисперсии обобщается на многомерные случайные величины нетривиальным образом. Это обобщение будет сделано в следующем разделе. Здесь лишь приведем формулы для вычисления дисперсии компонент двумерного случайного вектора.

Если ( ,  ) - двумерная случайная величина, то D = M( - M )2 = M2 - M( )2, D = M( - M )2 = M2 - M( )2.Входящие в эту формулу математические ожидания вычисляются по приведенным выше формулам.

33. Точечные оценки числовых характеристик. Основные определения. Метод моментов. Статистической оценкой :| * неизвестного параметра :| теоретического распределения называют функцию f(X1,X2,...,Xn) от наблюдаемых С.В. X1,X2,...,Xn. Точечной называют статистическую оценку, которая определяется одним числом :| *=f(x1,x2,...,xn), где х1,х2,...,xn - результаты n наблюдений над количественным признаком Х (выборка). Несмещенной называют точечную оценку, мат. ожидание которой равно оцениваемому параметру при любом объеме выборки. Смещенной называют точечную оценку, мат. ожидание которой не равно оцениваемому параметру. Несмещенной оценкой генеральной средней (мат. ожидания) служит выборочная средняя: Хв=(сумма по i от 1 до k nixi)/n, где xi - варианта выборки, ni - частота варианты xi, n=сумма по i от 1 до k ni - объем выборки. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия: Dв=(сумма по i от 1 до k ni(Хi-Xв)*2)/n. Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия: s*2=n/n-1*Dв=сумма ni(xj - Xв)*2/n-1. Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов соответствующим эмпирическим моментам того же порядка. Если распределение определяется одним параметром, то для его отыскания приравнивают один теоретический момент одному эмпирическому моменту того же порядка. Например, можно приравнять начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка: v1=M1. Учитывая, что v1=M(X) и М1=Хв, получим М(Х)=Хв. Если распределение определяется двумя параметрами, то приравнивают два теоретических момента двум соответствующим эмпирическим моментам того же порядка. Учитывая, что v1=M(X),M1=Хв,мю=D(X),m2=Dв, имеем систему: М(Х)=Хв, D(X)=Dв.

34.Интервальные оценки параметров распределения. Интервальной называют оценку, которая определяется двумя числами—концами интервала. Интервальные оценки позволяют установить точность и надежность оценок . Пусть найденная по данным выборки статистическая характеристика Q* служит оценкой неизвестного пара­метра Q. Будем считать Q постоянным числом (Q может быть и случайной величиной). Ясно, что Q* тем точнее определяет параметр Q, чем меньше абсолютная величина разности |Q- Q*|. Другими словами, если >0 и |Q- Q*| < , то чем меньше  , тем оценка точнее. Таким образом, положительное число  характеризует точность оценки. Однако статистические методы не позволяют категорически утверждать, что оценка Q* удовлетворяет неравенству |Q- Q*| <; можно лишь говорить о вероятности , с которой это неравенство осуществляется. Надежностью (доверительной вероятностью) оценки называют вероятность  , с которой осуществляется неравенство |Q—Q* | < . Обычно надежность оценки задается наперед, причем в качестве  берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999. Пусть вероятность того, что, |Q- Q*| < равна :

P(|Q- Q*| <)= . Заменив неравенство равносильным ему двойным неравенством получим:

Р [Q* —< Q < Q* +] =  Это соотношение следует понимать так: вероятность того, что интервал Q* - < Q < Q* + заключает в себе (покрывает) неизвестный параметр Q, равна . Интервал (Q* -  Q* +) называется доверительным интервалом , который покрывает неизвестный параметр с надежностью .

2.2. Интервальная оценка вероятности биноминального распределения по относительной частоте.

Найдем доверительный интервал для оценки вероятности по относительной частоте, используя формулу:

  Если n достаточно велико и р не очень близка к нулю и единице, то можно считать, что относительная частота распределена приближенно по нормальному закону, причем М(W)= р. Заменив Х на относительную частоту , математическое ожидание - на вероятность, получим равенство:

Приступим к построению доверительного интервала (р1, р2), который с надежностью   покрывает оцениваемый параметр р Потребуем, чтобы с надежностью g выполнялось соотношение указанное выше равенство:

Заменив

, получим: Таким образом, с надежностью  выполняется неравенство (чтобы получить рабочую формулу, случайную величину W заменим неслучайной наблюдаемой относительной частотой w и подставим 1- р вместо q):

Учитывая, что вероятность р неизвестна, решим это неравенство относительно р. Допустим, что w > р. Тогда

  Обе части неравенства положительны; возведя их в квадрат, получим равносильное квадратное неравенство относительно р:

Дискриминант трехчлена положительный, поэтому корни действительные и различные:

меньший корень

больший корень:

   Замечание1: При больших значениях n , пренебрегая слагаемыми ,и учитывая

получим приближенные формулы для границ доверительного интервала :

  

2.1.1. Доверительный интервал для оценки математического ожидания при известном .

Пусть количественный признак генеральной совокупности распределен нормально. Известно среднее квадратическое отклонение  этого распределения -. Требуется оценить математическое ожидание а по выборочной средней. Найдем доверительный интервал, покрывающий а с надежностью . Выборочную среднюю будем рассматривать как случайную величину ( она изменяется от выборки  к выборке), выборочные значения признака- как одинаково распределенные независимые СВ с математическим ожиданием каждой а и средним квадратическим отклонением . Примем без доказательства, что если величина Х распределена нормально, то и выборочная средняя тоже распределена нормально с параметрами .Потребуем, чтобы выполнялось равенство

  Заменив Х и , получим 

получим

Задача решена.  Число t находят по таблице функции Лапласа Ф(х).

Пример1. СВХ распределена нормально и  =3. Найти доверительный интервал для оценки математического ожидания по выборочным средним, если n = 36 и задана надежность  =0,95.

Из соотношения 2Ф(t)= 0,95 , откуда Ф(t) = 0,475 по таблице  найдем t : t =1,96. Точность оценки

Доверительный интервал

  . Пример2. Найти минимальный объем выборки, который обеспечивает заданную точность  =0,3 и надежность  = 0,975, если СВХ распределена нормально и  =1,2.

                                            Из равенства  

                                           выразим n: , подставим значения и получим минимльный объем выборки  n ~ 81.2.1.2. Доверительный интервал для оценки математического ожидания при неизвестном .

Т.к. мы не знакомы с законами распределения СВ, которые используются при выводе формулы, то примем ее без доказательства. В качестве неизвестного параметра используют исправленную дисперсию s2 . Заменяя  на s, t на величину t. Значение  этой величины зависит от надежности  и объема выборки n  и определяется  по " Таблице значений t."  Итак :

и доверительный интервал имеет вид Пример1. Найти доверительный интервал для оценки математического ожидания с надежностью 0,95, если объем выборки n =16, среднее выборочное и исправленная дисперсия соответственно равны 20,2 и 0,8. По таблице приложения найдем tпо заданной надежности  =0,95 и n= 16: t =2,13. Подставим в формулу s =0,8 и t =2,13 , вычислим границы доверительного интевала: ,

откуда получим доверительный интервал (19,774; 20,626) Смысл полученного результата: если взять 100 различных выборок, то в 95 из них математическое ожидание будет находится в пределах данного интервала, а в 5 из них- нет. Пример2. Измеряют диаметры 25 корпусов электродвигателей. Получены выборочные характеристики   

Необходимо найти вероятность (надежность) того, что

- является доверительным интервалом оценки математического ожидания при нормальном распределении.

Из условия задачи найдем точность , составив и решив систему:

                 Откуда  =10.          Из равенства   

                                                         выразим   , откуда t =3,125. По таблице для найденного t  и n= 25 находим  =0,99.Доверительный интервал для оценки дисперсии и среднего квадратического отклонения.Требуется оценить неизвестную генеральную дисперсию и генеральное среднее квадратическое отклонение по исправленной дисперсии, т.е. найти доверительные интервалы, покрывающие параметры D и  с заданной надежностью . Потребуем выполнения соотношения

. Раскроем модуль и получим двойное неравенство:

. Преобразуем:

.Обозначим s = q (величина q находится по  "Таблице значений q"и зависит от надежности и объема выборки), тогда доверительный интервал для оценки генерального среднего квадратического отклонения имеет вид: .

Замечание : Так как  >0, то если q >1 , левая граница интервала равна 0:                    0<  < s ( 1 + q ).

Пример1.  По выборке объема n = 25 найдено "исправленное" среднее квадратическое отклонение s = 0,8.  Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью 0,95. По таблице приложения по данным :  = 0,95; n =25 , находим q = 0,32.

Искомый доверительный интервал 0,8(1- 0,32)<  < 0,8(1+ 0,32) или  0,544< <0,056.

Пример2. По выборке объема n = 10 найдено s = 0,16. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью 0,999.

q( n=10,  =0,999) = 1,8>0. Искомый доверительный интервал  0<  <0,16(1+1,8)  или  0<  <0,448.

Так как дисперсия есть квадрат среднего квадратического отклонения, то доверительный интервал, покрывающий генеральную дисперсию с заданной надежностью , имеет вид:

Интервальной называют оценку, которая определяется двумя числами - концами интервала, покрывающего оцениваемый параметр. Доверительный интервал - это интервал, который с заданной надежностью гамма покрывает заданный параметр. 1. Интервальной оценкой с надежностью гамма мат. ожидания а нормально распределенного количественного признака Х по выборочной средней Хв при известном среднем квадратическом отклонении сигма генеральной совокупности служит доверительный интервал: Хв - t(сигма/корень из n)<a<Хв+t(сигма/корень из n), где t(сигма/корень из n)=дельта - точность оценки, n - объем выборки, t - значение аргумента функции Лапласа Ф(t), при котором Ф(t)=гамма/2; при неизвестном сигма (и объеме выборки n<30) Хв - t гамма (s/корень из n)<a<Хв+t гамма (s/корень из n), где s-исправленное выборочное среднее квадратическое отклонение. 2. Интервальной оценкой (с надежностью гамма) среднего квадратического отклонения сигма нормально распределенного количественного признака Х по "исправленному" выборочному среднему квадратическому отклонению s служит доверительный интервал s(1-q)<сигма<s(1+q), при q<1; 0<сигма<s(1+q), при q>1. 3. Интервальной оценкой ( с надежностью гамма) неизвестной вероятности р биномиального распределения по относительной частоте w служит доверительный интервал ( с приближенными концами р1 и р2). Доверительный интервал для мат. ожидания при известной дисперсии.:|^=X=1/n сумма по i от 1 до n Xi является наилучшей несмещенной оценкой для мат. ожидания МХ=:| нормального распределения f(x,:|)=1/(корень из 2пи сигма в квадрате)*е -(х-:|)*2/(2сигма в квадрате) по выборке объема n. Пусть дисперсия Хi Dxi=сигма в квадрате известна, где сигма в квадрате - некоторое конкретное число. Предполагается, что для нормально распределенного признака ?, дисперсия которого известна равна ?2. По выборке объема n получены выборочные значения ?1, ?2, ... , ?n. Требуется получить интервальную оценку неизвестного нам математического ожидания этого признака. M |?| > a заданной надежности j. Сначала рассчитываем точечную оценку математического ожидания:; Будем считать, что ?1, ?2, ... , ?n разные СВ, но распределенные по одному и тому же закону и математическое ожидание.M(?i) = a; Д(?i) = ?2; - значение СВ и тогда , тогдаДоказательство несмещенности точечной оценки Вывод: - нормально распределенная СВ, , , тогда чтобы найти вероятность заданного отклонения P(|a - | < ?) = jP(|a - | < ?) = 2Ф() = 2Ф(), где ; Ф() = По таблице для функции Лапласа по значению функции равной находим значение аргумента ; ; Вместо обозначаем .; P(|a -| < ?) = P(-?< a - < ?) = P(- ? < a < + ?) = j(- ?; + ?) - доверительный интервал.

35. Двумерная случайная величина. Функциональная, статистическая и корреляционная зависимость составляющих. Уравнение регрессии, линейная регрессия Двумерная случ. величина- это случ. величина которая определяется двумя числами. Рассмотрим двумерную случайную величину (Х;У),где Х и У-зависимые случайные величины. Представим одну из величин как функцию другой. Ограничимся приближенным представлением величины У в виде линейной функции величины Х :У g(x)=aX+ ,где а и -параметры,подлежащие определению. Это можно сделать различными способами : наиболее употребительный из них- метод наименьших квадратов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]