
Лабораторная работа № 2. Точечные оценки параметров эмпирического распределения
Цель работы: вычисление точечных оценок числовых характеристик СB,построение и исследование вариационных радов различных видов, вычисление оценок моментов СВ.
Общие сведения
Закон распределения случайной величины представляет собой некоторую функцию F(x), значение которой полностью описывает случайную величину с вероятностной точки зрения. Однако при решении многих практических задач нет необходимости характеризовать случайную величину (СВ) исчерпывающим образом, а достаточно указать только числовые характеристики, которые характеризуют существенные черты распределения случайной величины в генеральной совокупности. Применяя выборочный метод, в математической статистике вследствие случайности выборок можно лишь оценить числовые значения этих характеристик (но не вычислить точно!) для статистических распределений. Поэтому значения оценок одной числовой характеристики из одной и той же генеральной совокупности бывают, как правило, различны.
Обозначим неизвестный
параметр распределения, то есть числовую
характеристику генеральной совокупности
Х
через θ,
оценку неизвестного параметра – через
.
Оценка
- функция от выборки и эту оценку можно
находить различными способами. Например,
если нужно оценить среднее значение
θ=mх
нормального распределения, то можно
использовать следующие оценки
:
x1 – первый элемент выборки. На практике часто так и поступают: измеряют значение какой – либо величины один раз, и этот результат используют как значение этой величины;
(xmax + xmin)/2 – среднее арифметическое максимального и минимального значения выборки;
Mo – моду, которая при нормальном распределении равна среднему значению mх;
Me – медиану, которая при нормальном распределении также равна среднему значению mх;
- среднее арифметическое выборки.
Свойства оценок
Для того, чтобы установить, какая оценка лучше, надо знать их основные свойства.
Несмещенность оценки. Различают оценки смещенные и несмещенные. Смещенными называют оценки, математическое ожидание которых не равно оцениваемому параметру:
.
Несмещенными называют оценки, для которых выполняется условие
.
Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки, для того чтобы не делать систематической ошибки в сторону завышения или занижения.
Состоятельность
оценки.
Оценка
для параметра
θ называется состоятельной, если она
сходится по вероятности к оцениваемому
параметру при неограниченном возрастании
числа опытов n,
т.е.
(1)
где - сколь угодное малое положительное число. Для удовлетворения требования (1) достаточно, чтобы дисперсия оценки стремилась к нулю при n, т.е. чтобы выполнялось условие
(2)
и, кроме того, чтобы оценка была несмещенной. От формулы (1) можно перейти к выражению (2), если воспользоваться неравенством Чебышева.
Итак, состоятельность оценки означает, что при достаточно большом количестве опытов n со сколь угодно большой достоверностью отклонение оценки от истинного значения параметра меньше любой наперед заданной величины. Такому требованию должна удовлетворять всякая оценка, пригодная для практического использования.
Эффективность оценки. Оценки, обладающие свойством несмещенности и состоятельности, при ограниченном числе опытов могут отличаться дисперсиями.
Совершенно очевидно, что чем меньше дисперсия оценки, тем меньше вероятность грубой ошибки при определении приближенного значения параметра. Поэтому необходимо, чтобы дисперсия оценки была минимальной, т.е. чтобы выполнялось условие
.
Оценка, обладающая таким свойством, называется эффективной.
При выработке практических методов обработки опытных данных с целью получения оценок, принимаемых в качестве приближенных значений искомых параметров, необходимо руководствоваться сформулированными свойствами оценок.
Точечные оценки
Рассмотрим определение точечных оценок числовых характеристик случайной величины Х в генеральной совокупности. (Название точечных эти оценки получили потому, что их значения представлены одним числом или точкой).
Самыми основными числовыми характеристиками случайной величины являются математическое ожидание и дисперсия. Первая характеризует среднее значение, около которого группируются возможные значения случайной величины, а вторая – степень разбросанности этих значений относительно среднего.
Оценкой математического ожидания случайной величины Х является среднее арифметическое наблюдаемых значений x1, x2, x3, …, xn,, вычисляемое по формуле:
(3)
или же используется другая формула
(4)
где xi – значение наблюдаемой величины в i-ом опыте, ωi – относительная частота значения xi, n – объем выборки, а m – число различных значений в выборке.
Средняя величина количественного признака – это обобщающая характеристика варьирующего признака, который имеет различные значения xi отдельных единиц генеральной совокупности. Например, средняя зарплата служащих в банке средний рост человека, среднее число проданных товаров в месяц, средний уровень влажности воздуха летом, средняя температура больного за неделю, и т.д.
Аналогией дисперсии случайной величины Х является статистическая дисперсия, которая определяется следующим образом:
или
(5)
Отметим, что данная
оценка дисперсии является смещенной.
При
смещение стремится к нулю. Значит, при
достаточно большом объеме выборки
(n>30)
можно приближенно принимать за несмещенную
оценку дисперсии D.
Для оценки дисперсии, несмещенной при
малом объеме выборки,
используют исправленную
дисперсию:
или
(6)
Оценочное значение
среднеквадратического отклонения
высчитывается по формуле:
(7)для смещений оценки,
(8)для
несмещенной оценки.
Оценим следующие две числовые характеристики генеральной совокупности – моду и медиану.
Если вариационный ряд составлен по значениям генеральной совокупности, то модой выборки является значение, имеющее максимальную частоту. Если вариационный ряд составлен по интервалам значений генеральной совокупности, то мода вычисляется по следующей приближенной формуле:
,
(9)
где
- начало модального интервала, то есть
интервала, имеющего максимальную
частоту,
-
длина модального интервала,
-
частота модального интервала,
и
- частоты соответственно предшествующего
и последующего за модальным интервалом.
Медианой выборки является значение серединного элемента вариационного ряда. Если вариационный ряд составлен по значениям генеральной совокупности, то при нечетном объеме выборки n медиана – это действительное значение серединного элемента, а при n четном – среднее арифметическое двух серединных элементов.
Если вариационный ряд составлен по интервалам значений, то медиана вычисляется по следующей приближенной формуле:
,
(10)
где
- начало медианного интервала, то есть
интервала, в котором содержится серединный
элемент,
- длина медианного интервала,
- объем выборки,
- сумма частот интервалов, предшествующих
медианному,
-
частота медианного интервала.
К. Пирсон, вычисляя распределения с помощью их кривых, построил формулу, которая дает величину моды, свойственную всем одномодальным распределениям:
(11)