
- •И.М.Баранова, н.А.Часова, г.Д. Алексеева, а.Н.Муравьев
- •Математика
- •Брянск 2006
- •Пусть имеется выборка результатов испытаний
- •1. Показатели центра распределения
- •2. Показатели рассеяния
- •3. Показатели формы распределения
- •Напомним, что мода – точка максимума дифференциальной функции распределения.
- •6. Точечные и интервальные оценки параметров генеральной совокупности
- •7. Статистическая проверка гипотез
- •8. Предварительный выбор закона распределения
- •Проверка гипотезы о виде распределения
- •Приложение 2
- •ЛИтература
- •241037, Г. Брянск, пр. Станке Димитрова, 3, редакционно–издательский
3. Показатели формы распределения
На практике
приходится встречаться с самыми
различными распределениями. Однородные
совокупности характеризуются, как
правило, одновершинным распределением.
Многовершинность свидетельствует о
неоднородности изучаемой совокупности.
При изучении распределений, отличных
от нормального, возникает необходимость
количественно оценить это различие. С
этой целью вводят такие характеристики,
как коэффициент асимметрии
и коэффициент эксцесса ε.
Для нормального распределения эти
характеристики равны нулю. Поэтому,
если для изучаемого распределения
асимметрия и эксцесс имеют небольшие
значения
;
,
то можно предположить близость этого
распределения к нормальному.
Коэффициент асимметрии определяется по формуле:
.
Если
=0,
то ряд симметричен относительно моды.
При
>0
скошенность вправо, средняя арифметическая
правее моды, «длинная часть» кривой
распределения расположена справа от
моды. При правосторонней асимметрии
.
При
<0
скошенность вправо, средняя арифметическая
левее моды, «длинная часть» кривой
распределения расположена слева от
моды. При левосторонней асимметрии
.
Напомним, что мода – точка максимума дифференциальной функции распределения.
В нашем случае:
.
К
оэффициент
асимметрии отрицательный, следовательно
“длинная часть” кривой, полученной на
основании опытных данных, расположена
слева от моды и средняя арифметическая
левее моды (рисунок 3). Заметим, что в
нашем случае коэффициент асимметрии
близок к нулю.
Рисунок 3. Левосторонняя асимметрия.
Коэффициент эксцесса определяется по формуле:
Если ε*>0, то кривая имеет более высокую и острую вершину, чем нормальная кривая (островершинное распределение); если ε*<0, то сравниваемая кривая имеет более низкую и "плоскую" вершину, чем нормальная кривая (плосковершинное распределение).
Замечание:
–2 < ε*<
.
Если ε*
близок к –2, то кривая двухвершинная.
При ε
=
–2 кривая распадается на 2 островершинные
кривые, что говорит о неоднородности
статистического материала.
В нашем случае:
.
К
оэффициент
эксцесса отрицательный, следовательно,
вершина кривой ряда распределения ниже,
чем у кривой нормального распределения.
Рисунок 4. – Плосковершинное распределение.
6. Точечные и интервальные оценки параметров генеральной совокупности
Задачи математической статистики практически сводятся к оценке свойств генеральной совокупности по результатам случайной выборки.
Любую
функцию
от результатов выборочных наблюдений
принято
называть статистикой (выборочной
характеристикой). Статистики обычно и
используются для построения статистических
оценок параметров
генеральной совокупности, когда точные
значения этих параметров нам неизвестны.
Статистику
,
используемую как оценку параметра
,
называют точечной оценкой. Из точечных
оценок в приложениях математической
статистики наиболее часто используют
среднюю арифметическую
как оценку математического ожидания
М(х)=а,
выборочную дисперсию D*
и среднее квадратическое отклонение
,
как оценки генеральной дисперсии D(x)
и среднего квадратического отклонения
.
В математической статистике в зависимости от задачи статистику рассматривают либо как СВ, либо как число (конкретную реализацию СВ). Возникает вопрос, каким требованиям должны отвечать точечные оценки, чтобы их можно было считать в каком–то определенном смысле "хорошими". Эти требования характеризуют понятиями несмещенности, состоятельности и эффективности.
Оценку
называют несмещенной, если при любом
объеме выборки n
ее математическое ожидание равно
оцениваемому параметру
,
то есть М(
)
=
.
В случае большой выборки оценка
параметра
называется состоятельной, если по мере
роста числа наблюдений n
(то есть
в случае конечной генеральной совокупности
объемом N
или при
в случае бесконечной генеральной
совокупности) она стремится к оцениваемому
параметру
.
Несмещенная оценка параметра называется эффективной, если среди прочих несмещенных оценок того же параметра она обладает наименьшей дисперсией.
Точечные оценки параметров генеральной совокупности в нашем примере:
Точечная оценка без указания степени точности и надежности малоинформативна, так как наблюдаемые значения статистики есть лишь значения СВ. Она может существенно отличаться от оцениваемого параметра при малом объеме выборки, что приводит к грубым ошибкам.
Интервальной
оценкой параметра
называют такой интервал
,
относительно которого можно утверждать
с определенной, близкой к единице
вероятностью
,
что он содержит неизвестное значение
.
Величину
называют доверительной вероятностью
или надежностью оценки параметра Θ:
,
–
некоторые функции от результатов
выборочных наблюдений
.
Разность 2
=
–
между
верхней и нижней границами доверительного
интервала называют длиной доверительного
интервала, а величину
– точностью оценки.
Для
построения интервальных оценок необходимо
знать закон распределения статистики
.
На практике закон распределения генеральной совокупности неизвестен. В этом случае пользуются приближенным методом построения доверительных интервалов, суть которого в следующем: если считать, что распределение выборочных характеристик в больших выборках асимптотически нормальное (для дисперсии это справедливо при n >100, а для средней арифметической при n > 30), то доверительные интервалы строятся следующим образом
где
– оцениваемый параметр;
*
– выборочная оценка параметра;
–
число, определяемое из равенства
.
По таблице значений функции Лапласа
находят
аргумент
,
которому соответствует значение функции
Лапласа, равное
.
При
.
– стандартные
ошибки выборочной характеристики
(главный член среднего квадратического
отклонения).
Стандартные ошибки:
1) Выборочной
средней
.
В нашем примере
2) Выборочной
дисперсии
В примере
3) Выборочного
среднеквадратического отклонения
:
.
В примере
4) Выборочного
коэффициента асимметрии
:
5) Выборочного
коэффициента эксцесса
6) Выборочного
коэффициента вариации
:
7) Выборочной
медианы
Построим доверительные
интервалы для параметров генеральной
совокупности нашего примера при
.
Для математического ожидания:
.
Для дисперсии:
.
Для среднеквадратического отклонения:
.
Для коэффициента асимметрии:
.
Для коэффициента эксцесса:
.
Для коэффициента вариации:
.
Для медианы:
.