
- •Выборочный метод
- •Способы отбора
- •Статистическое распределение выборки
- •Эмпирическая функция распределения
- •Полигон и гистограмма
- •Статистические оценки параметров распределения
- •Виды статистических оценок
- •Эмпирические моменты
- •Асимметрия и эксцесс эмпирического распределения
- •Интервальные оценки
- •Доверительные интервалы для параметров нормального распределения
- •Доверительный интервал для математического ожидания при известной дисперсии
- •Доверительный интервал для математического ожидания при неизвестной дисперсии
- •Доверительные интервалы для среднеквадратического отклонения нормального распределения
- •Статистические оценки статистических гипотез
- •Виды статистических гипотез
Асимметрия и эксцесс эмпирического распределения
Нормальное распределение является одним из самых распространенных в применениях математической статистики. Для оценки отклонения эмпирического распределения от нормального используют следующие характеристики.
Асимметрия эмпирического распределения определяется следующим равенством:
(13)
Эксцесс эмпирического распределения определяется следующим равенством:
(14)
В формулы (13) и (14) входят центральные эмпирические моменты, определяемые формулами (11), а также выборочное среднеквадратическое отклонение (9). Асимметрия и эксцесс служат для сравнения полигона эмпирического распределения с нормальным распределением: знак аs указывает на расположение длинной части ломаной относительно математического ожидания (справа при аs > 0 и слева при аs < 0): ek характеризует «крутизну» ломаной (при ek > 0 сравниваемая кривая более высокая и острая, при ek < 0 она более низкая и плоская).
Пример 6. Найти асимметрию и эксцесс эмпирического распределения:
-
варианта
1
2
3
4
5
6
10
частота
5
10
15
35
16
15
4
Решение.
Найдем
сначала
и
по формулам ( 6) — (9):
Далее, используя формулы (11), определяем центральные эмпирические моменты третьего и четвертого порядков:
m3 = (5 . (- 3,2)3 + 10 . (-2,2)3 + 15 . (- 1,2)3 + 35 . (- 0,2)3 + 16. 0,83 +
+15 . 1,83 + 4 . 5,83) / 100 =579,6/100 = 5,796
m4 = (5 . (- 3,2)4 + 10 . (-2,2)4 + 15 . (- 1,2)4 + 35 . (- 0,2)4 + 16. 0,84 +
+15 . 1,84 + 4 . 5,84) / 100 =5480,32/100 = 54,8032.
Затем по формулам (13) и (14) находим искомые величины:
аs = 5,796/1,8873 = 0,863 ek = 54,8032/1,8874 =4,324.
Интервальные оценки
Все оценки,
приведенные ранее, определяются одним
числом, т.е. являются точечными.
Точечные
оценки хороши при первичной обработке
результатов наблюдений. При
малых объемах выборки точечная оценка
может приводить к большим ошибкам и
значительно отличаться от оцениваемого
параметра. Более широкое применение
получил метод
доверительных интервалов, разработанный
американским статистиком Ю. Нейманом.
Оценка неизвестного параметра называется
интервальной,
если она определяется двумя числами
.
Обычно выбирают симметричный интервал
Определение
2.
Доверительным
интервалом для параметра θ
с надежностью
оценки
называется числовой промежуток (θ*
- δ, θ*
+ δ), содержащий истинное значение данного
параметра с вероятностью, равной р:
Р (θ* - δ < θ < θ* + δ) = , (15)
где θ* - оценка неизвестного параметра θ (например, точечная оценка), δ > θ - некоторое число.
Обычно надежность
оценки или доверительная
вероятность
задается
числом, близким к единице. Выбор этого
числа зависит от конкретно решаемой
задачи. Иными словами, доверительный
интервал покрывает неизвестный параметр
с заданной доверительной вероятностью.
Число
называется
уровнем
значимости.
Общая схема построения доверительных
интервалов сводится к следующему.
Рассматриваются теоретические выборки случайных величин, с распределениями которых связан параметр θ.
Подбирается случайная величина Y с известным распределением, значения которой определяются выборками и параметром θ: Y = Y (θ).
По известному распределению Y подбираются числа Y1 и Y2 такие, чтобы выполнялось равенство Р (Y1 < Y (θ) < Y2) = .
По значениям Y1 и Y2 определяется число δ > 0 при известном значении θ*. Таким образом, условие (15) будет выполнено и доверительный интервал построен.