
- •Курс «Математическая статистика»
- •Генеральная и выборочная совокупности
- •Статистический ряд
- •Статистическая функция распределения
- •Полигон и гистограмма
- •Характеристики генеральной совокупности
- •Характеристики статистического ряда
- •Статистические оценки параметров распределения
- •Оценка для математического ожидания
- •Оценка для дисперсии
- •Интервальные оценки параметров распределения
- •Доверительные оценки параметров нормального распределения
- •Доверительные интервалы для математического ожидания при известном среднем квадратическом отклонении
- •Доверительные интервалы для математического ожидания при неизвестном среднем квадратическом отклонении , распределение Стьюдента
- •Доверительный интервал для среднего
- •Построение нормальной кривой по опытным данным
- •Проверка гипотез нормальности распределения
- •Преобразование распределений к нормальному
- •Методы построения парных зависимостей по экспериментальным данным
- •Две основные задачи теории корреляции
- •Методы построения, преобразования и оценки парных зависимостей по экспериментальным данным
- •Парная корреляция Статистическое оценивание парной корреляции и регрессии
- •1.3.4. Корреляционная таблица
- •Построение прямых линий регрессии по сгруппированным данным
- •Свойства коэффициента корреляции
- •1.3.7. Упрощение вычисления выборочного коэффициента корреляции.
- •1.3.8. Выборочное корреляционное отношение
- •1.3.9. Нелинейная парная регрессия
- •1.3.10. Оценивание тесноты корреляционной связи
Оценка для математического ожидания
В качестве оценки для математического ожидания величины Х принимается среднее арифметическое наблюдаемых значений выборки:
.
Эта
оценка является состоятельной и
несмещенной. Доказывается, что если
случайная величина Х
распределена по нормальному закону,
то
,
то есть оценка является и эффективной.
Для других законов распределения эта
оценка может не являться эффективной.
Оценка для дисперсии
Показывается,
что
,
то есть, если взять в качестве оценки
дисперсии генеральной совокупности
дисперсию
вы-
борки
,
то такая оценка является смещенной.
Чтобы ликвидировать эту смещенность,
берут исправленную
статистическую дисперсию
.
Эта оценка дисперсии генеральной совокупности является и несмещенной и состоятельной.
Правило
обработки ограниченного по объему
статистического материала: если получены
значения
в n
независимых
испытаниях случайной величины Х
с неизвестными математическим ожиданием
и дисперсией
,
то для определения этих параметров
следует пользоваться приближенными
значениями – их оценками:
,
,
Тогда
- исправленное с.к.о. по выборке, служащее
для оценки
-
с.к.о. генеральной совокупности.
Интервальные оценки параметров распределения
Оценка называется точечной, если она определяется одним числом. Ранее рассмотрены точечные оценки.
При выборке малого объема точечная оценка может значительно разниться с оцениваемым параметром, то есть точечная оценка может приводить к грубым ошибкам. Поэтому при небольшом объеме статистического материала следует пользоваться интервальными оценками - оценками, которые определяются двумя числами – концами интервала.
Пусть
- статистическая оценка параметра
теоретического распределения
.
тем точнее определяет параметр
,
чем меньше величина
,
то есть, если
и
,
то чем меньше
,
тем оценка точнее.
Надежностью
(доверительной
вероятностью)
оценки параметра
по
называется вероятность
,
с которой осуществляется неравенство
:
.
Обычно
задается наперед в виде числа близкого
к единице:
.
,
а тогда
.
Последнее
соотношение понимается так: вероятность
того, что интервал
заключает в себе (покрывает) неизвестный
параметр
,
равна
.
Интервал
называется доверительным,
если он покрывает неизвестный параметр
с заданной надежностью.
Доверительные оценки параметров нормального распределения
Пусть Х – нормально распределенная случайная величина, диффе-
ренциальная
функция распределения для которой:
,
где а - математическое ожидание и - среднее квадратическое отклонение нормально распределенной случайной величины Х.
Доверительные интервалы для математического ожидания при известном среднем квадратическом отклонении
Пусть
известно среднее квадратическое
отклонение
.
Требуется оценить неизвестное
математическое ожидание
,
то есть требуется
построить
доверительный интервал, соответствующий
вероятности
для
математического ожидания
случайной величины
.
Известно, что если
- нормально распределенная случайная
величина, то выборочная средняя
(математическое ожидание выборки)
,
полученная в результате независимых
наблюдений, так же распределена нормально.
Для
искомой оценки нужно определить такое
,
чтобы
.
Ранее показано, что вероятность попадания
случайной величины
,
распределенной по нормальному закону,
на интервал
,
определяется формулой:
Ф
,
где
и Ф
Ф
- интегральная
функция Лапласа,
таблицы которой имеют вид.
П
2.
Таблица
значений функции
-
x
Сотые доли x
0
1
2
3
4
5
6
7
8
9
0,0
0,0000
0040
0080
0112
0160
0199
0239
0279
0319
0359
0,1
0398
0438
0478
0517
0557
0596
0636
0675
0714
0754
0,2
0793
0832
0871
0910
0948
0987
1026
1064
1103
1141
0,3
1179
1217
1255
1293
1331
1368
1406
1443
1480
1517
0,4
1554
1591
1628
1664
1700
1736
1772
1808
1844
1879
0,5
1915
1950
1985
2019
2054
2088
2123
2157
2190
2224
0,6
2258
2291
2324
2357
2389
2422
2454
2486
2518
2549
0,7
2580
2612
2642
2673
2704
2734
2764
2794
2823
2852
0,8
2881
2910
2939
2967
2996
3023
3051
3079
3106
3133
0,9
3159
3186
3212
3238
3264
3289
3315
3340
3365
3389
1,0
3413
3438
3461
3485
3508
3531
3553
3577
3599
3621
1,1
3643
3665
3686
3708
3729
3749
3770
3790
3810
3830
1,2
3849
3869
3888
3907
3925
3944
3962
3980
3997
4015
1,3
4032
4049
4066
4082
4099
4115
4131
4147
4162
4177
1,4
4192
4207
4222
4236
4251
4265
4279
4292
4306
4319
1,5
4332
4345
4357
4370
4382
4394
4406
4418
4430
4441
1,6
4452
4463
4474
4485
4495
4505
4515
4525
4535
4545
1,7
4554
4564
4573
4582
4591
4599
4608
4616
4625
4633
1,8
4641
4649
4656
4664
4671
4678
4686
4693
4700
4706
1,9
4713
4719
4726
4732
4738
4744
4750
4756
4762
4767
x
Десятые доли x
0
1
2
3
4
5
6
7
8
9
2,
4773
4821
4861
4893
4918
4938
4953
4965
4974
4961
3,
4987
4990
4993
4995
4997
4998
4998
4999
4999
5000
Точное
значение отличается меньше, чем на
Таким
образом,
Ф
.
В нашем случае
,
а для
и
.
Последняя
подчеркнутая формула отражает тот
доказываемый момент, что среднее
квадратическое отклонение среднего
арифметического
n
одинаково распределенных независимых
случайных величин в
раз меньше среднего квадратического
отклонения
каждой из величин.
Теперь
Ф
,
откуда
Ф
,
при обозначении
Ф
.
Теперь
путь отыскания доверительного интервала
для
следующий:
задается
по формуле Ф
определяется
Ф
по
таблице определяется t
по формуле
определяется
.
З а д а ч а .
Случайная
величина Х
имеет
.Требуется
найти доверительный интервал для оценки
неизвестного математического ожидания
с заданной надежностью
,
если объем выборки
и
.
Р
е ш е н и е. Ф
по таблице
.
Теперь искомый интервал:
или
.
Если
в решаемой задаче
,
то Ф
и искомый доверительный интервал
.
Из приведенных результатов видно, что:
-
при возрастании объема выборки число
уменьшается, то есть точность оценки
возрастает;
- увеличение надежности оценки ведет к увеличению , то есть к уменьшению точности оценки.
Л-3