- •3. Найдем оценку математического ожидания, выборочной дисперсии и среднего квадратического отклонения.
- •4. Рассчитать и построить гистограмму, сформулировать гипотезу о законе распределения св X.
- •6. Проверить альтернативные гипотезы, используя предложенные варианты законов распределения.
- •Список литературы:
Этап 2
ЗАДАНИЕ
По заданной совокупности реализаций случайной величины X построить пара-метрическую оценку её плотности вероятности и функции распределения.
1) Дана выборка из 30 чисел
2) Найти её вариационный ряд и экстремальные значения
3) Найти оценку математического ожидания, выборочной дисперсии и среднего квадратического отклонения
4) Рассчитать и построить гистограмму, сформулировать гипотезу о законе распределения X
5) На уровне значимости α=0.05 проверить H0 по критерию Пирсона.
6) Проверить альтернативные гипотезы, используя предложенные варианты законов распределения.
1. Дана выборка из n=30 элементов:
2. Запишем вариационный ряд данной выборки. Он представляет собой набор элементов выборки, упорядоченных по возрастанию.
Экстремальные значения выборки:
xmin=0,312 – минимальное значение;
xmax=5,726 – максимальное значение.
3. Найдем оценку математического ожидания, выборочной дисперсии и среднего квадратического отклонения.
Математическое ожидание или статистическое среднее выборки определяется по формуле:
, (1)
где xi – i-й элемент выборки, n – объем выборки.
Применим ее для вычисления математического ожидания M*[X] нашей выборки из n=30 элементов:
M*[X]=(0,312+0,431+0,58+0,6+0,629+0,639+0,662+0,886+0,978+1,019+1,334+1,357+
+1,377+1,539+1,546+1,685+1,702+1,735+1,913+1,974+2,09+2,508+2,619+2,738+2,833+
+2,901+3,757+3,879+4,373+5,726)/30=56,332/30=1,877733≈1,878.
Таким образом, M*[X]=1,878.
Дисперсия выборки определяется по формуле:
, (2)
где =M[X] – статистическое среднее.
Применим ее для вычисления дисперсии D*[X] нашей выборки из n=30 элементов:
D*[X]=[(0,312-1,878)2+(0,431-1,878)2 +(0,58-1,878)2+(0,6-1,878)2+(0,629-1,878)2+(0,639-1,878)2+(0,662-1,878)2+(0,886-1,878)2+(0,978-1,878)2+(1,019-1,878)2+(1,334-,878)2+(1,357-1,878)2+(1,377-1,878)2+(1,539-1,878)2+ (1,546-1,878)2+(1,685-1,878)2+ (1,702-1,878)2+ +(1,735-1,878)2+(1,913-1,878)2+(1,974-1,878)2+(2,09-1,878)2+(2,508-1,878)2+(2,619-1,878)2+(2,738-1,878)2+(2,833-1,878)2+(2,901-1,878)2+ +(3,757-1,878)2+ +(3,879-1,878)2+ +(4,373-1,878)2+(5,726-1,878)2]/30=48,35768/30=1,611923≈1,612.
Таким образом, D*[X]= 1,612.
Среднее квадратическое отклонение рассчитывается по формуле:
. (3)
Среднеквадратическое отклонение для нашей выборки равно:
=(1,612)1/2=1,269615≈1,267.
4. Рассчитать и построить гистограмму, сформулировать гипотезу о законе распределения св X.
Гистограмма строится следующим образом. По оси абсцисс откладываются разряды, и на каждом из разрядов как их основании строится прямоугольник, площадь которого равна частоте данного разряда. Для построения гистограммы нужно частоту каждого разряда разделить на его длину и полученное число взять в качестве высоты прямоугольника. В случае равных по длине разрядов высоты прямоугольников пропорциональны соответствующим частотам. Из способа построения гистограммы следует, что полная площадь ее равна единице.
Разобьем диапазон, в который входит наша выборка, на k=8 интервалов. Длина каждого из них:
=(5,726-0,312)/8=0,67675.
Здесь xmin и xmax – округленные до сотых долей значения нижней и верхней границ выборки. Пусть xmin=0,31, xmax=5,73. Тогда
∆=(5,73-0,31)/8=0,6775.
Рассмотрим каждый из интервалов ∆i , вычислим частоту pi* попадания в этот интервал и высоту hi прямоугольника для построения гистограммы:
, (4)
где mi – количество элементов из выборки, попавших в интервал ∆i;
. (5)
1) [x1; x2]=[0,31; 0,31+∆]=[0,31; 0,31+0,6775]=[0,31; 0,9875].
В этот интервал попадает m1=9 элементов из выборки. Следовательно,
p1*=m1/n=9/30=0,3;
h1= p1*/∆=0,3/0,6775=0,4428…≈0,443.
2) [x2; x3]=[ 0,9875; 0,9875+∆]=[0,9875; 0,9875+0,6775]=[ 0,9875; 1,665].
В этот интервал попадает m2=6 элементов из выборки. Следовательно,
p2*=m2/n=6/30=0,2;
h2= p2*/∆=0,2/0,6775=0,2952…≈0,296.
3) [x3; x4]=[ 1,665; 1,665+∆]=[1,665; 1,665+0,6775]=[ 1,665; 2,3475].
В этот интервал попадает m3=6 элементов из выборки. Следовательно,
p3*=m3/n=6/30=0,2;
h3= p3*/∆=0,2/0,6775=0,2952…≈0,296.
4) [x4; x5]=[ 2,3425; 2,3425+∆]=[2,3425; 2,3425+0,6775]=[ 2,3425; 3,02].
В этот интервал попадает m4=5 элементов из выборки. Следовательно,
p4*=m4/n=5/30=0,1666…≈0,167;
h4= p4*/∆=0,167/0,6775=0,2464…≈0,246.
5) [x5; x6]=[ 3,02; 3,02+∆]=[3,02; 3,02+0,6775]=[ 3,02; 3,6975].
В этот интервал попадает m5=0 элементов из выборки. Следовательно,
p5*=m5/n=0/30=0;
h5= p5*/∆=0/0,6775=0.
6) [x6; x7]=[ 3,6975; 3,6975+∆]=[3,6975; 3,6975+0,6775]=[ 3,6975; 4,375].
В этот интервал попадает m6=3 элементов из выборки. Следовательно,
p6*=m6/n=3/30=0,1;
h6= p6*/∆=0,1/0,6775=0,1476…≈0,148.
7) [x7; x8]=[ 4,375; 4,375+∆]=[4,375; 4,375+0,6775]=[ 4,375; 5,0525].
В этот интервал попадает m7=0 элементов из выборки. Следовательно,
p7*=m7/n=0/30=0;
h7= p7*/∆=0/0,6775=0.
8) [x8; x9]=[ 5,0525; 5,0525+∆]=[5,0525; 5,0525+0,6775]=[ 5,0525; 5,73].
В этот интервал попадает m8=1 элементов из выборки. Следовательно,
p8*=m8/n=1/30=0,0333…≈0,033;
h8= p8*/∆=0,033/0,6775=0,0492…≈0,049.
Занесем полученные данные в таблицу:
Интервал |
Частота |
Высота |
[0,31; 0,9875] |
0,3 |
0,443 |
[ 0,9875; 1,665] |
0,2 |
0,296 |
[ 1,665; 2,3425] |
0,2 |
0,296 |
[ 2,3425; 3,02] |
0,167 |
0,246 |
[ 3,02; 3,6975] |
0 |
0 |
[ 3,6975; 4,375] |
0,1 |
0,148 |
[ 4,375; 5,0525] |
0 |
0 |
[ 5,0525; 5,73] |
0,033 |
0,049 |
На основании этой таблицы построим гистограмму:
Выдвигаем гипотезу H0 об экспоненциальном законе распределения СВ X. В общем виде функция плотности распределения показательного закона выглядит так:
, (6)
а функция распределения:
, (7)
где .
Рассчитаем оценку параметров и :
=0,312, =1/(1,878-0,312)=0,638.
Таким образом, функция плотности распределения для нашей выборки будет иметь вид:
, , (8)
а функция распределения:
, . (9)
Расчетная формула для вычисления вероятности pi попадания в интервал
∆i =[xi, xi+1] для экспоненциального закона распределения имеет вид:
pi=P(xi<X<xi+1)=F(xi+1)-F(xi)= . (10)
Интервалы возьмем те, которые мы рассчитывали выше при построении гистограммы:
[x1; x2]=[0,312; 0,9875]: p1=e-0,638 (0,312-0,312)-e-0,638 (0,9875-0,312)= 0,35;
[x2; x3]=[ 0,9875; 1,665]: p2=e-0,638 (0,9875-0,312)-e-0,638 (1,665-0,312)= 0,228;
[x3; x4]=[ 1,665; 2,3425]: p3=e-0,638 (1,665-0,312)-e-0,638 (2,3425-0,312)= 0,149;
[x4; x5]=[ 2,3425; 3,02]: p4=e-0,638 (2,3425-0,312)-e-0,638 (3,02-0,312)= 0,095;
[x5; x6]=[ 3,02; 3,6975]: p5=e-0,638 (3,02-0,312)-e-0,638 (3,6975-0,312)= 0,062;
[x6; x7]=[ 3,6975; 4,375]: p6=e-0,638 (3,6975-0,312)-e-0,638 (4,375-0,312)= 0,04;
[x7; x8]=[ 4,375; 5,0525]: p7=e-0,638 (4,375-0,312)-e-0,638 (5,0525-0,312)= 0,026;
[x8; x9]=[ 5,0525; 5,73]: p8=e-0,638 (5,0525-0,312)-e-0,638 (5,73-0,312)= 0,017.
На основании полученных данных построим таблицу:
№ |
Интервал |
Вероятность |
1 |
[0,312; 0,9875] |
0,35 |
2 |
[ 0,9875; 1,665] |
0,228 |
3 |
[ 1,665; 2,3425] |
0,149 |
4 |
[ 2,3425; 3,02] |
0,095 |
5 |
[ 3,02; 3,6975] |
0,062 |
6 |
[ 3,6975; 4,375] |
0,04 |
7 |
[ 4,375; 5,0525] |
0,026 |
8 |
[ 5,0525; 5,73] |
0,017 |
5. На уровне значимости α=0.05 проверить H0 по критерию Пирсона.
Проверим гипотезу H0, состоящую в том, что СВ X имеет экспоненциальный закон распределения, по критерию хи-квадрат Пирсона.
Метод проверки по критерию Пирсона состоит в следующем.
Выбирается малое положительное число α, называемое уровнем значимости критерия (в нашей задаче α=0,05).
Вычисляется статистика критерия Пирсона:
, (11)
где k – число интервалов, на которые разбита выборка СВ; pi* - статистическое значение вероятности на интервале ∆i; pi – теоретическое значение вероятности на интервале ∆i . Статистика критерия gn - мера расхождения статистического и теоретического распре-делений.
Если гипотеза H0 верна и n достаточно велико, то gn можно считать реализацией случайной величины χ2(r), имеющей распределение хи-квадрат с r степенями свободы.
По таблице или численно находят число , являющееся решением уравнения
, (12)
(где - квантиль уровня значимости 1-α распределения χ2(r)) и формируют крити-ческую область =( , ).
Гипотеза H0 отвергается, если и принимается, если .
Определим критическую область . Т.к. уровень значимости α=0,05, а число степеней свободы r=7, то по таблице квантили находим, что =14,07. Следовательно, критическая область =(14,07; ). А это значит, что гипотеза H0 принимается, если статистика критерия Пирсона лежит в пределах области G=(0; 14,07). В противном случае гипотеза отвергается.
Вычислим статистику критерия Пирсона для экспоненциального распределения по формуле (11):
gn=30·[(0,443-0,35)2/0,35+(0,296-0,228)2/0,228+(0,296-0,149)2/0,149+(0.246-0,095)2/0,095+(0-0,062)2/0,062+(0,148-0,04)2/0,04+(0-0,026)2/0,026+(0,049-0,017)2/0,017]= =26,096.
Таким образом, gn=26,096. Т.к. =(0; 14,07), то гипотеза H0 о том, что СВ X имеет экспоненциальное распределение, отвергается.