

Практическая работа №2 Классические методы математической статистики
Выполнил студент . Вариант №11
Цель работы
Научится применять методы математической статистики для решения задач статистического анализа; сформировать навыки реализации методов с помощью прикладных программных пакетов.
Постановка задачи
Для полученных в результате эксперимента наборов данных выполнить статистическую обработку. Полученные результаты содержательно проинтерпретировать
1. В результате эксперимента получены данные, приведенные в таблице 1.
Построить вариационный ряд, эмпирическую функцию распределения и гистограмму частот.
Вычислить выборочные аналоги следующих числовых характеристик: мат. ожидания, дисперсии, СКО, медианы, асимметрии, эксцесса, вероятности |
. |
|||
В предположении, что исходные наблюдения являются выборкой из распределения Пуассона, построить оценку максимального правдоподобия параметра |
, а также оценку по методу моментов. Найти смещение оценок. |
|||
Построить асимптотический доверительный интервал уровня доверия |
для параметра на базе оценки максимального правдоподобия. |
|
||
Используя гистограмму частот, построить критерий значимости |
проверки простой гипотезы согласия с распределением Пуассона с параметром . Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором еще нет оснований отвергнуть данную гипотезу. |
|||
Построить наиболее мощный критерий проверки простой гипотезы пуассоновости с параметром |
при альтернативе пуассоновости с параметром |
. Проверить гипотезу на уровне значимости . Что получится, если поменять местами основную и альтернативную гипотезы? |
В пунктах (c)-(f) заменить семейство распределений Пуассона на семейство геометрических распределений:
Таблица 1. |
|
|
|
|
|
|
|
|
2. В результате эксперимента получены данные, приведенные в таблице 2. |
|
|
|
|
|
|
|
|
Построить вариационный ряд, эмпирическую функцю распределения, |
гистограмму и полигон частот с шагом . |
|
|
|||||
Вычислить выборочные аналоги следующих числовых характеристик: мат. ожидания, дисперсии, СКО, медианы, асимметрии, эксцесса, вероятности |
|
|||||||
В предположении, что исходные наблюдения являются выборкой из показательного распределения, построить оценку максимального правдоподобия параметра |
и соответствующую оценку по методу моментов. Найти смещение оценок. |
|||||||
Построить асимптотический доверительный интервал уровня доверия |
для параметра на базе оценки максимального правдоподобия. |
|
. Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором еще нет оснований отвергнуть данную гипотезу. |
|||||
С использованием теоремы Колмогорова построить критерий значимости проверки простой гипотезы согласия с показательным распределением с параметром |
||||||||
Используя гистограммы частот, построить критерий значимости |
проверки простой гипотезы согласия с показательным распределением. Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором еще нет оснований отвергнуть данную гипотезу. |
|||||||
Построить наиболее мощный критерий проверки простой гипотезы о показательности с параметром |
при альтернативе показательности с параметром |
. Проверить гипотезу на уровне значимости . Что получится, если поменять местами основную и альтернативную гипотезы? |
||||||
В пунктах (с)-(h) заменить семейство показательных распределений на семейство гамма-распределений с плотностями |
|
|
(использовать таблицу распределений ) |
|||||
|
||||||||
Таблица 2. |
|
|
|
|
|
|
|
|
Выполнение работы
Каждый пункт работы выполняется с помощью кода.
Задание 1.1
Построим вариационный ряд, эмперическую функцию распределения и гистограмму частот:
In [1]: #Вариационный ряд
str="1 1 1 1 0 0 0 1 0 1 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 2 0 2 0 0 0 0 2 0 1 0 1 2 2 3" table1=str.split(" ")
for i in range(len(table1)): table1[i]=int(table1[i])
table1.sort() print(table1) print(sum(table1))
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3]
25
In [19]: #Вариационный ряд
from IPython.display import Image Image('2-1.png')
Out[19]:
In [20]: #Эмперическая ункция распределения
from IPython.display import Image Image('2-2.png')
Out[20]:
In [21]: #Гистограмма
from IPython.display import Image Image('2-3.png')
Out[21]:
Задание 1.2
1. Аналог математического ожидания:
2. Аналог дисперсии
In [21]: #Дисперсия sum=0 avg=0.5
for i in range(len(table1)): sum+=(table1[i]-avg)**2
print(sum/(len(table1)-1))
0.6632653061224489
3.Аналог СКО:
4.Медиана
5.Асимметрия
In [4]: #Асимметрия sum=0 avg=0.5 sigma=0.81
for i in range(len(table1)): sum+=(table1[i]-avg)**3
print((sum/(len(table1)-1))/(sigma**3))
1.3824561476269621
6. Эксцесс
In [23]: #Эксцесс sum=0 avg=0.5 sigma=0.81
for i in range(len(table1)): sum+=(table1[i]-avg)**4
print((sum/(len(table1)-1))/(sigma**4)-3)
0.6564448006080053
7. Вероятность
Задание 1.3
Оценка максимального правдоподобия:
Исходные данные:
- ОМП
Метод моментов:
Оценка параметра :
Смещение:
Отсюда получаем, что оценка - несмещенная
Задание 1.4
|
|
, где |
- распределение Стьюдента с |
степенями свободы. |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задание 1.5
In [92]: #Таблица 1
from IPython.display import Image Image('2-4.png')
Out[92]:
Отсюда получаем, что гипотеза |
- не подходит. |
In [93]: from scipy.stats import chi2 print(1 - chi2.cdf(17.24, 3))
0.0006307899675317419
Задание 1.6
, где - ОМП
In [95]: #Таблица 1.1
from IPython.display import Image Image('2-10.png')
Out[95]:
Отсюда получаем, что гипотеза |
- не подходит. |
In [11]: from scipy.stats import chi2 print(1 - chi2.cdf(81.27,2 ))
0.0
Задание 1.7
- альтернатива
Отюда получаем, что |
- МДС |
||
Поскольку |
|
(статистика убывает) , то |
|
|
|||
Критерий: |
|
|
|
Где если |
|
|
|
, то |
|||||||||
|
|
|
|||||||||||
По ЦПТ: |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
In [16]: print((1.29*(0.5**0.5))/50 + 2)
2.018243354954613 |
|
|
|
Отсюда получим, что |
следовательно |
. Гипотеза |
отвергается |
Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона: |
|
Поменяем основную и альтернативную гипотезы:
Тогда получим:
Отюда получаем, что |
- МДС |
||
Поскольку |
|
(статистика возрастает) , то |
|
|
|||
Критерий : |
|
|
|
Где если |
|
|
|
, то |
|||||||||
|
|
|
|||||||||||
По ЦПТ: |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
In [9]: print((1.29*(0.5**0.5))/50 + 0.5)
0.5182433549546129 |
|
|
|
Отсюда получим, что |
следовательно |
. Гипотеза |
не отвергается |
Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона: |
|
Задание 1.8
Семейство геометрических распределений:
Задание 1.8.1
Оценка максимального правдоподобия:
Исходные данные:
- ОМП
Метод моментов:
Оценка параметра :
Смещение:
Отсюда получаем, что оценка - несмещенная
Задание 1.8.2
, где |
|
|
|
- распределение Стьюдента с |
степенями свободы. |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задание 1.8.3
In [13]: #Таблица 1.3
from IPython.display import Image Image('2-12.png')
Out[13]:
Отсюда получаем, что гипотеза |
- не подходит. |
In [12]: from scipy.stats import chi2 print(1 - chi2.cdf(10.28,3))
0.016330014589077013
Задание 1.8.4
, где - ОМП
In [14]: #Таблица 1.4
from IPython.display import Image Image('2-13.png')
Out[14]:
Отсюда получаем, что гипотеза |
- не подходит. |
In [15]: from scipy.stats import chi2 print(1 - chi2.cdf(34.6,2))
3.06694128981988e-08
Задание 2.1
Построим вариационный ряд:
In [20]: #Вариационный ряд
str="1.54 \; 1.70 \; 0.01 \; 17.20 \; 2.57 \; 0.17 \; 1.56 \; 3.08 \; 0.25 \; 0.23 \; 8.95 \; 0.26 \; 0.00 \; 0.15 \; 0.00 \; 0.01 \; 4.13 \; 9.72 \; 0.52 \; 3.20 \; 0.10 \; 8.81 \; 0.00 \; 9.33 \; 4.71 \; 8.92 \; 4.93 \; 2.57 \; 3.49 \; 2.18 \; 1.13 \; 4.16 \; 0.09 \; 0.03 \; 9.92 \; 9.60 \; 0.02 \; 0.00 \; 1.57 \; 0.00 \; 0.32 \; 24.15 \; 0.12 \; 6.27 \; 0.04 \; 3.90 \; 1.86 \; 0.58 \; 0.23 \; 2.9 table2=str.split(" \; ")
for i in range(len(table2)): table2[i]=float(table2[i])
table2.sort() print(table2) print(len(table2)) print(sum(table2))
[0.0, 0.0, 0.0, 0.0, 0.0, 0.01, 0.01, 0.02, 0.03, 0.04, 0.09, 0.1, 0.12, 0.15, 0.17, 0.23, 0.23, 0.25, 0.26, 0.32, 0.52, 0.58, 1.13, 1.54, 1.56, 1.57, 1.7, 1.86, 2.18, 2.57, 2.57, 2.94, 3.08, 3.2, 3.49, 3.9, 4.13, 4.16, 4.71, 4.93, 6.27, 8.81, 8.92, 8.95, 9.33, 9.6, 9.72, 9.92, 17.2, 24.15]
50
167.22
In [15]: k=0
for i in range(len(table2)): if(table2[i]>=0 and table2[i]<=1.9):
k+=1 print(k)
28
In [16]: #Вариационный ряд
from IPython.display import Image Image('2-5.png')
Out[16]:
In [17]: #Эмперическая функция распределения from IPython.display import Image Image('2-6.png')
Out[17]:
In [18]: #Гистограмма
from IPython.display import Image Image('2-7.png')
Out[18]:
In [19]: #Полигон частот
from IPython.display import Image Image('2-8.png')
Out[19]:
Задание 2.2
1.Аналог математического ожидания:
2.Аналог дисперсии
In [20]: #Дисперсия sum=0 avg=3.34
for i in range(len(table2)): sum+=(table2[i]-avg)**2
print(sum/(len(table2)-1))
23.245040816326533
3.Аналог СКО:
4.Медиана
5.Асимметрия
In [ ]: #Асимметрия sum=0 avg=3.34 sigma=4.82
for i in range(len(table2)): sum+=(table2[i]-avg)**3
print((sum/(len(table2)-1))/(sigma**3))
6. Эксцесс
In [24]: #Эксцесс sum=0 avg=3.34 sigma=4.82
for i in range(len(table2)): sum+=(table2[i]-avg)**4
print((sum/(len(table2)-1))/(sigma**4)-3)
5.928552554373429
7. Вероятность
Задание 2.3
Оценка максимального правдоподобия:
Исходные данные:
Выразив получим:
- ОМП параметра
Метод моментов:
Смещение:
Поскольку |
|
, |
|
то
Отсюда получаем, что
In [27]: #https://math.stackexchange.com/questions/815193/bias-of-maximum-likelihood-estimator-of-an-exponential-distribution
#https://en.wikipedia.org/wiki/Exponential_distribution
Задание 2.4
|
|
|
, где |
|
- распределение Стьюдента с |
степенями свободы. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задание 2.5
In [19]: import math F=[]
F0=[] diff=[]
for i in range(len(table2)): F.append(0.02*(i+1))
F0.append((1-math.pow((math.e),-0.14*table2[i]))) diff.append(abs(F[i]-F0[i]))
print(max(diff))
#https://medstatistic.ru/methods/methods10.html
0.3620092711489635
Отсюда получаем, что
гипотеза отвергается
In [29]: #https://tvims.nsu.ru/oldSite/lotov/tables/tables.html
Наибольшее значение уровня значимости
Задание 2.6
In [86]: #Таблица 2
from IPython.display import Image Image('2-9.png')
Out[86]:
Отсюда получаем, что гипотеза |
- не подходит. |
In [32]: from scipy.stats import chi2 print(1 - chi2.cdf(33.722, 6))
7.612047961402801e-06
Задание 2.7
, где - ОМП
In [96]: #Таблица 2.1
from IPython.display import Image Image('2-11.png')
Out[96]:
Отсюда получаем, что гипотеза |
- подходит. |
In [98]: from scipy.stats import chi2 print(1 - chi2.cdf(10.74, 5))
0.05678579280111573
Задание 2.8
- альтернатива
Отюда получаем, что |
- МДС |
Поскольку |
(статистика убывает) , то |
Критерий: |
|
Где если |
|
|
|
, то |
|||||||||||
|
|
|
|||||||||||||
По ЦПТ: |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
In [38]: print((2.33*(3.34**0.5))/50 + 0.14)
0.22516460767243635 |
|
|
|
Отсюда получим, что |
следовательно |
. Гипотеза |
отвергается |
Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона: |
|
Поменяем основную и альтернативную гипотезы:
Отюда получаем, что |
- МДС |
Поскольку |
(статистика возрастает) , то |
Критерий: |
|
Где если |
|
|
|
, то |
|||||||||||
|
|
|
|||||||||||||
По ЦПТ: |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
In [18]: print((2.33*(3.34**0.5))/50 + 0.25)
0.33516460767243633 |
|
|
|
Отсюда получим, что |
следовательно |
. Гипотеза |
не отвергается |
Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона: |
|
Задание 2.9
Семейство гамма-распределений
Задание 2.9.1
, где - количество степеней свободы
Г |
|
|
|
|
|
Г |
Отсюда получаем, что распределение -
Оценка максимального правдоподобия:
Исходные данные:
Отсюда получаем, что |
|
|
|
- ОМП параметра |
|
|
Метод моментов:
Смещение:
Г
Г
Г |
|
|
|
Г |
|
|
|
Г |
Г |
|
|
|
Г |
|
|
|
Г |
Отсюда получаем, что
Задание 2.9.2
|
|
, где |
- распределение Стьюдента с |
степенями свободы. |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задание 2.9.3
In [28]: import math F=[]
F0=[] diff=[]
for i in range(len(table2)): F.append(0.02*(i+1))
if table2[i]!=0:#в вариационном ряды присутствуют нули, которых не должно быть
F0.append(((0.14**0.5)*math.pow(math.e,(-0.14*table2[i])/2))/((2*math.pi*table2[i])**0.5)) else:
F0.append(0.02*(i+1)) diff.append(abs(F[i]-F0[i]))
print(max(diff))
#https://medstatistic.ru/methods/methods10.html
1.3716608022566974
Отсюда получаем, что
гипотеза отвергается
In [30]: #https://tvims.nsu.ru/oldSite/lotov/tables/tables.html
Задание 2.9.4
In [31]: #Таблица 2.2
from IPython.display import Image Image('2-14.png')
Out[31]:
Отсюда получаем, что гипотеза |
- не подходит. |
In [36]: from scipy.stats import chi2 print(1 - chi2.cdf(166,63, 6))
2.1703039365661425e-10
Задание 2.9.5
, где - ОМП
In [37]: #Таблица 2.3
from IPython.display import Image Image('2-15.png')
Out[37]:
Отсюда получаем, что гипотеза |
- не подходит. |
In [35]: from scipy.stats import chi2 print(1 - chi2.cdf(166,63, 5))
1.5861367774760993e-10
Задание 2.9.6
- альтернатива
Отюда получаем, что |
- МДС |
Поскольку |
(статистика убывает) , то |
Критерий: |
|
Где если |
|
|
|
, то |
|||||||||||
|
|
|
|||||||||||||
По ЦПТ: |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
In [39]: print((2.33*(3.34**0.5))/50 + 0.14)
0.22516460767243635 |
|
|
|
Отсюда получим, что |
следовательно |
. Гипотеза |
отвергается |
Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона: |
|
Поменяем основную и альтернативную гипотезы:
Отюда получаем, что |
- МДС |
Поскольку |
(статистика возрастает) , то |
Критерий: |
|
Где если |
|
|
|
, то |
|||||||||||
|
|
|
|||||||||||||
По ЦПТ: |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
In [40]: print((2.33*(3.34**0.5))/50 + 0.25)
0.33516460767243633 |
|
|
|
Отсюда получим, что |
следовательно |
. Гипотеза |
не отвергается |
Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона: |
|
Выводы
В данной работе были рассмотрены классические методы математической статистики. В результате применения которых были получены вариационные ряды, эмперические функции распределения и гистограммы для разных наборов данных; для них были посчитаны |
аналоги мат. ожидания, дисперсии, СКО, медианы, асимметрии, эксцесса, вероятности попадания в отрезок. Были проведены оценки максимального правдоподобия для экспоненциального и |
|||
пуассоновского распределений. Для каждого из них было посчитано смещение: оказалось, что у распределения пуассона смещение отсутствует, а у экспоненциального составляет |
|
. Были построены асимптотические доверительные интервалы уровней |
и |
. Также были построены критерии значимости для простых и сложных гипотез для каждого из двух распределений соответственно. Кроме этого были получены базовые умения работы с |
|
||||
программным обеспечением "Jupyter-notebook" |
|
|
|
|