Добавил:
north memphis Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ИДЗ_2 / STATAN_IDZ_2

.pdf
Скачиваний:
3
Добавлен:
24.12.2024
Размер:
517.32 Кб
Скачать

Практическая работа №2 Классические методы математической статистики

Выполнил студент . Вариант №11

Цель работы

Научится применять методы математической статистики для решения задач статистического анализа; сформировать навыки реализации методов с помощью прикладных программных пакетов.

Постановка задачи

Для полученных в результате эксперимента наборов данных выполнить статистическую обработку. Полученные результаты содержательно проинтерпретировать

1. В результате эксперимента получены данные, приведенные в таблице 1.

Построить вариационный ряд, эмпирическую функцию распределения и гистограмму частот.

Вычислить выборочные аналоги следующих числовых характеристик: мат. ожидания, дисперсии, СКО, медианы, асимметрии, эксцесса, вероятности

.

В предположении, что исходные наблюдения являются выборкой из распределения Пуассона, построить оценку максимального правдоподобия параметра

, а также оценку по методу моментов. Найти смещение оценок.

Построить асимптотический доверительный интервал уровня доверия

для параметра на базе оценки максимального правдоподобия.

 

Используя гистограмму частот, построить критерий значимости

проверки простой гипотезы согласия с распределением Пуассона с параметром . Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором еще нет оснований отвергнуть данную гипотезу.

Построить наиболее мощный критерий проверки простой гипотезы пуассоновости с параметром

при альтернативе пуассоновости с параметром

. Проверить гипотезу на уровне значимости . Что получится, если поменять местами основную и альтернативную гипотезы?

В пунктах (c)-(f) заменить семейство распределений Пуассона на семейство геометрических распределений:

Таблица 1.

 

 

 

 

 

 

 

 

2. В результате эксперимента получены данные, приведенные в таблице 2.

 

 

 

 

 

 

 

Построить вариационный ряд, эмпирическую функцю распределения,

гистограмму и полигон частот с шагом .

 

 

Вычислить выборочные аналоги следующих числовых характеристик: мат. ожидания, дисперсии, СКО, медианы, асимметрии, эксцесса, вероятности

 

В предположении, что исходные наблюдения являются выборкой из показательного распределения, построить оценку максимального правдоподобия параметра

и соответствующую оценку по методу моментов. Найти смещение оценок.

Построить асимптотический доверительный интервал уровня доверия

для параметра на базе оценки максимального правдоподобия.

 

. Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором еще нет оснований отвергнуть данную гипотезу.

С использованием теоремы Колмогорова построить критерий значимости проверки простой гипотезы согласия с показательным распределением с параметром

Используя гистограммы частот, построить критерий значимости

проверки простой гипотезы согласия с показательным распределением. Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором еще нет оснований отвергнуть данную гипотезу.

Построить наиболее мощный критерий проверки простой гипотезы о показательности с параметром

при альтернативе показательности с параметром

. Проверить гипотезу на уровне значимости . Что получится, если поменять местами основную и альтернативную гипотезы?

В пунктах (с)-(h) заменить семейство показательных распределений на семейство гамма-распределений с плотностями

 

 

(использовать таблицу распределений )

 

Таблица 2.

 

 

 

 

 

 

 

 

Выполнение работы

Каждый пункт работы выполняется с помощью кода.

Задание 1.1

Построим вариационный ряд, эмперическую функцию распределения и гистограмму частот:

In [1]: #Вариационный ряд

str="1 1 1 1 0 0 0 1 0 1 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 2 0 2 0 0 0 0 2 0 1 0 1 2 2 3" table1=str.split(" ")

for i in range(len(table1)): table1[i]=int(table1[i])

table1.sort() print(table1) print(sum(table1))

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3]

25

In [19]: #Вариационный ряд

from IPython.display import Image Image('2-1.png')

Out[19]:

In [20]: #Эмперическая ункция распределения

from IPython.display import Image Image('2-2.png')

Out[20]:

In [21]: #Гистограмма

from IPython.display import Image Image('2-3.png')

Out[21]:

Задание 1.2

1. Аналог математического ожидания:

2. Аналог дисперсии

In [21]: #Дисперсия sum=0 avg=0.5

for i in range(len(table1)): sum+=(table1[i]-avg)**2

print(sum/(len(table1)-1))

0.6632653061224489

3.Аналог СКО:

4.Медиана

5.Асимметрия

In [4]: #Асимметрия sum=0 avg=0.5 sigma=0.81

for i in range(len(table1)): sum+=(table1[i]-avg)**3

print((sum/(len(table1)-1))/(sigma**3))

1.3824561476269621

6. Эксцесс

In [23]: #Эксцесс sum=0 avg=0.5 sigma=0.81

for i in range(len(table1)): sum+=(table1[i]-avg)**4

print((sum/(len(table1)-1))/(sigma**4)-3)

0.6564448006080053

7. Вероятность

Задание 1.3

Оценка максимального правдоподобия:

Исходные данные:

- ОМП

Метод моментов:

Оценка параметра :

Смещение:

Отсюда получаем, что оценка - несмещенная

Задание 1.4

 

 

, где

- распределение Стьюдента с

степенями свободы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание 1.5

In [92]: #Таблица 1

from IPython.display import Image Image('2-4.png')

Out[92]:

Отсюда получаем, что гипотеза

- не подходит.

In [93]: from scipy.stats import chi2 print(1 - chi2.cdf(17.24, 3))

0.0006307899675317419

Задание 1.6

, где - ОМП

In [95]: #Таблица 1.1

from IPython.display import Image Image('2-10.png')

Out[95]:

Отсюда получаем, что гипотеза

- не подходит.

In [11]: from scipy.stats import chi2 print(1 - chi2.cdf(81.27,2 ))

0.0

Задание 1.7

- альтернатива

Отюда получаем, что

- МДС

Поскольку

 

(статистика убывает) , то

 

Критерий:

 

 

 

Где если

 

 

 

, то

 

 

 

По ЦПТ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

In [16]: print((1.29*(0.5**0.5))/50 + 2)

2.018243354954613

 

 

 

Отсюда получим, что

следовательно

. Гипотеза

отвергается

Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона:

 

Поменяем основную и альтернативную гипотезы:

Тогда получим:

Отюда получаем, что

- МДС

Поскольку

 

(статистика возрастает) , то

 

Критерий :

 

 

 

Где если

 

 

 

, то

 

 

 

По ЦПТ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

In [9]: print((1.29*(0.5**0.5))/50 + 0.5)

0.5182433549546129

 

 

 

Отсюда получим, что

следовательно

. Гипотеза

не отвергается

Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона:

 

Задание 1.8

Семейство геометрических распределений:

Задание 1.8.1

Оценка максимального правдоподобия:

Исходные данные:

- ОМП

Метод моментов:

Оценка параметра :

Смещение:

Отсюда получаем, что оценка - несмещенная

Задание 1.8.2

, где

 

 

 

- распределение Стьюдента с

степенями свободы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание 1.8.3

In [13]: #Таблица 1.3

from IPython.display import Image Image('2-12.png')

Out[13]:

Отсюда получаем, что гипотеза

- не подходит.

In [12]: from scipy.stats import chi2 print(1 - chi2.cdf(10.28,3))

0.016330014589077013

Задание 1.8.4

, где - ОМП

In [14]: #Таблица 1.4

from IPython.display import Image Image('2-13.png')

Out[14]:

Отсюда получаем, что гипотеза

- не подходит.

In [15]: from scipy.stats import chi2 print(1 - chi2.cdf(34.6,2))

3.06694128981988e-08

Задание 2.1

Построим вариационный ряд:

In [20]: #Вариационный ряд

str="1.54 \; 1.70 \; 0.01 \; 17.20 \; 2.57 \; 0.17 \; 1.56 \; 3.08 \; 0.25 \; 0.23 \; 8.95 \; 0.26 \; 0.00 \; 0.15 \; 0.00 \; 0.01 \; 4.13 \; 9.72 \; 0.52 \; 3.20 \; 0.10 \; 8.81 \; 0.00 \; 9.33 \; 4.71 \; 8.92 \; 4.93 \; 2.57 \; 3.49 \; 2.18 \; 1.13 \; 4.16 \; 0.09 \; 0.03 \; 9.92 \; 9.60 \; 0.02 \; 0.00 \; 1.57 \; 0.00 \; 0.32 \; 24.15 \; 0.12 \; 6.27 \; 0.04 \; 3.90 \; 1.86 \; 0.58 \; 0.23 \; 2.9 table2=str.split(" \; ")

for i in range(len(table2)): table2[i]=float(table2[i])

table2.sort() print(table2) print(len(table2)) print(sum(table2))

[0.0, 0.0, 0.0, 0.0, 0.0, 0.01, 0.01, 0.02, 0.03, 0.04, 0.09, 0.1, 0.12, 0.15, 0.17, 0.23, 0.23, 0.25, 0.26, 0.32, 0.52, 0.58, 1.13, 1.54, 1.56, 1.57, 1.7, 1.86, 2.18, 2.57, 2.57, 2.94, 3.08, 3.2, 3.49, 3.9, 4.13, 4.16, 4.71, 4.93, 6.27, 8.81, 8.92, 8.95, 9.33, 9.6, 9.72, 9.92, 17.2, 24.15]

50

167.22

In [15]: k=0

for i in range(len(table2)): if(table2[i]>=0 and table2[i]<=1.9):

k+=1 print(k)

28

In [16]: #Вариационный ряд

from IPython.display import Image Image('2-5.png')

Out[16]:

In [17]: #Эмперическая функция распределения from IPython.display import Image Image('2-6.png')

Out[17]:

In [18]: #Гистограмма

from IPython.display import Image Image('2-7.png')

Out[18]:

In [19]: #Полигон частот

from IPython.display import Image Image('2-8.png')

Out[19]:

Задание 2.2

1.Аналог математического ожидания:

2.Аналог дисперсии

In [20]: #Дисперсия sum=0 avg=3.34

for i in range(len(table2)): sum+=(table2[i]-avg)**2

print(sum/(len(table2)-1))

23.245040816326533

3.Аналог СКО:

4.Медиана

5.Асимметрия

In [ ]: #Асимметрия sum=0 avg=3.34 sigma=4.82

for i in range(len(table2)): sum+=(table2[i]-avg)**3

print((sum/(len(table2)-1))/(sigma**3))

6. Эксцесс

In [24]: #Эксцесс sum=0 avg=3.34 sigma=4.82

for i in range(len(table2)): sum+=(table2[i]-avg)**4

print((sum/(len(table2)-1))/(sigma**4)-3)

5.928552554373429

7. Вероятность

Задание 2.3

Оценка максимального правдоподобия:

Исходные данные:

Выразив получим:

- ОМП параметра

Метод моментов:

Смещение:

Поскольку

 

,

 

то

Отсюда получаем, что

In [27]: #https://math.stackexchange.com/questions/815193/bias-of-maximum-likelihood-estimator-of-an-exponential-distribution

#https://en.wikipedia.org/wiki/Exponential_distribution

Задание 2.4

 

 

 

, где

 

- распределение Стьюдента с

степенями свободы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание 2.5

In [19]: import math F=[]

F0=[] diff=[]

for i in range(len(table2)): F.append(0.02*(i+1))

F0.append((1-math.pow((math.e),-0.14*table2[i]))) diff.append(abs(F[i]-F0[i]))

print(max(diff))

#https://medstatistic.ru/methods/methods10.html

0.3620092711489635

Отсюда получаем, что

гипотеза отвергается

In [29]: #https://tvims.nsu.ru/oldSite/lotov/tables/tables.html

Наибольшее значение уровня значимости

Задание 2.6

In [86]: #Таблица 2

from IPython.display import Image Image('2-9.png')

Out[86]:

Отсюда получаем, что гипотеза

- не подходит.

In [32]: from scipy.stats import chi2 print(1 - chi2.cdf(33.722, 6))

7.612047961402801e-06

Задание 2.7

, где - ОМП

In [96]: #Таблица 2.1

from IPython.display import Image Image('2-11.png')

Out[96]:

Отсюда получаем, что гипотеза

- подходит.

In [98]: from scipy.stats import chi2 print(1 - chi2.cdf(10.74, 5))

0.05678579280111573

Задание 2.8

- альтернатива

Отюда получаем, что

- МДС

Поскольку

(статистика убывает) , то

Критерий:

 

Где если

 

 

 

, то

 

 

 

По ЦПТ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

In [38]: print((2.33*(3.34**0.5))/50 + 0.14)

0.22516460767243635

 

 

 

Отсюда получим, что

следовательно

. Гипотеза

отвергается

Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона:

 

Поменяем основную и альтернативную гипотезы:

Отюда получаем, что

- МДС

Поскольку

(статистика возрастает) , то

Критерий:

 

Где если

 

 

 

, то

 

 

 

По ЦПТ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

In [18]: print((2.33*(3.34**0.5))/50 + 0.25)

0.33516460767243633

 

 

 

Отсюда получим, что

следовательно

. Гипотеза

не отвергается

Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона:

 

Задание 2.9

Семейство гамма-распределений

Задание 2.9.1

, где - количество степеней свободы

Г

 

 

 

 

 

Г

Отсюда получаем, что распределение -

Оценка максимального правдоподобия:

Исходные данные:

Отсюда получаем, что

 

 

 

- ОМП параметра

 

 

Метод моментов:

Смещение:

Г

Г

Г

 

 

 

Г

 

 

 

Г

Г

 

 

 

Г

 

 

 

Г

Отсюда получаем, что

Задание 2.9.2

 

 

, где

- распределение Стьюдента с

степенями свободы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание 2.9.3

In [28]: import math F=[]

F0=[] diff=[]

for i in range(len(table2)): F.append(0.02*(i+1))

if table2[i]!=0:#в вариационном ряды присутствуют нули, которых не должно быть

F0.append(((0.14**0.5)*math.pow(math.e,(-0.14*table2[i])/2))/((2*math.pi*table2[i])**0.5)) else:

F0.append(0.02*(i+1)) diff.append(abs(F[i]-F0[i]))

print(max(diff))

#https://medstatistic.ru/methods/methods10.html

1.3716608022566974

Отсюда получаем, что

гипотеза отвергается

In [30]: #https://tvims.nsu.ru/oldSite/lotov/tables/tables.html

Задание 2.9.4

In [31]: #Таблица 2.2

from IPython.display import Image Image('2-14.png')

Out[31]:

Отсюда получаем, что гипотеза

- не подходит.

In [36]: from scipy.stats import chi2 print(1 - chi2.cdf(166,63, 6))

2.1703039365661425e-10

Задание 2.9.5

, где - ОМП

In [37]: #Таблица 2.3

from IPython.display import Image Image('2-15.png')

Out[37]:

Отсюда получаем, что гипотеза

- не подходит.

In [35]: from scipy.stats import chi2 print(1 - chi2.cdf(166,63, 5))

1.5861367774760993e-10

Задание 2.9.6

- альтернатива

Отюда получаем, что

- МДС

Поскольку

(статистика убывает) , то

Критерий:

 

Где если

 

 

 

, то

 

 

 

По ЦПТ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

In [39]: print((2.33*(3.34**0.5))/50 + 0.14)

0.22516460767243635

 

 

 

Отсюда получим, что

следовательно

. Гипотеза

отвергается

Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона:

 

Поменяем основную и альтернативную гипотезы:

Отюда получаем, что

- МДС

Поскольку

(статистика возрастает) , то

Критерий:

 

Где если

 

 

 

, то

 

 

 

По ЦПТ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

In [40]: print((2.33*(3.34**0.5))/50 + 0.25)

0.33516460767243633

 

 

 

Отсюда получим, что

следовательно

. Гипотеза

не отвергается

Формулировка наиболее мощного критерия согласно лемме Неймана-Пирсона:

 

Выводы

В данной работе были рассмотрены классические методы математической статистики. В результате применения которых были получены вариационные ряды, эмперические функции распределения и гистограммы для разных наборов данных; для них были посчитаны

аналоги мат. ожидания, дисперсии, СКО, медианы, асимметрии, эксцесса, вероятности попадания в отрезок. Были проведены оценки максимального правдоподобия для экспоненциального и

пуассоновского распределений. Для каждого из них было посчитано смещение: оказалось, что у распределения пуассона смещение отсутствует, а у экспоненциального составляет

 

. Были построены асимптотические доверительные интервалы уровней

и

. Также были построены критерии значимости для простых и сложных гипотез для каждого из двух распределений соответственно. Кроме этого были получены базовые умения работы с

 

программным обеспечением "Jupyter-notebook"

 

 

 

 

Соседние файлы в папке ИДЗ_2