Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсовая работа ПЗМС 2022.docx
Скачиваний:
22
Добавлен:
30.07.2024
Размер:
2.46 Mб
Скачать

2.3 Вывод

В ходе выполнения работы были изучены виды распределений и рассчитаны доверительные интервалы для заданных групп данных. Были выполнены следующие задачи:

  1. Подсчитаны выборочные статистики для среднего и стандартного отклонения.

  2. Для выборочного среднего подсчитаны границы доверительного интервала по правилу нормального распределения и по правилу t-распределения Стьюдента.

  3. Для выборочного среднеквадратического отклонения подсчитаны границы доверительного интервала по оценке -распределения.

3 Проверка гипотез о распределенности набора данных. Тесты на распределение

3.1 Постановка задачи

  1. Скачать папку с исходными данными. В папке шесть файлов с данными. Данные имеют различные распределения:

  • 1 и 4 файлы - нормальное распределение;

  • 2 и 5 файлы - равномерное распределение;

  • 3 и 6 файлы - показательное распределение.

  1. Необходимо идентифицировать распределения в каждом файле двумя способами:

  • с помощью критерия согласия Пирсона;

  • методом анаморфоз.

  1. Методом Пирсона для каждого файла нужно проверить истинное распределение (то, к которому действительно относятся данные в файле, оно дано выше) и одно ложное. Например, если данные в файле распределены нормально, то нужно проверить нормальное распределение и одно из двух: показательное или равномерное. При расчете теоретических частот в качестве параметров распределений брать их точечные несмещенные оценки.

  2. Создать гистограммы по каждому файлу, расчетные формулы и результаты проверки распределения.

  3. При проверке распределения методом анаморфоз нужно построить 3 графика для каждого из 6 файлов. Каждый график представлен в координатах соответствующей анаморфозы. Тот график, на котором достигнуто спрямление, соответствует истинному распределению. Для проверки качества спрямления необходимо построить линейный тренд (провести линейную регрессию) и показать значения коэффициента детерминации (𝑅2). Он должен быть близок к 1.

  4. По параметрам прямой (угловому коэффициенту и свободному члену) найти параметры распределения. Для построения анаморфозы нормального распределения мат. ожидание заменить его несмещенной точечной оценкой.

  5. В выводах сравнить результаты, полученные двумя способами.

3.2 Ход работы

В качестве исходных данных дано шесть статистических рядов. Первые три ряда имеют тридцать два значения. Остальные имеют сто двадцать восемь значений.

Перед применением тестов необходимо сформировать гистограммы данных и расcчитать число групп 𝑔, границы групп , 𝑖 ∈ , абсолютные и относительные частоты групп ( , ), 𝑗 ∈ , опираясь на значения полученной выборки данных. Узел «Квантование» в Loginom рассчитывает данные параметры автоматически, так что применение формул не требуется.

Затем был построен вариационный ряд для подсчёта абсолютных и относительных частот. Результат представлен на Рисунках 3.1-3.6.

Рисунок 3.1 — Вариационный ряд для первого набора данных

Рисунок 3.2 — Вариационный ряд для второго набора данных

Рисунок 3.3 — Вариационный ряд для третьего набора данных

Рисунок 3.4 — Вариационный ряд для четвертого набора данных

Рисунок 3.5 — Вариационный ряд для пятого набора данных

Рисунок 3.6 — Вариационный ряд для шестого набора данных

После расчета вариационного ряда необходимо визуализировать практическое приближенное распределение значений выборки в виде гистограммы. Результат построения представлен на Рисунках 3.7-3.12.

Рисунок 3.7 — Гистограмма для первого набора данных

Рисунок 3.8 — Гистограмма для второго набора данных

Рисунок 3.9 — Гистограмма для третьего набора данных

Рисунок 3.10 — Гистограмма для четвертого набора данных

Рисунок 3.11 — Гистограмма для пятого набора данных

Рисунок 3.12 — Гистограмма для шестого набора данных

Далее была найдена точечная оценка математического ожидания по формуле (3.1):

(3.1)

где — порядковый номер значения в выборке;

— значение ряда данных;

— вероятность выпадения значения.

Затем были рассчитаны точечные оценки дисперсии по формуле (3.2):

(3.2)

где — порядковый номер значения в выборке;

— значение ряда данных;

— точечная оценка математического ожидания;

— вероятность выпадения значения.

Квадратный корень из оценки дисперсии дает оценку среднеквадратического отклонения. Все расчеты были сделаны с помощью узлов «Калькулятор» и «Группировка». Результаты представлены в Таблице 3.1.

Таблица 3.1 — Точечные оценки параметров генеральной совокупности имеющихся выборок

выборки

1

-1,06

5,98

2,45

2

-1,55

4,13

2,03

3

3,52

24,87

4,99

4

-1,34

11,22

3,35

5

0,11

27,15

5,21

6

4,42

20,31

4,51

Принадлежность выборок к известному распределению была определена при помощи критерия согласия Пирсона по формуле (3.3):

(3.3)

где — теоретические частоты попадания в i-ый интервал;

— реальные частоты попадания в i-ый интервал.

Теоретическая частота — это количество элементов из предполагаемого нами распределения, попавших в данный интервал. При этом в качестве параметров теоретического распределения используются рассчитанные нами ранее их точечные оценки. Из этого следует формула для расчёта теоретических частот:

где — параметры теоретического распределения;

— функция плотности теоретического распределения;

— функция вероятности теоретического распределения.

Рассчитанные теоретические частоты, значения критерия Пирсона, критические значения и сделанные на основе этого выводы представлены в Таблице 3.2.

Таблица 3.2 — Гипотезы, значения критериев и выводы, сделанные на их основе

Выборка № 1. H0:

Вывод

1

0.67

5.24

7.82

, принимается H0 о том, что выборка распределяется по нормальному закону.

1

3.17

8

7.88

15

10.24

5

6.98

2

2.49

Выборка № 1. H0:

Вывод

1

5.33

18.25

7.82

, отвергается H0 о том, что выборка распределяется по равномерному закону.

1

5.33

8

5.33

15

5.33

5

5.33

2

5.33

Выборка № 2. H0:

Вывод

4

5.33

2.88

7.82

, принимается H0 о том, что выборка распределяется по равномерному закону.

6

5.33

7

5.33

2

5.33

9

5.33

4

5.33

Выборка № 2. H0:

Вывод

4

2.56

10.4

7.82

, отвергается H0 о том, что выборка распределяется по нормальному закону.

6

4.87

7

6.79

2

6.92

9

5.17

4

2.82

Выборка № 3. H0:

Вывод

19

21.15

8.548

9.488

, принимается H0 о том, что выборка распределяется по экспоненциальному закону.

10

6.72

2

2.13

0

0.68

0

0.22

1

0.07

Выборка № 3. H0:

Вывод

19

11.72

24.53

7.81

, отвергается H0 о том, что выборка распределяется по нормальному закону.

10

10.12

2

3.4

0

0.44

0

0.22

1

0.07

Продолжение таблицы 3.2

Выборка № 4. H0:

Вывод

2

6

3.907

11.07

, принимается H0 о том, что выборка распределяется по нормальному закону.

16

15.44

31

26.92

33

31.81

29

25.49

12

13.84

4

5.09

1

1.27

Выборка № 4. H0:

Вывод

2

16

51.25

11.07

, отвергается H0 о том, что выборка распределяется по равномерному закону.

16

16

31

16

33

16

29

16

12

16

4

16

1

16

Выборка № 5. H0:

Вывод

9

16

5.13

11.07

, принимается H0 о том, что выборка распределяется по равномерному закону.

16

16

21

16

11

16

24

16

20

16

15

16

12

16

Выборка № 5. H0:

Вывод

9

6.65

36.45

11.07

, отвергается H0 о том, что выборка распределяется по нормальному закону.

16

11.76

21

17.29

11

21.16

24

21.56

20

18.28

15

12.9

12

7.58

Выборка № 6. H0:

Вывод

44

63.65

3.44

12.59

, принимается H0 о том, что выборка распределяется по экспоненциальному закону.

45

31.92

20

16.01

10

8.03

5

4.03

2

2.02

Продолжение таблицы 3.2

1

1.01

1

0.51

Выборка № 6. H0:

Вывод

44

16

248.62

11.07

, отвергается H0 о том, что выборка распределяется по равномерному закону.

45

16

20

16

10

16

5

16

2

16

1

16

1

16

Проверим гипотезу о распределении выборки при помощи анаморфоз. Анаморфоза нормального распределения представлена в формуле (3.4):

(3.4)

В данном случае при построении анаморфозы нормального распределения заменяется точечной, полученной ранее.

Анаморфоза равномерного распределения представлена в формуле (3.5):

(3.5)

Анаморфоза экспоненциального распределения представлена в формуле (3.6):

(3.6)

Соответствующие анаморфозы, построенные для каждой из выборок, представлены на Рисунках 3.13-3.18.

Рисунок 3.13 — Метод анаморфоз для первой группы

Рисунок 3.14 — Метод анаморфоз для второй группы

Рисунок 3.15 — Метод анаморфоз для третьей группы

Рисунок 3.16 — Метод анаморфоз для четвертой группы

Рисунок 3.17 — Метод анаморфоз для пятой группы

Рисунок 3.18 — Метод анаморфоз для шестой группы

Итак, наибольшее спрямление имеют выборки:

  1. Первая группа — анаморфоза нормального распределения.

  2. Вторая группа — анаморфоза равномерного распределения.

  3. Третья группа — анаморфоза экспоненциального распределения.

  4. Четвертая группа — анаморфоза нормального распределения.

  5. Пятая группа — анаморфоза равномерного распределения.

  6. Шестая группа — анаморфоза экспоненциального распределения.

На основе этих предположений получаем гипотезы, представленные в Таблице 3.3.

Таблица 3.3 — Основные и альтернативные гипотезы

выборки

H0

H1

1

2

3

4

5

6

Чтобы проверить данные гипотезы, построим для выбранных ранее спрямлений линейную регрессию и вычислим коэффициент детерминации между прямой регрессии и частотами выборки. Коэффициент детерминации вычисляется по формуле (3.7):

(3.7)

где — частоты попадания в интервал с серединой ;

— ордината линии регрессии в точке .

Угловой коэффициент и смещение построенных линий регрессии, рассчитанный коэффициент детерминации, а также сделанный на его основе вывод о нулевой гипотезе представлены в Таблице 3.4.

Таблица 3.4 — Коэффициенты прямой регрессии, коэффициент детерминации и вывод относительно нулевой гипотезы

выборки

a

b

Вывод

1

0.1

0.73

0.94

> 0.8, принимается H0 о том, что выборка распределена нормально

2

0.14

0.82

0.98

> 0.8, принимается H0 о том, что выборка распределена равномерно

3

-0.11

-0.98

0.6

< 0.8, отвергается H0 о том, что выборка распределена экспоненциально

4

-0.04

-1.35

0.95

> 0.8, принимается H0 о том, что выборка распределена нормально

5

0.06

-0.54

0.99

> 0.8, принимается H0 о том, что выборка распределена равномерно

6

-0.2

0.66

0.77

> 0.8, принимается H0 о том, что выборка распределена экспоненциально

Из коэффициентов прямой линейной регрессии найдём оценки параметров генеральной совокупности выборок.

Оценку стандартного отклонение выборок, распределённых нормально, рассчитаем по формуле (3.8):

(3.8)

где — минимальный элемент выборки.

Полученные оценки стандартного отклонения 1-ой и 4-ой выборок равны 3.11 и 3.4 соответственно.

Оценку параметров a и b равномерного распределения найдём как минимальный и максимальный элемент выборки соответственно. Для 2-ой выборки a и b равно -4.87 и 1.63, для 5-ой — -8.88 и 8.78.

Оценку коэффициента экспоненциального распределения найдём по формуле (3.9):

(3.9)

Полученные коэффициенты для 3-ей и 6-ой выборок равны 0.12 и 0.2 соответственно.

Соседние файлы в предмете Прикладные задачи математической статистики