Добавил:

RikaHayashi Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

МИРЭА - Российский технологический университет

Предмет:

Прикладные задачи математической статистики

Файл:

Курсовая работа ПЗМС 2022.docx

Скачиваний:

Добавлен:

30.07.2024

Размер:

2.46 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 95 6 7 8 9 > Следующая >>>

2.3 Вывод

В ходе выполнения работы были изучены виды распределений и рассчитаны доверительные интервалы для заданных групп данных. Были выполнены следующие задачи:

Подсчитаны выборочные статистики для среднего и стандартного отклонения.
Для выборочного среднего подсчитаны границы доверительного интервала по правилу нормального распределения и по правилу t-распределения Стьюдента.
Для выборочного среднеквадратического отклонения подсчитаны границы доверительного интервала по оценке -распределения.

3 Проверка гипотез о распределенности набора данных. Тесты на распределение

3.1 Постановка задачи

Скачать папку с исходными данными. В папке шесть файлов с данными. Данные имеют различные распределения:

1 и 4 файлы - нормальное распределение;
2 и 5 файлы - равномерное распределение;
3 и 6 файлы - показательное распределение.

Необходимо идентифицировать распределения в каждом файле двумя способами:

с помощью критерия согласия Пирсона;
методом анаморфоз.

Методом Пирсона для каждого файла нужно проверить истинное распределение (то, к которому действительно относятся данные в файле, оно дано выше) и одно ложное. Например, если данные в файле распределены нормально, то нужно проверить нормальное распределение и одно из двух: показательное или равномерное. При расчете теоретических частот в качестве параметров распределений брать их точечные несмещенные оценки.
Создать гистограммы по каждому файлу, расчетные формулы и результаты проверки распределения.
При проверке распределения методом анаморфоз нужно построить 3 графика для каждого из 6 файлов. Каждый график представлен в координатах соответствующей анаморфозы. Тот график, на котором достигнуто спрямление, соответствует истинному распределению. Для проверки качества спрямления необходимо построить линейный тренд (провести линейную регрессию) и показать значения коэффициента детерминации (𝑅2). Он должен быть близок к 1.
По параметрам прямой (угловому коэффициенту и свободному члену) найти параметры распределения. Для построения анаморфозы нормального распределения мат. ожидание заменить его несмещенной точечной оценкой.
В выводах сравнить результаты, полученные двумя способами.

3.2 Ход работы

В качестве исходных данных дано шесть статистических рядов. Первые три ряда имеют тридцать два значения. Остальные имеют сто двадцать восемь значений.

Перед применением тестов необходимо сформировать гистограммы данных и расcчитать число групп 𝑔, границы групп , 𝑖 ∈ , абсолютные и относительные частоты групп ( , ), 𝑗 ∈ , опираясь на значения полученной выборки данных. Узел «Квантование» в Loginom рассчитывает данные параметры автоматически, так что применение формул не требуется.

Затем был построен вариационный ряд для подсчёта абсолютных и относительных частот. Результат представлен на Рисунках 3.1-3.6.

Рисунок 3.1 — Вариационный ряд для первого набора данных

Рисунок 3.2 — Вариационный ряд для второго набора данных

Рисунок 3.3 — Вариационный ряд для третьего набора данных

Рисунок 3.4 — Вариационный ряд для четвертого набора данных

Рисунок 3.5 — Вариационный ряд для пятого набора данных

Рисунок 3.6 — Вариационный ряд для шестого набора данных

После расчета вариационного ряда необходимо визуализировать практическое приближенное распределение значений выборки в виде гистограммы. Результат построения представлен на Рисунках 3.7-3.12.

Рисунок 3.7 — Гистограмма для первого набора данных

Рисунок 3.8 — Гистограмма для второго набора данных

Рисунок 3.9 — Гистограмма для третьего набора данных

Рисунок 3.10 — Гистограмма для четвертого набора данных

Рисунок 3.11 — Гистограмма для пятого набора данных

Рисунок 3.12 — Гистограмма для шестого набора данных

Далее была найдена точечная оценка математического ожидания по формуле (3.1):

(3.1)

где — порядковый номер значения в выборке;

— значение ряда данных;

— вероятность выпадения значения.

Затем были рассчитаны точечные оценки дисперсии по формуле (3.2):

(3.2)

где — порядковый номер значения в выборке;

— значение ряда данных;

— точечная оценка математического ожидания;

— вероятность выпадения значения.

Квадратный корень из оценки дисперсии дает оценку среднеквадратического отклонения. Все расчеты были сделаны с помощью узлов «Калькулятор» и «Группировка». Результаты представлены в Таблице 3.1.

Таблица 3.1 — Точечные оценки параметров генеральной совокупности имеющихся выборок

№ выборки
1	-1,06	5,98	2,45
2	-1,55	4,13	2,03
3	3,52	24,87	4,99
4	-1,34	11,22	3,35
5	0,11	27,15	5,21
6	4,42	20,31	4,51

Принадлежность выборок к известному распределению была определена при помощи критерия согласия Пирсона по формуле (3.3):

(3.3)

где — теоретические частоты попадания в i-ый интервал;

— реальные частоты попадания в i-ый интервал.

Теоретическая частота — это количество элементов из предполагаемого нами распределения, попавших в данный интервал. При этом в качестве параметров теоретического распределения используются рассчитанные нами ранее их точечные оценки. Из этого следует формула для расчёта теоретических частот:

где — параметры теоретического распределения;

— функция плотности теоретического распределения;

— функция вероятности теоретического распределения.

Рассчитанные теоретические частоты, значения критерия Пирсона, критические значения и сделанные на основе этого выводы представлены в Таблице 3.2.

Таблица 3.2 — Гипотезы, значения критериев и выводы, сделанные на их основе

Выборка № 1. H₀:
				Вывод
1	0.67	5.24	7.82	, принимается H₀ о том, что выборка распределяется по нормальному закону.
1	3.17
8	7.88
15	10.24
5	6.98
2	2.49
Выборка № 1. H₀:
				Вывод
1	5.33	18.25	7.82	, отвергается H₀ о том, что выборка распределяется по равномерному закону.
1	5.33
8	5.33
15	5.33
5	5.33
2	5.33
Выборка № 2. H₀:
				Вывод
4	5.33	2.88	7.82	, принимается H₀ о том, что выборка распределяется по равномерному закону.
6	5.33
7	5.33
2	5.33
9	5.33
4	5.33
Выборка № 2. H₀:
				Вывод
4	2.56	10.4	7.82	, отвергается H₀ о том, что выборка распределяется по нормальному закону.
6	4.87
7	6.79
2	6.92
9	5.17
4	2.82
Выборка № 3. H₀:
				Вывод
19	21.15	8.548	9.488	, принимается H₀ о том, что выборка распределяется по экспоненциальному закону.
10	6.72
2	2.13
0	0.68
0	0.22
1	0.07
Выборка № 3. H₀:
				Вывод
19	11.72	24.53	7.81	, отвергается H₀ о том, что выборка распределяется по нормальному закону.
10	10.12
2	3.4
0	0.44
0	0.22
1	0.07

Продолжение таблицы 3.2

Выборка № 4. H₀:
				Вывод
2	6	3.907	11.07	, принимается H₀ о том, что выборка распределяется по нормальному закону.
16	15.44
31	26.92
33	31.81
29	25.49
12	13.84
4	5.09
1	1.27
Выборка № 4. H₀:
				Вывод
2	16	51.25	11.07	, отвергается H₀ о том, что выборка распределяется по равномерному закону.
16	16
31	16
33	16
29	16
12	16
4	16
1	16
Выборка № 5. H₀:
				Вывод
9	16	5.13	11.07	, принимается H₀ о том, что выборка распределяется по равномерному закону.
16	16
21	16
11	16
24	16
20	16
15	16
12	16
Выборка № 5. H₀:
				Вывод
9	6.65	36.45	11.07	, отвергается H₀ о том, что выборка распределяется по нормальному закону.
16	11.76
21	17.29
11	21.16
24	21.56
20	18.28
15	12.9
12	7.58
Выборка № 6. H₀:
				Вывод
44	63.65	3.44	12.59	, принимается H₀ о том, что выборка распределяется по экспоненциальному закону.
45	31.92
20	16.01
10	8.03
5	4.03
2	2.02

Продолжение таблицы 3.2

1	1.01
1	0.51
Выборка № 6. H₀:
				Вывод
44	16	248.62	11.07	, отвергается H₀ о том, что выборка распределяется по равномерному закону.
45	16
20	16
10	16
5	16
2	16
1	16
1	16

Проверим гипотезу о распределении выборки при помощи анаморфоз. Анаморфоза нормального распределения представлена в формуле (3.4):

(3.4)

В данном случае при построении анаморфозы нормального распределения заменяется точечной, полученной ранее.

Анаморфоза равномерного распределения представлена в формуле (3.5):

(3.5)

Анаморфоза экспоненциального распределения представлена в формуле (3.6):

(3.6)

Соответствующие анаморфозы, построенные для каждой из выборок, представлены на Рисунках 3.13-3.18.

Рисунок 3.13 — Метод анаморфоз для первой группы

Рисунок 3.14 — Метод анаморфоз для второй группы

Рисунок 3.15 — Метод анаморфоз для третьей группы

Рисунок 3.16 — Метод анаморфоз для четвертой группы

Рисунок 3.17 — Метод анаморфоз для пятой группы

Рисунок 3.18 — Метод анаморфоз для шестой группы

Итак, наибольшее спрямление имеют выборки:

Первая группа — анаморфоза нормального распределения.
Вторая группа — анаморфоза равномерного распределения.
Третья группа — анаморфоза экспоненциального распределения.
Четвертая группа — анаморфоза нормального распределения.
Пятая группа — анаморфоза равномерного распределения.
Шестая группа — анаморфоза экспоненциального распределения.

На основе этих предположений получаем гипотезы, представленные в Таблице 3.3.

Таблица 3.3 — Основные и альтернативные гипотезы

№ выборки	H₀	H₁
1
2
3
4
5
6

Чтобы проверить данные гипотезы, построим для выбранных ранее спрямлений линейную регрессию и вычислим коэффициент детерминации между прямой регрессии и частотами выборки. Коэффициент детерминации вычисляется по формуле (3.7):

(3.7)

где — частоты попадания в интервал с серединой ;

— ордината линии регрессии в точке .

Угловой коэффициент и смещение построенных линий регрессии, рассчитанный коэффициент детерминации, а также сделанный на его основе вывод о нулевой гипотезе представлены в Таблице 3.4.

Таблица 3.4 — Коэффициенты прямой регрессии, коэффициент детерминации и вывод относительно нулевой гипотезы

№ выборки	a	b		Вывод
1	0.1	0.73	0.94	> 0.8, принимается H₀ о том, что выборка распределена нормально
2	0.14	0.82	0.98	> 0.8, принимается H₀ о том, что выборка распределена равномерно
3	-0.11	-0.98	0.6	< 0.8, отвергается H₀ о том, что выборка распределена экспоненциально
4	-0.04	-1.35	0.95	> 0.8, принимается H₀ о том, что выборка распределена нормально
5	0.06	-0.54	0.99	> 0.8, принимается H₀ о том, что выборка распределена равномерно
6	-0.2	0.66	0.77	> 0.8, принимается H₀ о том, что выборка распределена экспоненциально

Из коэффициентов прямой линейной регрессии найдём оценки параметров генеральной совокупности выборок.

Оценку стандартного отклонение выборок, распределённых нормально, рассчитаем по формуле (3.8):

(3.8)

где — минимальный элемент выборки.

Полученные оценки стандартного отклонения 1-ой и 4-ой выборок равны 3.11 и 3.4 соответственно.

Оценку параметров a и b равномерного распределения найдём как минимальный и максимальный элемент выборки соответственно. Для 2-ой выборки a и b равно -4.87 и 1.63, для 5-ой — -8.88 и 8.78.

Оценку коэффициента экспоненциального распределения найдём по формуле (3.9):

(3.9)

Полученные коэффициенты для 3-ей и 6-ой выборок равны 0.12 и 0.2 соответственно.

<<< < Предыдущая 1 2 3 45 / 95 6 7 8 9 > Следующая >>>

Соседние файлы в предмете Прикладные задачи математической статистики

#
30.07.2024429.49 Кб5Доклад.pptx
#
30.07.20242.46 Mб22Курсовая работа ПЗМС 2022.docx
#
30.07.2024388.31 Кб6ПР1.docx
#
30.07.2024358.14 Кб4ПР2.docx
#
30.07.2024959.05 Кб8ПР3.docx
#
30.07.2024708.93 Кб2ПР4.docx
#
30.07.2024438.96 Кб2ПР6.docx