- •Курсовая работа
- •Задание
- •Отзыв на курсовую работу по дисциплине
- •1 Расчёт выборочных оценок и численная оценка распределений выборки
- •1.1 Постановка задачи
- •1.2 Ход работы
- •1.3 Вывод
- •2 Построение доверительных интервалов для выборочных статистик
- •2.1 Постановка задачи
- •2.2 Ход работы
- •2.3 Вывод
- •3 Проверка гипотез о распределенности набора данных. Тесты на распределение
- •3.1 Постановка задачи
- •3.2 Ход работы
- •3.3 Вывод
- •4 Генерация распределений. Проверка цпт и определений хи-квадрат, фишера и t-распределения стьюдента.
- •4.1 Постановка задачи
- •4.2 Ход работы
- •4.3 Вывод
- •5 Регрессионный анализ зависимости
- •5.1 Постановка задачи
- •5.2 Ход работы
- •5.3 Вывод
- •6 Сглаживание временных рядов
- •6.1 Постановка задачи
- •6.2 Ход работы
- •6.3 Вывод
- •Список использованных источников
2.3 Вывод
В ходе выполнения работы были изучены виды распределений и рассчитаны доверительные интервалы для заданных групп данных. Были выполнены следующие задачи:
Подсчитаны выборочные статистики для среднего и стандартного отклонения.
Для выборочного среднего подсчитаны границы доверительного интервала по правилу нормального распределения и по правилу t-распределения Стьюдента.
Для выборочного среднеквадратического отклонения подсчитаны границы доверительного интервала по оценке -распределения.
3 Проверка гипотез о распределенности набора данных. Тесты на распределение
3.1 Постановка задачи
Скачать папку с исходными данными. В папке шесть файлов с данными. Данные имеют различные распределения:
1 и 4 файлы - нормальное распределение;
2 и 5 файлы - равномерное распределение;
3 и 6 файлы - показательное распределение.
Необходимо идентифицировать распределения в каждом файле двумя способами:
с помощью критерия согласия Пирсона;
методом анаморфоз.
Методом Пирсона для каждого файла нужно проверить истинное распределение (то, к которому действительно относятся данные в файле, оно дано выше) и одно ложное. Например, если данные в файле распределены нормально, то нужно проверить нормальное распределение и одно из двух: показательное или равномерное. При расчете теоретических частот в качестве параметров распределений брать их точечные несмещенные оценки.
Создать гистограммы по каждому файлу, расчетные формулы и результаты проверки распределения.
При проверке распределения методом анаморфоз нужно построить 3 графика для каждого из 6 файлов. Каждый график представлен в координатах соответствующей анаморфозы. Тот график, на котором достигнуто спрямление, соответствует истинному распределению. Для проверки качества спрямления необходимо построить линейный тренд (провести линейную регрессию) и показать значения коэффициента детерминации (𝑅2). Он должен быть близок к 1.
По параметрам прямой (угловому коэффициенту и свободному члену) найти параметры распределения. Для построения анаморфозы нормального распределения мат. ожидание заменить его несмещенной точечной оценкой.
В выводах сравнить результаты, полученные двумя способами.
3.2 Ход работы
В качестве исходных данных дано шесть статистических рядов. Первые три ряда имеют тридцать два значения. Остальные имеют сто двадцать восемь значений.
Перед
применением тестов необходимо сформировать
гистограммы данных и расcчитать число
групп 𝑔,
границы групп
, 𝑖
∈
,
абсолютные и относительные частоты
групп (
,
),
𝑗
∈
,
опираясь на значения полученной выборки
данных. Узел «Квантование» в Loginom
рассчитывает данные параметры
автоматически, так что применение формул
не требуется.
Затем был построен вариационный ряд для подсчёта абсолютных и относительных частот. Результат представлен на Рисунках 3.1-3.6.
Рисунок 3.1 — Вариационный ряд для первого набора данных
Рисунок 3.2 — Вариационный ряд для второго набора данных
Рисунок 3.3 — Вариационный ряд для третьего набора данных
Рисунок 3.4 — Вариационный ряд для четвертого набора данных
Рисунок 3.5 — Вариационный ряд для пятого набора данных
Рисунок 3.6 — Вариационный ряд для шестого набора данных
После расчета вариационного ряда необходимо визуализировать практическое приближенное распределение значений выборки в виде гистограммы. Результат построения представлен на Рисунках 3.7-3.12.
Рисунок 3.7 — Гистограмма для первого набора данных
Рисунок 3.8 — Гистограмма для второго набора данных
Рисунок 3.9 — Гистограмма для третьего набора данных
Рисунок 3.10 — Гистограмма для четвертого набора данных
Рисунок 3.11 — Гистограмма для пятого набора данных
Рисунок 3.12 — Гистограмма для шестого набора данных
Далее была найдена точечная оценка математического ожидания по формуле (3.1):
(3.1)
где — порядковый номер значения в выборке;
— значение
ряда данных;
— вероятность выпадения значения.
Затем были рассчитаны точечные оценки дисперсии по формуле (3.2):
(3.2)
где — порядковый номер значения в выборке;
— значение ряда данных;
— точечная
оценка математического ожидания;
— вероятность выпадения значения.
Квадратный корень из оценки дисперсии дает оценку среднеквадратического отклонения. Все расчеты были сделаны с помощью узлов «Калькулятор» и «Группировка». Результаты представлены в Таблице 3.1.
Таблица 3.1 — Точечные оценки параметров генеральной совокупности имеющихся выборок
№ выборки |
|
|
|
1 |
-1,06 |
5,98 |
2,45 |
2 |
-1,55 |
4,13 |
2,03 |
3 |
3,52 |
24,87 |
4,99 |
4 |
-1,34 |
11,22 |
3,35 |
5 |
0,11 |
27,15 |
5,21 |
6 |
4,42 |
20,31 |
4,51 |
Принадлежность выборок к известному распределению была определена при помощи критерия согласия Пирсона по формуле (3.3):
(3.3)
где
— теоретические частоты попадания в
i-ый
интервал;
— реальные частоты попадания в i-ый
интервал.
Теоретическая частота — это количество элементов из предполагаемого нами распределения, попавших в данный интервал. При этом в качестве параметров теоретического распределения используются рассчитанные нами ранее их точечные оценки. Из этого следует формула для расчёта теоретических частот:
|
|
|
где
— параметры теоретического распределения;
— функция
плотности теоретического распределения;
— функция
вероятности теоретического распределения.
Рассчитанные теоретические частоты, значения критерия Пирсона, критические значения и сделанные на основе этого выводы представлены в Таблице 3.2.
Таблица 3.2 — Гипотезы, значения критериев и выводы, сделанные на их основе
Выборка
№ 1. H0:
|
||||
|
|
|
|
Вывод |
1 |
0.67 |
5.24 |
7.82 |
|
1 |
3.17 |
|||
8 |
7.88 |
|||
15 |
10.24 |
|||
5 |
6.98 |
|||
2 |
2.49 |
|||
Выборка
№ 1. H0:
|
||||
|
|
|
|
Вывод |
1 |
5.33 |
18.25 |
7.82 |
|
1 |
5.33 |
|||
8 |
5.33 |
|||
15 |
5.33 |
|||
5 |
5.33 |
|||
2 |
5.33 |
|||
Выборка № 2. H0: |
||||
|
|
|
|
Вывод |
4 |
5.33 |
2.88 |
7.82 |
, принимается H0 о том, что выборка распределяется по равномерному закону. |
6 |
5.33 |
|||
7 |
5.33 |
|||
2 |
5.33 |
|||
9 |
5.33 |
|||
4 |
5.33 |
|||
Выборка № 2. H0: |
||||
|
|
|
|
Вывод |
4 |
2.56 |
10.4 |
7.82 |
, отвергается H0 о том, что выборка распределяется по нормальному закону. |
6 |
4.87 |
|||
7 |
6.79 |
|||
2 |
6.92 |
|||
9 |
5.17 |
|||
4 |
2.82 |
|||
Выборка
№ 3. H0:
|
||||
|
|
|
|
Вывод |
19 |
21.15 |
8.548 |
9.488 |
, принимается H0 о том, что выборка распределяется по экспоненциальному закону. |
10 |
6.72 |
|||
2 |
2.13 |
|||
0 |
0.68 |
|||
0 |
0.22 |
|||
1 |
0.07 |
|||
Выборка № 3. H0: |
||||
|
|
|
|
Вывод |
19 |
11.72 |
24.53 |
7.81 |
, отвергается H0 о том, что выборка распределяется по нормальному закону. |
10 |
10.12 |
|||
2 |
3.4 |
|||
0 |
0.44 |
|||
0 |
0.22 |
|||
1 |
0.07 |
|||
Продолжение таблицы 3.2
Выборка № 4. H0: |
||||
|
|
|
|
Вывод |
2 |
6 |
3.907 |
11.07 |
, принимается H0 о том, что выборка распределяется по нормальному закону. |
16 |
15.44 |
|||
31 |
26.92 |
|||
33 |
31.81 |
|||
29 |
25.49 |
|||
12 |
13.84 |
|||
4 |
5.09
|
|||
1 |
1.27 |
|||
Выборка № 4. H0: |
||||
|
|
|
|
Вывод |
2 |
16 |
51.25 |
11.07 |
, отвергается H0 о том, что выборка распределяется по равномерному закону. |
16 |
16 |
|||
31 |
16 |
|||
33 |
16 |
|||
29 |
16 |
|||
12 |
16 |
|||
4 |
16 |
|||
1 |
16 |
|||
Выборка № 5. H0: |
||||
|
|
|
|
Вывод |
9 |
16 |
5.13 |
11.07 |
, принимается H0 о том, что выборка распределяется по равномерному закону. |
16 |
16 |
|||
21 |
16 |
|||
11 |
16 |
|||
24 |
16 |
|||
20 |
16 |
|||
15 |
16 |
|||
12 |
16 |
|||
Выборка № 5. H0: |
||||
|
|
|
|
Вывод |
9 |
6.65 |
36.45 |
11.07 |
, отвергается H0 о том, что выборка распределяется по нормальному закону. |
16 |
11.76 |
|||
21 |
17.29 |
|||
11 |
21.16 |
|||
24 |
21.56 |
|||
20 |
18.28 |
|||
15 |
12.9 |
|||
12 |
7.58 |
|||
Выборка № 6. H0: |
||||
|
|
|
|
Вывод |
44 |
63.65 |
3.44 |
12.59 |
, принимается H0 о том, что выборка распределяется по экспоненциальному закону. |
45 |
31.92 |
|||
20 |
16.01 |
|||
10 |
8.03 |
|||
5 |
4.03 |
|||
2 |
2.02 |
|||
Продолжение таблицы 3.2
1 |
1.01 |
|
|
|
1 |
0.51 |
|||
Выборка № 6. H0: |
||||
|
|
|
|
Вывод |
44 |
16 |
248.62 |
11.07 |
, отвергается H0 о том, что выборка распределяется по равномерному закону. |
45 |
16 |
|||
20 |
16 |
|||
10 |
16 |
|||
5 |
16 |
|||
2 |
16 |
|||
1 |
16 |
|||
1 |
16 |
|||
Проверим гипотезу о распределении выборки при помощи анаморфоз. Анаморфоза нормального распределения представлена в формуле (3.4):
(3.4)
В
данном случае при построении анаморфозы
нормального распределения
заменяется точечной, полученной ранее.
Анаморфоза равномерного распределения представлена в формуле (3.5):
(3.5)
Анаморфоза экспоненциального распределения представлена в формуле (3.6):
(3.6)
Соответствующие анаморфозы, построенные для каждой из выборок, представлены на Рисунках 3.13-3.18.
Рисунок 3.13 — Метод анаморфоз для первой группы
Рисунок 3.14 — Метод анаморфоз для второй группы
Рисунок 3.15 — Метод анаморфоз для третьей группы
Рисунок 3.16 — Метод анаморфоз для четвертой группы
Рисунок 3.17 — Метод анаморфоз для пятой группы
Рисунок 3.18 — Метод анаморфоз для шестой группы
Итак, наибольшее спрямление имеют выборки:
Первая группа — анаморфоза нормального распределения.
Вторая группа — анаморфоза равномерного распределения.
Третья группа — анаморфоза экспоненциального распределения.
Четвертая группа — анаморфоза нормального распределения.
Пятая группа — анаморфоза равномерного распределения.
Шестая группа — анаморфоза экспоненциального распределения.
На основе этих предположений получаем гипотезы, представленные в Таблице 3.3.
Таблица 3.3 — Основные и альтернативные гипотезы
№ выборки |
H0 |
H1 |
1 |
|
|
2 |
|
|
3 |
|
|
4 |
|
|
5 |
|
|
6 |
|
|
Чтобы проверить данные гипотезы, построим для выбранных ранее спрямлений линейную регрессию и вычислим коэффициент детерминации между прямой регрессии и частотами выборки. Коэффициент детерминации вычисляется по формуле (3.7):
(3.7)
где — частоты попадания в интервал с серединой ;
— ордината
линии регрессии в точке
.
Угловой коэффициент и смещение построенных линий регрессии, рассчитанный коэффициент детерминации, а также сделанный на его основе вывод о нулевой гипотезе представлены в Таблице 3.4.
Таблица 3.4 — Коэффициенты прямой регрессии, коэффициент детерминации и вывод относительно нулевой гипотезы
№ выборки |
a |
b |
|
Вывод |
1 |
0.1 |
0.73 |
0.94 |
> 0.8, принимается H0 о том, что выборка распределена нормально |
2 |
0.14 |
0.82 |
0.98 |
> 0.8, принимается H0 о том, что выборка распределена равномерно |
3 |
-0.11 |
-0.98 |
0.6 |
< 0.8, отвергается H0 о том, что выборка распределена экспоненциально |
4 |
-0.04 |
-1.35 |
0.95 |
> 0.8, принимается H0 о том, что выборка распределена нормально |
5 |
0.06 |
-0.54 |
0.99 |
> 0.8, принимается H0 о том, что выборка распределена равномерно |
6 |
-0.2 |
0.66 |
0.77 |
> 0.8, принимается H0 о том, что выборка распределена экспоненциально |
Из коэффициентов прямой линейной регрессии найдём оценки параметров генеральной совокупности выборок.
Оценку стандартного отклонение выборок, распределённых нормально, рассчитаем по формуле (3.8):
(3.8)
где
— минимальный элемент выборки.
Полученные оценки стандартного отклонения 1-ой и 4-ой выборок равны 3.11 и 3.4 соответственно.
Оценку параметров a и b равномерного распределения найдём как минимальный и максимальный элемент выборки соответственно. Для 2-ой выборки a и b равно -4.87 и 1.63, для 5-ой — -8.88 и 8.78.
Оценку
коэффициента
экспоненциального распределения найдём
по формуле (3.9):
(3.9)
Полученные коэффициенты для 3-ей и 6-ой выборок равны 0.12 и 0.2 соответственно.

,
принимается H0
о том, что выборка распределяется по
нормальному закону.
,
отвергается H0
о том, что выборка распределяется по
равномерному закону.