Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ДОП / ДОП_СметанниковДЕ_7331.docx
Скачиваний:
0
Добавлен:
27.06.2025
Размер:
552.08 Кб
Скачать

Министерство науки и высшего образования Российской Федерации

Федеральное государственное автономное образовательное учреждение

высшего образования

ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ СИСТЕМ

УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ (ТУСУР)

Кафедра комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС)

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ

Отчет по индивидуальному заданию

по дисциплине «Теория вероятностей и математическая статистика»

Студент гр. 733-1

__________ Сметанников Д.Е

«___» __________ 2025 г.

Руководитель

Доцент каф. КИБЭВС, к.т.н.

_______ __________ Ю.В. Шабля

оценка

«___» __________ 2025 г.

Томск 2025

Оглавление

Введение 3

1 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 4

2 ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ 10

3 КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ 13

Заключение 20

Введение

Целью работы является закрепление полученных теоретических знаний в области математической статистики на примере выполнения практических задач с помощью специализированного программного обеспечения.

Задание:

1. Выбрать программное обеспечение для выполнения индивидуального задания;

2. Сформулировать исследуемый процесс, определить целевую функцию и влияющие факторы, сформировать выборку данных;

3. Выполнить проверку статистической гипотезы о виде закона распределения;

4. Провести однофакторный дисперсионный анализ;

5. Провести корреляционный и регрессионный анализ.

В качестве исследуемого процесса предлагается рассмотреть работу программы, реализующей сортировку пузырьком для массива убывающих чисел. Целевая функция (выходной параметр) – время сортировки массива. Фактор (входной параметр) – размер массива.

Для выполнения индивидуального задания выбрана программа для работы с электронными таблицами «Microsoft Excel».

1 Проверка статистических гипотез

Время сортировки массива принимает разные значения даже при одинаковых значениях входных параметров. Следовательно, можно принять время сортировки массива за некоторую случайную величину, которую обозначим как . Далее исследуем вид закона распределения случайной величины . Для этого с помощью исследуемой программы сформируем выборку при фиксированном значении входного параметра (размер массива элементов) с многократным повторением ( ). Фрагмент с результатами работы программы представлен на рисунке 1.1.

Рисунок 1.1 – Фрагмент с результатами работы программы

Все полученные значения были перенесены в «Microsoft Exсel». Так как случайная величина Y является непрерывной, то в полученной выборке присутствует большое значение различных значений случайной величины с малыми частотами их появления. Такую выборку невозможно исследовать на принадлежность к какому-либо виду закона распределения. Поэтому сгруппируем данные выборки, распределив их на равные интервалы значений, и посчитаем соответствующие частоты попадания в каждый интервал. Количество интервалов определяется по правилу Стёрджеса:

где – объем выборки. Тогда для исследуемой выборки получаем

Полученное статистическое распределение выборки в виде интервального ряда представлено на рисунке 1.2.

Рисунок 1.2 – Статистическое распределение выборки

Далее на основе полученного статистического распределения выборки была построена гистограмма частот (рисунок 1.3).

Рисунок 1.3 – Гистограмма частот

Исходя из графического представления полученной гистограммы частот, можно сделать следующие выводы о возможном законе распределения случайной величины : наиболее вероятный закон распределения – экспоненциальный, т.к. присутствуют характерные признаки, а именно:

  • Резкий спад частот при увеличении значения;

  • Мода и меридиан смещены к началу оси X;

Далее проверим статистическую гипотезу о виде закона распределения по критерию Пирсона. В качестве проверяемых законов распределения рассмотрим равномерное и нормальное распределения.

Непрерывная случайная величина , распределенная по равномерному закону, определяется двумя параметрами ( ) и имеет следующие функцию плотности распределения вероятностей и функцию распределения вероятностей:

Для получения оценок параметров и равномерного распределения воспользуемся методом наибольшего правдоподобия:

Вычислим теоретические частоты попадания в интервал для равномерного распределения с параметрами и при выборке объема по формуле:

Вычислим расчетное значение критерия Пирсона по формуле

=

Определим критическое значение критерия Пирсона при уровне значимости по формуле

На рисунке 1.4 представлены подробности промежуточных вычислений.

Рисунок 1.4 – Расчеты для равномерного закона распределения

Так как > , то H0, говорящее что распределение равномерное, отвергается.

Непрерывная случайная величина , распределенная по нормальному закону, определяется двумя параметрами ( ) и имеет следующие функцию плотности распределения вероятностей и функцию распределения вероятностей:

Для получения оценок параметров и нормального распределения воспользуемся методом наибольшего правдоподобия:

Вычислим теоретические частоты попадания в интервал для нормального распределения с параметрами и при выборке объема по формуле:

Вычислим расчетное значение критерия Пирсона по формуле

Определим критическое значение критерия Пирсона при уровне значимости по формуле

На рисунке 1.5 представлены подробности промежуточных вычислений.

Рисунок 1.5 – Расчеты для нормального закона распределения

Так как > , то H0, говорящее что распределение нормальное, отвергается.

Соседние файлы в папке ДОП