Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

лб5_СОЭ_Каширина

.docx
Скачиваний:
0
Добавлен:
20.06.2026
Размер:
80.32 Кб
Скачать

Министерство образования и науки Российской Федерации

федеральное государственное автономное образовательное учреждение

высшего образования

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ

ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»

Инженерная школа природных ресурсов

Направление подготовки 18.03.01 Химическая технология

Отделение химической инженерии

ОТЧЕТ

по лабораторной работе № 5

ПРОВЕРКА НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ

АНАЛИЗИРУЕМЫХ ДАННЫХ

Студент

Группа

ФИО

Подпись

Дата

2Д22

Каширина В.А.

Руководитель

Должность

ФИО

Ученая степень, звание

Подпись

Дата

ассистент

Богданов И.А.

к.т.н.

Томск – 2024 г.

ЦЕЛЬ:

− Проверить нормальность распределения данных (по вариантам) с использованием

критерия хи-квадрат.

− Проверить нормальность распределения данных (по вариантам) с использованием

тестов Колмогорова-Смирнова и Шапиро-Уилка.

− Проверить нормальность распределения данных (по вариантам) с использованием

графика нормальных вероятностей.

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ:

Нормальное распределение (normal distribution) – играет важную роль в анализе данных. Иногда вместо термина нормальное распределение употребляют термин гауссовское распределение в честь К. Гаусса.

Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение – отсюда и произошло одно из его названий.

Нормальное распределение зависит от двух параметров – смещения и масштаба, то есть является с математической точки зрения не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).

Нормальное распределение имеет плотность:

(1)

Где α –  среднее, σ – стандартное отклонение.

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1.

Рисунок 1. График плотности нормального распределения: среднее равно 0, стандартное отклонение 1

Поскольку нормальное распределение часто встречается на практике, то для него разработаны специальные статистические критерии проверки на «нормальность»:

  • Критерий согласия Пирсона;

  • Критерий Колмогорова-Смирнова;

  • Критерий Андерсона-Дарлинга;

  • Критерий Жака-Бера;

  • Критерий Шапиро-Вилка;

  • График нормальности – не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.

ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ:

  1. Осуществить проверку нормальности распределения данных (два параметра) с использованием критерия хи-квадрат.

  2. Осуществить проверку нормальности распределения данных (два параметра) с использованием тестов Колмогорова-Смирнова и Шапиро-Уилка.

  3. Осуществить проверку нормальности распределения данных (два параметра) с использованием графика нормальных вероятностей.

  4. Полученные результаты оформить в виде таблиц и графиков.

  5. Составить отчет о проделанной работе.

ИСХОДНЫЕ ДАННЫЕ К РАБОТЕ:

Вариант 1

Гидроочищенная

дизельная фракция

«Летняя»

Температура

вспышки

в закрытом

тигле, °С

Цетановое

число, пп

75

51,1

68

45,2

68

51,1

75

46,5

72

51,1

73

46,4

68

50,7

74

47,4

70

51,2

73

47,2

69

45,9

72

50,7

69

51,5

79

45,4

67

51,5

73

47,5

69

50,9

75

46,5

66

50,9

72

47,1

66

51,1

73

47,6

73

49,7

68

47,5

69

50,4

ПОЛУЧЕННЫЕ ДАННЫЕ:

Рисунок 1. Результат анализа, выполненного с помощью модуля Подгонки распределений

Глядя на полученный рисунок, можно сказать, что в целом распределение значений температуры вспышки в закрытом тигле гидроочищенной дизельной фракции «Летняя» не соответствует нормальному (столбики гистограммы не образуют колоколообразную фигуру). Это заключение, основанное на визуальном анализе распределения, имеет и более строгое подтверждение в виде результатов теста χ2 (хи-квадрат). В данном случае этот тест проверяет нулевую гипотезу о том, что наблюдаемое распределение анализируемого признака отличается от теоретически ожидаемого нормального распределения. Поскольку вероятность ошибиться, отклонив эту гипотезу оказалась меньше 0,05 (р = 0,00462), мы принимаем, что гипотеза действительно неверна. Иными словами, распределение значений температуры вспышки в закрытом тигле гидроочищенной дизельной фракции «Летняя» статистически отличается от нормального распределения.

Рисунок 2. Результат анализа, выполненного с помощью модуля Подгонки распределений

Глядя на полученный рисунок, можно сказать, что в целом распределение значений цетанового числа гидроочищенной дизельной фракции «Летняя» не соответствует нормальному (столбики гистограммы не образуют колоколообразную фигуру). Это заключение, основанное на визуальном анализе распределения, имеет и более строгое подтверждение в виде результатов теста χ2 (хи-квадрат). В данном случае этот тест проверяет нулевую гипотезу о том, что наблюдаемое распределение анализируемого признака отличается от теоретически ожидаемого нормального распределения. Поскольку вероятность ошибиться, отклонив эту гипотезу оказалась меньше 0,05 (р = 0,00777), мы принимаем, что гипотеза действительно неверна. Иными словами, распределение значений цетанового числа гидроочищенной дизельной фракции «Летняя» статистически отличается от нормального распределения.

Рисунок 3. Результат проверки нормальности распределения данных, выполненной при помощи модуля Описательные статистики

При р > 0,05 можно заключить, что анализируемое распределение не отличается от нормального. В примере с данными о температуре вспышки в закрытом тигле для теста Шапиро-Уилка получаем р = 0,17251, что подтверждает нормальность распределения этих данных.

Рисунок 4. Результат проверки нормальности распределения данных, выполненной при помощи модуля Описательные статистики

При р < 0,05 можно заключить, что анализируемое распределение отличается от нормального. В примере с данными о цетановом числе для теста Шапиро-Уилка получаем р = 0,00138, что подтверждает сделанный ранее вывод о отличии от нормальности распределения этих данных.

Рисунок 5. Проверка нормальности распределения данных с использованием графика нормальных вероятностей

Точки на этом рисунке не плотно выстраиваются вдоль теоретически ожидаемой прямой, что еще раз подтверждает отличие от нормальности распределения данных о температуре вспышки в закрытом тигле гидроочищенной дизельной фракции «Летняя».

Рисунок 6. Проверка нормальности распределения данных с использованием графика нормальных вероятностей

Точки на этом рисунке не плотно выстраиваются вдоль теоретически ожидаемой прямой, что еще раз подтверждает отличие от нормальности распределения данных о цетановом числе гидроочищенной дизельной фракции «Летняя».

Вывод: в ходе данной лабораторной работы:

Проверили нормальность распределения данных с использованием критерия хи-квадрат;

Проверили нормальность распределения данных с использованием тестов Колмогорова-Смирнова и Шапиро-Уилка;

Проверили нормальность распределения данных с использованием графика нормальных вероятностей.