Дополнительное задание
Функция
describe содержит среднее значение,
стандартное отклонение, минимум и
максимум, верхние значения первого и
третьего квартиля и медиану по каждому
столбцу. Результат выполнения функции
на рисунке 17.
Из
результата выполнения функции можно
увидеть, например:
1)
всего 563 элемента,
2)
среднее значение равно 1.28, означающее,
что больных больше здоровых,
3)
Самый молодой пациент - 4-х летний ребенок
4)
Среднее значение Total_Proteins - 6.49
Рисунок
17 – Функция describe
Boxplots
используют квартили, чтобы показать,
как распределены данные. По графику,
изображенному на рисунке 18, можно
увидеть, что датасет рассматривает
огромный диапазон возрастов пациентов
от маленького ребенка (4 года) до глубокого
старика (свыше 80 лет). Также можно увидеть,
что средний возраст пациента находится
в районе 45 лет, а нижний и верхний квартили
в районе 35 и почти 60 лет соответственно.
Рисунок
18 – Распределение данных Age
Данные
также можно сгруппировать с помощью
параметра by. Так на рисунке 19 можно
увидеть, например, что самому старому
больному больше 80 лет, а самой старой
больной в районе 75 лет. Так же между
мужчинами и женщинами пределы между
верхними и нижними квартилями и медианной
находятся примерно на одном уровне:
различие максимум достигает 10 лет.
Способ набора данных boxplot становится
действительно быстрым, чтобы визуализировать
баллоны.
Рисунок
19 - Распределение данных Age
с группировкой
Ссылка
на Jupyter
Notebook:
https://colab.research.google.com/drive/1hMAocsRT5gtawIjJrbc3nODQIY0B9pcN#scrollTo=VQ4oHuMibWbl
Вывод
В
ходе лабораторной работы была проведена
предварительная обработка данных,
аналогичной сделанной в первой
лабораторной работе. На основе анализа
графика связей между двумерного набора
данных можно сделать вывод, что:
1)
У человека с увеличением прямого
билирубина увеличивается количество
общее количество билирубина
2)
У человека с увеличением альбумина
увеличивается соотношение альбуминов
и глобулинов
3)
У человека с увеличением альбумина
увеличивается количество белков в
организме
Эта
взаимосвязь была подтверждена с помощью
построенной тепловой карты коэффициентов
корреляции, которые показывали значения
приближенные к единице.