Доклад на тему
«Визуализация данных: BarPlot, BoxPlot, ViolinPlot, RidgelinePlot, ScatterPlot»
Презентация подготовлена студенткой группы ИНБО-06-20
Немного теории
Что это?
Визуализация данных — это графическое представление информации и аналитики: графики, диаграммы, карты, дашборды.
Зачем?
Визуальная информация лучше воспринимается и позволяет быстро и эффективно донести до зрителя собственные мысли и идеи. Физиологически, восприятие визуальной информации является основной для человека.
Немного теории
Где?
В настоящее время возможность визуализации поддерживает любой высокоуровневый язык программирования. Также можно использовать специальные сервисы, например, Tableau, Google Charts и др.
Основные принципы
визуализации
1.Логика
a.Правильный тип диаграммы
b.Единообразие графиков
c.Подписи на графиках
2.Простота
3.Цвет
BarPlot
Данная функция создает гистограмму с вертикальными и горизонтальными столбцами.
barplot(данные, col = цвет,
main = Название, xlab = Подпись оси x,
width = ширина столбца, space=расст. между столбцами,
ylab=Подпись оси y)
Boxplo t
Функция Boxplot строит диаграмму «ящик с усами» (диаграмму размахов) с заданными значениями.
boxplot(формула, data = данные, xlab = Подпись оси x,
ylab = Подпись оси y,
main = Название, col = цвет)
ViolinPlo t
Функция для построения классических скрипичных графиков, а также «полускрипичных графиков» (плотности ядра данных).
vioplot(данные, col = цвет,
xlab = Подпись оси x, ylab = Подпись оси y)
RidgelinePl ot
График Ridgeline показывает распределение числового значения для нескольких групп.
ScatterPlot
В точечной диаграмме отображается связь между двумя числовыми переменными. Каждая точка представляет собой наблюдение. Их позиция на X (горизонтальной) и Y (вертикальной) осях представляет значения двух переменных.
scatterplotplot(x=наблюдения по x, y=наблюдения по y)