3. Какие визуализации построены для пар переменных? Какие функции на
языке R и с какими входными параметрами при этом использовались? Какие
особенности распределения данных они позволяют наблюдать?
Для визуализации пар переменных в нашем анализе были построены графики, которые помогают увидеть взаимосвязи между двумя количественными переменными. Эти визуализации позволяют выявить корреляции, тренды или аномалии между переменными.
Визуализации для пар переменных:
Точечная диаграмма для анализа зависимости между танцевальностью и энергией:
Переменные:
danceability_% - танцевальность трека (количественная переменная).
energy_% - уровень энергии трека (количественная переменная).
Функция geom_point() из библиотеки ggplot2.
Входные параметры:
aes(x = danceability_., y = energy_.) определяет, что переменная danceability_% будет по оси X, а переменная energy_% — по оси Y.
color = "red" определяет цвет точек на графике.
Особенности распределения данных:
Точечная диаграмма (scatter plot) позволяет наблюдать наличие линейной или нелинейной зависимости между двумя переменными. В рассмотренном случае можно увидеть, увеличивается ли энергия трека по мере роста танцевальности, что может быть важным для анализа музыкальных характеристик.
Точечные диаграммы помогают выявить корреляции между переменными. Например, можно определить, растет ли популярность трека с увеличением танцевальности или энергии, что может указать на вкусовые предпочтения слушателей.
Точки, которые значительно отклоняются от общего тренда, могут быть аномалиями.
Точечные диаграммы позволяют наблюдать линейные или нелинейные зависимости между переменными. Например, если танцевальность и энергичность трека связаны линейно, это будет заметно по направлению точек на графике.
Сделать содержательные выводы.
Гистограммы помогают быстро увидеть общие закономерности, выявить аномалии и оценить плотность данных.
Столбчатые диаграммы позволяют легко сравнивать категории и наблюдать, как данные распределяются среди них. Для категориальных переменных графики дают возможность быстро понять тенденции и различия в данных.
Точечные диаграммы дают возможность визуализировать взаимосвязи между парами переменных. Они особенно полезны для выявления корреляций, аномалий и закономерностей в данных, что может помочь лучше понять, какие факторы влияют на популярность треков.
Санкт-Петербург
2024
