Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР / ЛР№4_Хакова_Ю_М_ИСТ_223.docx
Скачиваний:
0
Добавлен:
07.06.2026
Размер:
937.05 Кб
Скачать

3. Какие визуализации построены для пар переменных? Какие функции на

языке R и с какими входными параметрами при этом использовались? Какие

особенности распределения данных они позволяют наблюдать?

Для визуализации пар переменных в нашем анализе были построены графики, которые помогают увидеть взаимосвязи между двумя количественными переменными. Эти визуализации позволяют выявить корреляции, тренды или аномалии между переменными.

Визуализации для пар переменных:

  1. Точечная диаграмма для анализа зависимости между танцевальностью и энергией:

Переменные:

danceability_% - танцевальность трека (количественная переменная).

energy_% - уровень энергии трека (количественная переменная).

Функция geom_point() из библиотеки ggplot2.

Входные параметры:

aes(x = danceability_., y = energy_.) определяет, что переменная danceability_% будет по оси X, а переменная energy_% — по оси Y.

color = "red" определяет цвет точек на графике.

Особенности распределения данных:

Точечная диаграмма (scatter plot) позволяет наблюдать наличие линейной или нелинейной зависимости между двумя переменными. В рассмотренном случае можно увидеть, увеличивается ли энергия трека по мере роста танцевальности, что может быть важным для анализа музыкальных характеристик.

  • Точечные диаграммы помогают выявить корреляции между переменными. Например, можно определить, растет ли популярность трека с увеличением танцевальности или энергии, что может указать на вкусовые предпочтения слушателей.

  • Точки, которые значительно отклоняются от общего тренда, могут быть аномалиями.

  • Точечные диаграммы позволяют наблюдать линейные или нелинейные зависимости между переменными. Например, если танцевальность и энергичность трека связаны линейно, это будет заметно по направлению точек на графике.

  1. Сделать содержательные выводы.

Гистограммы помогают быстро увидеть общие закономерности, выявить аномалии и оценить плотность данных.

Столбчатые диаграммы позволяют легко сравнивать категории и наблюдать, как данные распределяются среди них. Для категориальных переменных графики дают возможность быстро понять тенденции и различия в данных.

Точечные диаграммы дают возможность визуализировать взаимосвязи между парами переменных. Они особенно полезны для выявления корреляций, аномалий и закономерностей в данных, что может помочь лучше понять, какие факторы влияют на популярность треков.

Санкт-Петербург

2024