Добавил:

j_k Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича

Предмет:

Анализ больших данных

Файл:

ЛР / ЛР№4_Хакова_Ю_М_ИСТ_223.docx

Скачиваний:

Добавлен:

07.06.2026

Размер:

937.05 Кб

Скачать

☆

1 / 21 2 > Следующая >>>

ФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»

(СПбГУТ)

Лабораторная работа № 4

«Визуализация данных. Разведочный анализ данных»

Выполнил: ст. гр. ИСТ- 223, Хакова Ю. М.

Проверил: к.т.н., доцент Лабковская Р.Я.

Цель работы: научиться использовать визуализации для формулирования исследовательских гипотез, проверки предположений относительно распределения данных и зависимостей между показателями.

Формируемые знания, умения и навыки: знать основные визуализации для количественных и категориальных данных, уметь использовать для построения визуализаций функции языка R. Уметь анализировать построенные визуализации для описания распределения данных, которое они графически представляют.

Ход работы:

Загрузить набор данных в рабочую директорию.
Считать данные, определить тип данных. (рис. 1), (рис. 2)
Описать данные набора: какие переменные в нем присутствуют, какой тип данных у этих переменных.
Провести построение графиков на языке R.

Рис. 1. Результат выполнения программы. Типы данных.

Рис. 2. Типы данных после изменения chr на num у двух переменных in_deezer_playlists и in_shazam_charts.

Рис. 3. Summary

Переменные и их тип данных.

1. track_name (Название трека)

Тип данных: категориальная переменная (строка).

2. artist (Исполнитель)

Тип данных: категориальная переменная (строка).

3. streams (Количество стримов)

Тип данных**: количественная переменная (целочисленная).

4. released_year (Год выпуска)

Тип данных: категориальная переменная (целое число).

5. danceability_% (Танцевальность, в процентах)

Тип данных**: количественная переменная (десятичное число).

6. energy_% (Энергия, в процентах)

Тип данных: количественная переменная (десятичное число).

7. key(Тональность)

Тип данных: категориальная переменная (целое число).

8. loudness_dB (Громкость, в децибелах)

Тип данных: количественная переменная (десятичное число).

9. mode (Мажор или минор)

Тип данных: Категориальная переменная (целое число: 0 — минор, 1 — мажор).

10. speechiness_% (Процент речи)