
1
.docxМИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
федеральное государственное автономное образовательное учреждение высшего образования
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ»
Кафедра 41
ПРЕПОДАВАТЕЛЬ
Ст. преподаватель |
|
|
|
И. И. Спиндзак |
должность, уч. степень, звание |
|
подпись, дата |
|
инициалы, фамилия |
Лабораторная работа №1
DataLens. Начало работы и визуализация данных
по курсу: Облачные технологии
СТУДЕНТКА ГР. № |
Z0411 |
|
16.01.24 |
|
М. В. Карелина |
|
|
номер группы |
|
подпись, дата |
|
инициалы, фамилия |
Номер студенческого билета: 2020/3477
Санкт-Петербург
2024
Цель работы: Знакомство с DataLens.
Для начала работы c DataLens достаточно перейти на datalens.yandex.ru и указать учетную запись Яндекс ID. Далее требуется принять условия сервиса и активировать его. После этого можно полноценно пользоваться бесплатным тарифом DataLens.
Рисунок 1 – Главная страница DataLens
При работе с данными сначала они собираются в «сыром» виде, в неудобном для восприятия человеком формате. Это огромные массивы данных с большим количеством метрик и параметров.
Затем данные преобразовываются в более агрегированный датасет, в котором можно выделить категории и показатели и их агрегации.
После этого данные можно визуализировать. Человек может легко считывать визуализации — все диаграммы основываются на специальных визуальных атрибутах (preattentive attributes). Они посылают в человеческий мозг сигналы, которые он считывает органами зрения и осознаем подсознательно.
Визуализация в DataLens — это чарт. Чарты создаются в визарде на основе данных из датасета.
На базе одного датасета может быть создано неограниченное количество чартов, которые могут быть добавлены в дашборды. Визард — это окно, в котором создают и редактируются чарты.
Рабочая область в интерфейсе визарда разделена на три основные панели:
Панель датасета, где отображаются доступные поля: Измерения и Показатели. Вы можете добавить в список вычисляемое поле.
Панель настройки визуализации, где можно выбрать тип чарта. Для каждого типа доступен свой набор секций (например, ось X, ось Y, фильтры и т. д.), куда можно перетаскивать поля.
Панель превью, где отображается визуализация.
Проведем визуализацию данных в DataLens на практике. В качестве набора данных возьмем детализацию звонков у оператора связи Мегафон за период с 16.11.2018 до 21.03.2019.
Для начала работы с данными необходимо создать подключение к csv-файлу (Рис. 2).
Рисунок 1 - Подключение к csv-файлу
Затем на основе этого подключения надо создать датасет. После загрузки таблицы в DataLens и создания датасета нужно проставить все необходимые агрегации. Просуммируем все числовые показатели (Рис. 3).
Рисунок 3 – Экран настройки датасета
Теперь найдём ответы на следующие вопросы с помощью визуализации DataLens:
Сколько часов вы говорите по телефону? Сколько в среднем занимает у вас один разговор? (Рис. 4-5)
Рисунок 4 - Столбчатая диаграмма
Рисунок 5 - Столбчатая диаграмма
С кем вы разговариваете дольше всего и чаще всего? И кто звонит больше – вы или вам?
Рисунок 6 - Круговая диаграмма
Также рассмотрим территориальную часть. (Рис. 7).
Рисунок 7 - Кольцевая диаграмма
Хватает ли вам текущего пакета минут – иными словами, выгодно ли вам было бы перейти на новый тариф?
Рисунок 8 - Кольцевая диаграмма
Согласно кольцевой диаграмме на рисунке 8 стоимость тарифа в месяц 397 рублей, таким образом тариф остается выгодным.
Вывод
По итогу завершения первого дня марафона было создано и настроено подключение csv файла к DataLense, а также выполнено несколько визуализаций истории звонков оператора Мегафон.