BI-инструменты: необходимый минимум для работы
Зачем финансисту BI-инструменты
По результатам исследований CIMA более 87 % финансовых специалистов, полагают, что именно данные обладают потенциалом изменения подхода к ведению бизнеса.
А 51 % корпоративных лидеров относят большие данные и аналитику к первой десятке корпоративных приоритетов. Все это говорит о том, что данные правят миром.
Объем и разнообразие данных, доступных для анализа, растут в геометрической прогрессии, появляются технологии, позволяющие управлять усложненными данными и выполнять аналитику высокого уровня.
Источников данных множество — это база контрагентов, записи кол-центров, внешние каналы, машинные данные, социальные сети, и многое другое.
Данные становятся мощным активом компании, который нужно защищать и развивать.
Пример
Бухгалтерия спрашивает: зачем узнавать новое, если все и так нормально получается в Excel? Потому что BI-инструменты облегчают жизнь не только аналитика, но и бухгалтера, который, между прочим, претендует в будущем на должность финансового директора.
То есть, чтобы автоматизировать рутинные процессы в компании бухгалтер должен уметь запрашивать данные аналитики и визуализировать их в понятные руководству отчеты не привлекая программистов. Например, автоматизировать с помощью айтишников процесс ввода первички, и используя BI-инструменты получать данные из базы и составлять любой отчет за короткое время.
Проще говоря с помощью BI-отчетов, бухгалтер наглядно может показать директору, например куда больше всего уходят финансовые потоки и как их увеличить.
Финансист будущего — это специалист на стыке финансов и программирования.
Работодатели все больше будут ценят тех, кто умеет обращаться с базами данных, доставать оттуда нужные данные и визуализировать их.
Бухгалтеру, который освоит Tableau, Power BI, Python и SQL, открывается широкая линейка ролей. Например, смело можно идти в сферу аналитики BI или стать финансовым директором.
Не бойтесь учиться! Если не станете программистом, то, как минимум, поймете, как создавать крутые отчеты и сможете быть более эффективным.
Самое важное
Источники данных
BI-отчеты финансиста
BI-системы
BI – сокращение от business intelligence, это инструменты для перевода необработанных данных в структурированную и понятную информацию.
Конечная цель использования BI-систем – бизнес-анализ и упрощение процесса принятия решений.
Пример
Задача – определить, какой бюджет компания может выделить на покупку компьютеров в следующем календарном году. Основываться просто на собственных предположениях, конечно же нельзя. Руководство требует обоснованного решения. Говорят, надо что-нибудь проанализировать, например, статистику прошлых годов.
Есть данные по покупке техники за последние десять лет. Помесячные, конечно. Огромные таблицы за каждый месяц. В одной указано, какую технику приобретала компания, в каком количестве. В другой – по какой цене, в какие филиала поставлялась, и в каких филиалах списывалась, как устаревшая. В целом для принятия взвешенного решения неплохо бы еще наложить данные из открытых источников. Волатильность валюты, статистика по выпуску новых апгрейдов техники и т.д. – все, что влияет на рынок компьютерной техники.
Очевидно, что просматривать каждую таблицу вручную и пытаться в голове сопоставить такой объем данных, наверное, можно, но зачем все усложнять? Тут поможет BI система, в которую можно загрузить все эти данные, обработать их, и на выходе получить возможность в пару кликов посмотреть любые данные по покупке и списанию компьютерной техники за любой период. И конечно, отфильтровать только те года, в которые не было сильных колебаний на рынке.
Класс Data – bi
«Data – BI» - простой класс, с которого начинается прототипирование управленческих панелей, а в роли источника данных часто выступают отдельные статичные файлы, например формата csv, txt, xlsx и т. д.
Плюсы:
быстрый способ построения отчетности;
подходит, для ситуационной аналитики;
не требует применения вспомогательных инструментов;
аналитик BI может не иметь компетенции в области дата инжиниринга или программирования для работы в системах такого класса.
МинусыI:
информацию не всегда можно взять из источников напрямую, например, не подойдут прикладные решения на платформе 1С;
если массивы плохо структурированы, то потребуется больше времени по их обработке;
качество входных данных никак не проверяется, из-за чего возникает проблема дубликатов, пустых строк, некорректного написания значений и т. д.;
при большом количестве строк заметно замедляется работа самой BI-платформы, вплоть до полной невозможности перестраивать графики и диаграммы;
нет возможности составить расписание на обновление исходников.
Класс Data – db – b
немного похож на предыдущий, но в этом классе первоначальный массив напрямую загружается в базу в неизмененным виде, а уже к ней идет подключение. База данных может быть развернута локально, запущена в контейнере или находиться в облачном хранилище.
Плюсы:
возможность агрегировать разрозненные, однотипные файлы;
нагрузку по хранению информации несет хранилище;
возможность задействовать всю мощь языка запросов SQL, чтобы отфильтровать или агрегировать сырые строки перед их передачей в BI-инструмент.;
уменьшается размер файла с управленческими панелями.
Минусы:
отсутствие контроля над первичными данными, поэтому в хранилище загружается большое количество ненужной информации;
отсутствие контроля загружаемых датасетов;
добавление данных в базу осуществляется в ручном режиме;
аналитик должен на базовом уровне знать язык SQL.
Класс Data – etl – db – bi
Такой класс частично автоматизирован, а в качестве ETL-инструмента может выступать программный продукт с графическим интерфейсом или код написанный на R, Python, Scala и т. д. Все данные проходят предварительный пред процессинг, а структура наполняемых таблиц прописывается заранее.
Плюсы:
возможность загружать только хорошо структурированную информацию, прошедшую предварительную верификацию;
экономия места в базе данных;
снижается количество доработок на BI-платформе.
Минусы:
аналитик должен владеть ETL-инструментом и языком запросов SQL;
процесс разработки, тестирования скриптов требует времени;
при большом количестве источников информации, затрудняется синхронизация получения информации.
Класс Data – Workflow management platform +
ETL – DB – BI
полностью автоматизирован. Здесь оркестратор скриптов берет на себя контроль за своевременным выполнением всех вспомогательных процессов в системе.
Плюсы:
оптимальная настройка время сбора данных из разных источников;
мониторинг ошибок и перезапуск упавших задач.
Минусы:
усложнение инфраструктуры;
рост требований к квалификации аналитика;
нужно освоить дополнительные инструменты или языки программирования.
Класс Data – Workflow management platform +
ELT – Data Lake – Workflow management platform +
ETL – DB – BI
в котором информация проходит двухступенчатый конвейер: неструктурированные данные (Data Lake), и хранилище (DB), в котором информация уже отсортирована и преобразована к требуемому виду.
Плюсы:
возможность в разное время провести сбор информации и ее обработку;
в случае, когда на этапе проектирования таблиц учтены не все требования, возможно обращение за дополнительными данными в Data Lake.
Минусы класса, такие же, как и в предыдущем классе, к которым добавляется стоимость выбранной платформы Data Lake, если она платная, то к минусам добавляется рост расходов на аналитику компании.