
СОДЕРЖАНИЕ
Введение
Профессии IT-специалистов настолько разнообразны, что сложно дать им единое описание. Но в какой бы области он ни был специалистом, его рабочим инструментом является компьютер. Характеристика у этой профессии скорее творческая. IT-специалистам приходится постоянно создавать что-то новое, придумывать и реализовать собственные идеи, разрабатывать различные программы и приложения.
В то же время он должен хорошо знать математику разбираться в программировании и принципах функционирования компьютерной техники, локальной сети. Многим приходится осваивать графические редакторы.
В этой контрольной работе хочу затронуть тему топ - 3 востребованных IT -профессий будущего. Тщательно изучив рынок выбрал для себя три специальности:
Data Scientist;
AI developer;
Специалист по блокчейну.
Специалист по данным (Data Scientist)
Сейчас практически в любом направлении деятельности данные играют большую роль и в связи с этим связано появление огромных кластеров данных , с которыми нужно работать, перемещать их, анализировать, улучшать, делать прогнозы и прочее. Data Scientist — это специалист, который создаёт инструменты для решения задач бизнеса. Для этого он использует навыки анализа данных и построения моделей машинного обучения (англ. Machine Learning). Data Scientist работает на стыке трёх областей знания: статистики, машинного обучения и программирования.Именно поэтому профессия дата-сайентиста будет актуальной в течении многих лет.
Data Scientist применяет методы науки о данных (Data Science) для обработки больших объемов информации. Он строит и тестирует математические модели поведения данных. Это помогает найти в них закономерности или спрогнозировать будущие значения. Базовый список задач специалиста по Data Science
-Прояснить требования к бизнес-задаче и перевести её в математическую плоскость.
-Подготовить данные для решения задачи: разобраться, откуда их взять, и как обработать, чтобы они стали доступны для работы.
-Проанализировать и структурировать данные.
-Построить модель машинного обучения, которая будет решать задачу.
-Проверить правильность работы модели: внедрить на наборе пользователей или провести A/B-тестирование.
Этот список можно зацикливать и возвращаться на пункт сбора данных или обучения модели, если текущая не сработает.
Например, клиент хочет увеличить выручку от маркетинговых рассылок. Чтобы решить эту задачу, дата-сайентист сначала должен разобраться, какие показатели влияют на выручку.
Для этого он попросит у маркетологов данные по рассылкам, которые лежат в базе или в таблице Excel. Специалист по Data Science соберёт их вместе и сегментирует получателей рассылки на тех, кто принял предложение, и тех, кто не отреагировал.
Дальше Data Scientist оценивает, достаточно ли данных для построения моделей, и если да, то пишет алгоритм, который отправит каждому подписчику подходящее только ему письмо.
После этого останется проверить рассылку на небольшом количестве пользователей и замерить её эффективность. Если она окажется выше, то можно радоваться успеху. А если нет, то придётся вернуться на этап сбора данных и повторить всю цепочку снова.
Дата-сайентисты работают везде, где есть большие объемы информации: чаще всего это крупный бизнес, стартапы и научные организации. Поскольку методы работы с данными универсальны, специалистам открыты любые сферы: от розничной торговли и банков до метеорологии и химии. В науке они помогают совершать важные открытия: проводят сложные исследования, например, строят и обучают нейронные сети для молекулярной биологии, изучают гамма-излучения или анализируют ДНК.
В крупных компаниях дата-сайентист — это человек, который нужен всем отделам:
• маркетологам поможет проанализировать данные карт лояльности и понять, каким группам клиентов что рекламировать;
• для логистов изучит данные с GPS-трекеров и оптимизирует маршрут перевозок;
• HR-отделу поможет предсказать, кто из сотрудников скоро уволится, проанализировав их активность в течение рабочего дня;
• с продажниками спрогнозирует спрос на товар с учетом сезонности;
• юристам поможет распознать, что написано на документах, с помощью технологий оптического распознавания текстов;
• на производстве спрогнозирует оборудования на основе данных с датчиков.
Навыки, которыми должен обладать Data Scientist:
Сбор большого количества неуправляемых данных и преобразование их в более удобный формат.
Решение бизнес-задач с использованием данных.
Работа с различными языками программирования, включая SAS, R и Python.
Работа со статистикой, включая статистические тесты и распределения.
Использование аналитических методов, таких как машинное обучение, глубокое обучение и текстовая аналитика.
Сотрудничество с ИТ и бизнесом в равной мере.
Поиск порядка и шаблонов данных, а также выявление тенденций, которые могут помочь в достижении конечного бизнес-результата.
А вот термины и технологии, которые надо знать будущему Data Scientist:
Визуализация данных: представление данных в графическом формате, чтобы их можно было легко проанализировать.
Машинное обучение: отрасль искусственного интеллекта, основанная на математических алгоритмах и автоматизации.
Глубокое обучение: область изучения машинного обучения, которая использует данные для моделирования сложных абстракций.
Распознавание образов: технология, которая распознает шаблоны в данных (часто используется взаимозаменяемо с машинным обучением).
Подготовка данных: процесс преобразования необработанных данных в другой формат, чтобы их было проще потреблять.
Текстовая аналитика: процесс анализа неструктурированных данных для получения ключевых бизнес-идей.
Помимо прочего, нужно знать и понимать:
Статистику и машинное обучение.
Языки программирования SAS, R или Python.
Базы данных MySQL и Postgres.
Технологии визуализации данных и отчетности.
Hadoop and MapReduce.