Лаб 4 БСТ1904 Пантелеева
.docxМинистерство цифрового развития, связи и массовых коммуникаций Российской Федерации
Ордена Трудового Красного Знамени
Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования
Московский технический университет связи и информатики
Дисциплина «Большие данные»
Лабораторная работа №4
Выполнила:
Студентка группы БСТ1904
Пантелеева К.А.
Проверила:
Пугачева М.А.
Москва, 2021
Цель.
Ознакомится с процессами Hive и HBase.
Задание.
HIVE
Скачать любой датасет из списка ниже.
Загрузить этот датасет в HDFS в свою домашнюю папку.
Создать собственную базу данных в HIVE. (create database).
Создать таблицы внутри базы данных с использованием одного файла из загруженного датасета (предварительно создать таблицу с форматами аналогичными вашим данным в выбраной таблице, см.приложение).
Сделать любой простой отчет по загруженным данным используя груповые и агрегатные функции.
HBASE.
Создать таблицу
Посмотреть информацию о ней (list/describe оба варианта)
Положить в нее данные (3-5 строк)
Просканировать
Получить конкретную строку
Заблокировать/разблокировать таблицу
Удалить таблицу