
Практика 4
.docxМИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ, СВЯЗИ И МАССОВЫХ КОММУНИКАЦИЙ
Ордена Трудового Красного Знамени
Федеральное государственное бюджетное образовательное учреждение высшего образования
«Московский технический университет связи и информатики»
Кафедра «Математическая кибернетика и информационные технологии»
Дисциплина «Большие данные»
Лабораторная работа №4
Москва, 2024
Содержание
1 Цель работы 3
2 Ход работы 3
3 Вывод 9
1 Цель работы
Получить навыки работы с Hbase.
2 Ход работы
Запускаем интерактивную оболочку HBase, используя команду hbase shell (рисунок 1).
Рисунок 1 – Запуск оболочки Hbase
Затем создаем таблицу в HBase. Для этого используем команду create, в качестве аргументов передаем имя таблицы и Column family. Используем команду list, чтобы подтвердить существование таблицы (рисунок 2).
Рисунок 2 – Создание и проверка таблицы
Кладу в табличку данные об информации о прогнозе погоды с трёх сайтов, устанавливая ключ – сайт, Column family 1 – city, column family2 - «weather». Columns в column family2 – today, tomorrow. Чтобы это сделать используем команду put с аргументами (первая вставка где находится, в какой столбец вставляем, с каким значением вставляем). Столбец «weather» состоит из префиксов семейств столбцов, поэтому мы используем знак : чтобы указать суффикс квалификатора столбца. В «сегодня» и «завтра» положим небольшую часть html-разметки (рисунок 3).
Рисунок 3 – Добавление данных в таблицу
Посмотрим информацию о таблице, используя два варианта: list и describe. Используем list команду, чтобы подтвердить существование таблицы. Затем используем describe команду, чтобы просмотреть подробную информацию, включая настройки конфигурации по умолчанию (рисунок 4).
Рисунок 4 – Просмотр информации о таблице
Сканирую таблицу, используя команду scan - команду, которая нужна, чтобы сканировать таблицы на наличие данных. По умолчанию, строки ключей в Hbase сортируются в лексикографическом порядке (рисунок 5).
Рисунок 5 – Сканирование таблицы
Для получения конкретной строки используется команда get (рисунок 6).
Рисунок 6 – Получение конкретной строки таблицы
Для блокировки и разблокировки таблиц используются команды disable и enable соответственно. Эти команды используются в том случае, если нужно удалить таблицу или изменить ее настройки. Для проверки включения и отключения таблицы можно использовать команды is_disabled или is_enabled (рисунок 7).
Рисунок 7 – Блокировка и разблокировка таблицы
Нахожу HBase Master UI в Ambari, информацию о моей таблице и определяю, на каком RegionServer’e есть Region с моей таблицей (рисунки 8 - 10).
Рисунок 8 – HBase Master UI в Ambari и информация о таблице
Рисунок 9 – HBase Master UI в Ambari и информация о таблице
Рисунок 10 – Определение RegionServer’а с Region’ом моей таблицы
Region таблицы находится на Region Server 192.168.0.6:16030.
Удаляем таблицу, используя команду drop, предварительно отключив её через команду disable. Через list проверяем, есть ли наша таблица (рисунок 11).
Рисунок 11 – Отключение и удаление таблицы
3 Вывод
Получил навыки работы с Hbase.