Добавил:

WhitePrestige Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский технический университет связи и информатики

Предмет:

Большие данные

Файл:

ЛР-3 MapReduce in Hadoop

.docx

Скачиваний:

Добавлен:

23.12.2022

Размер:

263.68 Кб

Скачать

☆

_{Министерство
цифрового развития, связи и массовых
коммуникаций Российской Федерации}

Ордена Трудового Красного Знамени

Федеральное государственное бюджетное образовательное учреждение высшего образования

Кафедра «Математическая кибернетики и информационные технологии»

Отчёт по лабораторной работе №3

по дисциплине «Математические методы в больших данных» на тему:

««MapReduce in Hadoop»

Выполнили: студенты БСТ****

Проверила: Пугачёва Мария Алексеевна

Москва 2021

Оглавление

_{Министерство
цифрового развития, связи и массовых
коммуникаций Российской Федерации} 1

Ордена Трудового Красного Знамени 1

Федеральное государственное бюджетное образовательное учреждение высшего образования 1

Кафедра «Математическая кибернетики и информационные технологии» 1

Отчёт по лабораторной работе №3 1

по дисциплине «Математические методы в больших данных» на тему: 1

««MapReduce in Hadoop» 1

Выполнили: студенты БСТ**** 1

Проверила: Пугачёва Мария Алексеевна 1

Москва 2021 1

Оглавление 1

Цель работы: ознакомится с процессом MapReduce на примере подсчета слов в файле. 3

Задачи: Написать программу для подсчета количества слов на языке 3

java или воспользоваться примерами программ. И выполнить следующую последовательность действий: 3

1. Перед запуском примера необходимо создать места ввода и вывода в формате HDFS. 3

2. Создайте примеры текстовых файлов для использования в качестве 3

входных данных и переместите их в каталог/user/cloudera/wordcount/input в HDFS. Вы можете использовать любые файлы по своему выбору; 3

3. Скомпилируйте класс WordCount. 3

4. Создайте файл JAR для приложения WordCount. 3

5. Запустите приложение WordCount из файла JAR, передав пути к входным и выходным каталогам в формате HDFS. 3

6. Если вы хотите запустить образец снова, сначала вам нужно удалить выходной каталог. Используйте следующую команду. 3

hadoop fs -rm -r /user/cloudera/wordcount/output 3

1. Создание каталога ввода для программы 4

2. Создание файлов ввода и их перемешение в каталог ввода 4

3. Компиляция класса WordCount. 4

4. Создание jar файла. 4

5. Запуск WordCount 5

6. Результат 7

Мы ознакомились с процессом MapReduce на примере подсчета слов в файле. 8

Задание

Цель работы: ознакомится с процессом MapReduce на примере подсчета слов в файле.

Задачи: Написать программу для подсчета количества слов на языке

java или воспользоваться примерами программ. И выполнить следующую последовательность действий:

Перед запуском примера необходимо создать места ввода и вывода в формате HDFS.
Создайте примеры текстовых файлов для использования в качестве

входных данных и переместите их в каталог/user/cloudera/wordcount/input в HDFS. Вы можете использовать любые файлы по своему выбору;

Скомпилируйте класс WordCount.
Создайте файл JAR для приложения WordCount.
Запустите приложение WordCount из файла JAR, передав пути к входным и выходным каталогам в формате HDFS.
Если вы хотите запустить образец снова, сначала вам нужно удалить выходной каталог. Используйте следующую команду.

hadoop fs -rm -r /user/cloudera/wordcount/output