Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЛР / ЛР№8_Хакова_Ю_М_ИСТ_223

.docx
Скачиваний:
0
Добавлен:
07.06.2026
Размер:
1.36 Mб
Скачать

ФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»

(СПбГУТ)

Лабораторная работа №8

«Облако слов средствами R»

Выполнил: ст. гр. ИСТ- 223, Хакова Ю. М.

Проверил: к.т.н., доцент Лабковская Р.Я.

Цель работы: Получить навыки использования языка R для построения

облака слов.

Задание

1. Построить Word Cloud c с загрузкой данных из текстового

файла.

2. Построить Word Cloud c с загрузкой данных из Интернета.

3. Написать выводы.

Ход работы:

  1. Создать текстовый файл для обработки данных.

  2. Провести интеллектуальный анализ текста с помощью функций Corpus() (загрузка данных), inspect(), tm_map() (преобразование, очистка текста), TermDocumentMatrix() (создание терм-документной матрицы), wordcloud2() (создание вищуализаций). (рис. 1), (рис. 3)

  3. Построить Word Cloud c с загрузкой данных из текстового файла. (рис. 2)

  4. Построить Word Cloud c с загрузкой данных из Интернета. (рис. 4)

Рис. 1. Программа для решения задания 1. Интеллектуальный анализ текстового файла из локальных фалов на компьютере.

Рис. 2. Визуализация «Звезда» с помощью wordcloud2() для задания 1.

Рис. 3. Программа для решения задания 2. Интеллектуальный анализ текстового файла из интернета.

Рис. 4. Визуализация «Наклон» с помощью wordcloud2() для задания 2.

Вывод:

в ходе выполнения лабораторной работы была проведена обработка текстовых данных средствами языка R для создания облака слов. Был проведен интеллектуальный анализ текста (загрузка из файла, очистка от лишних символов, знаков препинания, цифр и стоп-слов, составление терм-документной матрицы для подсчета частоты употребления каждого слова) для более корректной визуализации. Также были построены вищуализаци для локального файла и файла из интеренета с помощью функции wordcloud2(). Облако слов отражает наиболее часто встречающиеся слова в тексте, выделив их крупным шрифтом.

Санкт-Петербург

2024