ЛР / ЛР№8_Хакова_Ю_М_ИСТ_223
.docxФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»
(СПбГУТ)
Лабораторная работа №8
«Облако слов средствами R»
Выполнил: ст. гр. ИСТ- 223, Хакова Ю. М.
Проверил: к.т.н., доцент Лабковская Р.Я.
Цель работы: Получить навыки использования языка R для построения
облака слов.
Задание
1. Построить Word Cloud c с загрузкой данных из текстового
файла.
2. Построить Word Cloud c с загрузкой данных из Интернета.
3. Написать выводы.
Ход работы:
Создать текстовый файл для обработки данных.
Провести интеллектуальный анализ текста с помощью функций Corpus() (загрузка данных), inspect(), tm_map() (преобразование, очистка текста), TermDocumentMatrix() (создание терм-документной матрицы), wordcloud2() (создание вищуализаций). (рис. 1), (рис. 3)
Построить Word Cloud c с загрузкой данных из текстового файла. (рис. 2)
Построить Word Cloud c с загрузкой данных из Интернета. (рис. 4)
Рис. 1. Программа для решения задания 1. Интеллектуальный анализ текстового файла из локальных фалов на компьютере.
Рис. 2. Визуализация «Звезда» с помощью wordcloud2() для задания 1.
Рис. 3. Программа для решения задания 2. Интеллектуальный анализ текстового файла из интернета.
Рис. 4. Визуализация «Наклон» с помощью wordcloud2() для задания 2.
Вывод:
в ходе выполнения лабораторной работы была проведена обработка текстовых данных средствами языка R для создания облака слов. Был проведен интеллектуальный анализ текста (загрузка из файла, очистка от лишних символов, знаков препинания, цифр и стоп-слов, составление терм-документной матрицы для подсчета частоты употребления каждого слова) для более корректной визуализации. Также были построены вищуализаци для локального файла и файла из интеренета с помощью функции wordcloud2(). Облако слов отражает наиболее часто встречающиеся слова в тексте, выделив их крупным шрифтом.
Санкт-Петербург
2024
