Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гомогенные тексты.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
129.54 Кб
Скачать

Варианты заданий

Задание 1

- Выбрать 15-20 текстов объявлений о знакомствах в Воткинске как минимум с трех различных сайтов.

- Провести автоматическое аннотирование данных текстов с целью обобщения информации о людях, ищущих знакомств и об их предпочтениях.

- Отразить результаты работы в виде графиков или таблиц.

Задание 2

- Выбрать 15-20 текстов библиографических списков из научных статей по одной и той же специальности, находящихся в свободном доступе в сети Интернет.

- Провести автоматическое аннотирование данных текстов с целью обобщения информации: например, какие авторы и работы наиболее часто цитируются, насколько современны приводимые источники и т.п.

- Отразить результаты работы в виде графиков или таблицы.

Задание 3

- Выбрать 15-20 текстов объявлений о вакансиях в Воткинске как минимум с трех различных сайтов.

- Провести автоматическое аннотирование данных текстов с целью обобщения информации: верхний и нижний предел заработной платы, график работы, обязанности и т.п.

- Отразить результаты работы в виде графиков.

Задание 4

- Выбрать 15-20 текстов объявлений о продаже квартир в Воткинске как минимум с трех различных сайтов.

- Провести автоматическое аннотирование данных текстов с целью обобщения информации: разброс цен, в каких районах продается больше квартир, средняя площадь квартиры и т.п.

- Подготовить графическое выражение результатов работы (например, в виде нескольких секторных или столбчатых диаграмм).

Задание 5

- Выбрать 15-20 коротких текстов (до 500 знаков) пользовательских отзывов о мобильных телефонах (любые модели) как минимум с трех различных сайтов.

- Провести автоматическое аннотирование данных текстов с целью обобщения мнений различных пользователей о работе выбранной модели телефона.

- Подготовить графическое выражение результатов работы (например, в виде нескольких секторных диаграмм, представляющих процентное соотношение положительных и отрицательных оценок тех или иных параметров).

Задание 6

- Выбрать 10-15 текстов рецензий на фильмы как минимум с трех различных сайтов.

- Провести автоматическое аннотирование данных текстов с целью обобщения зрительских оценок качества фильма.

- Отразить результаты работы в виде графиков или таблиц.

Задание 7

- Выбрать 10-15 текстов рецензий на книги как минимум с трех различных сайтов.

- Провести автоматическое аннотирование данных текстов с целью обобщения читательских оценок качества книги.

- Отразить результаты работы в виде графиков или таблиц.

Задание 8

- Выбрать 10-15 текстов отзывов на музыкальные альбомы различных исполнителей как минимум с трех различных сайтов.

- Провести автоматическое аннотирование данных текстов с целью обобщения оценок альбома.

- Отразить результаты работы в виде графиков или таблиц.

    1. Материалы для обработки

Коллекция цитат из новостного потока

Тестовая коллекция, с размеченными объектами

Коллекция отзывов о фотокамерах с Яндекс.Маркет

Коллекция отзывов о книгах с Имхонет:

Коллекция отзывов о фильмах с Имхонет:

Контрольные вопросы

  1. Что такое аннотация, для чего она необходима?

  2. Этапы ручного аннотирования?

  3. Что такое смысловой ориентир, для чего и как используется?

  4. Определение автоматического аннотирования, виды автоматического аннотирования?

  5. Различия и сходства ручного и автоматического аннотирования?

  6. Направления квазиреферирования(поверхностный метод)?

  7. В чем суть статистической группы методов?

  8. Что такое TF-IDF , структура формулы?

  9. В позиционных методах автоматического реферирования и ан­нотирования ключевым предложением считается?

  10. Какие два основных подхода семантических методов формирования аннотаций?

  11. Что может выступать в качестве смысловых единиц?

  12. Где используется мера TF-IDF?

  13. Формула для подсчета весов?

  14. В чем заключается суть статической группы?

  15. Поверхностные методы включают в себя?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]