Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
PL.docx
Скачиваний:
29
Добавлен:
25.09.2019
Размер:
78.38 Кб
Скачать

12. Автоматическое реферирование текста.

Основной продукт современного мира - это информация. Она встречается в нашей жизни в разных формах, и в большом количестве в цифровом виде. Как человеку ориентироваться в огромных объёмах информации, как найти то, что ему нужно в данный момент? Эту проблему решают и поисковые системы и различные сайты новостей. Но программы поиска требуют умения находить нужную информацию, опыта и времени. А Во многих делах на помощь человеку приходит компьютер; а нельзя ли создать программу, которая сама бы составляла статьи, рефераты? Находила бы самые важные моменты и объединяла их?

В ответ на эти вопросы приходят программы автоматического реферирования текста. Последнее время их становится всё больше. Они включаются в системы поиска документов, например как в программе "Следопыт" компании МедиаЛингва, в текстовые редакторы как в Microsoft Word и т.д. Они исследуют исходный текст и выводят только ту часть текста, которая наиболее полно описывает весь текст или часть текста. Для каких документов возможно применение автоматического реферирования? К текстам содержащим объёмное описание чего-либо: например новости, научные статьи, технические обзоры, документация. Очевидно, что для художественного текста это весьма нелепо, т.к. художественный текст хорош именно художественным содержанием, а не кратким описанием: "пришёл, увидел, победил".

Реферирование основывается на двух подходах:

· Общий - при создании реферата программа основывается на общих положениях создания текста. Преимущество: рефераты одинокого хороши для любых тем.

· Специфический - при создании реферата программа уже настроена на определённые типы рефератов. Например научный, или социальные новости, или экономика… В данных программах качество рефератов на порядок лучше, если правильно выбрана ориентация.

Идеальных рефератов практически не получается, потому, что статьи написанные людьми, отражают их индивидуальность, и для компьютера нет возможности анализировать все стилистические типы статей. Хотя последнее время стали использоваться сложные методы сглаживания рефератов, основанные на построении структуры предложения и привидения всех отобранных предложений к одному "гладкому" тексту. Но нужно отдавать отчёт, что программа автоматического реферирования всего лишь помощник человеку, и ещё долгое время не сможет заменить его. Что же может нам дать автоматическое реферирование?

· Во первых сэкономить часть времени, на прочтении не существенных (по мнению программы) моментов исходного текста. Программа отыскивает предложения, отвечающие наиболее полным образом о содержании текста. И если пользователя заинтересовала данная информация, он прочитает весь текст.

· Во вторых ускорит процесс создания рецензий и кратких статей, выдержек. Пользователь пропускает значительный объём информации через программу, и получая на выходе автореферат, вручную обрабатывает его, дописывает упущения, которые допустила программа, добавляет информацию из своих источников. Связывает предложения (в дальнейшем эту часть тоже будет делать программа). И получает текст, который уже можно публиковать.

· В третьих, данная программа может создавать выдержки из текста для поисковых систем, которые выдают пользователю весьма ограниченный объём, для ознакомления.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]