
- •9. Технология гипертекста и ее использование в информационных системах.
- •10. Метод контент-анализа
- •11. Квантитативная лингвистика.
- •12. Автоматическое реферирование текста.
- •13. Компьютерная лексикография: программы поддержки, автоматические словари.
- •19. Перевод как прикладная лингвистическая дисциплина
- •20. Машинный перевод
- •21. Методика преподавания иностранного языка.
- •22. Автоматические обучающие системы
- •23. Дистанционное обучение
- •24. Автоматический синтез текста.
- •26. Нейро-лингвистическое программирование
- •27. Языковые механизмы вариативной интерпретации действительности
- •Типология
- •28. Психолигвистика
12. Автоматическое реферирование текста.
Основной продукт современного мира - это информация. Она встречается в нашей жизни в разных формах, и в большом количестве в цифровом виде. Как человеку ориентироваться в огромных объёмах информации, как найти то, что ему нужно в данный момент? Эту проблему решают и поисковые системы и различные сайты новостей. Но программы поиска требуют умения находить нужную информацию, опыта и времени. А Во многих делах на помощь человеку приходит компьютер; а нельзя ли создать программу, которая сама бы составляла статьи, рефераты? Находила бы самые важные моменты и объединяла их?
В ответ на эти вопросы приходят программы автоматического реферирования текста. Последнее время их становится всё больше. Они включаются в системы поиска документов, например как в программе "Следопыт" компании МедиаЛингва, в текстовые редакторы как в Microsoft Word и т.д. Они исследуют исходный текст и выводят только ту часть текста, которая наиболее полно описывает весь текст или часть текста. Для каких документов возможно применение автоматического реферирования? К текстам содержащим объёмное описание чего-либо: например новости, научные статьи, технические обзоры, документация. Очевидно, что для художественного текста это весьма нелепо, т.к. художественный текст хорош именно художественным содержанием, а не кратким описанием: "пришёл, увидел, победил".
Реферирование основывается на двух подходах:
· Общий - при создании реферата программа основывается на общих положениях создания текста. Преимущество: рефераты одинокого хороши для любых тем.
· Специфический - при создании реферата программа уже настроена на определённые типы рефератов. Например научный, или социальные новости, или экономика… В данных программах качество рефератов на порядок лучше, если правильно выбрана ориентация.
Идеальных рефератов практически не получается, потому, что статьи написанные людьми, отражают их индивидуальность, и для компьютера нет возможности анализировать все стилистические типы статей. Хотя последнее время стали использоваться сложные методы сглаживания рефератов, основанные на построении структуры предложения и привидения всех отобранных предложений к одному "гладкому" тексту. Но нужно отдавать отчёт, что программа автоматического реферирования всего лишь помощник человеку, и ещё долгое время не сможет заменить его. Что же может нам дать автоматическое реферирование?
· Во первых сэкономить часть времени, на прочтении не существенных (по мнению программы) моментов исходного текста. Программа отыскивает предложения, отвечающие наиболее полным образом о содержании текста. И если пользователя заинтересовала данная информация, он прочитает весь текст.
· Во вторых ускорит процесс создания рецензий и кратких статей, выдержек. Пользователь пропускает значительный объём информации через программу, и получая на выходе автореферат, вручную обрабатывает его, дописывает упущения, которые допустила программа, добавляет информацию из своих источников. Связывает предложения (в дальнейшем эту часть тоже будет делать программа). И получает текст, который уже можно публиковать.
· В третьих, данная программа может создавать выдержки из текста для поисковых систем, которые выдают пользователю весьма ограниченный объём, для ознакомления.