- •1. Дайте определение понятию «лингвистическая база данных».
- •2. Дайте определение термину «компьютерная лингвистика».
- •3. Что относится к лингвистическим базам данных?
- •14. Дайте определения терминам: «поисковый робот», «поисковая машина» и «индекс».
- •15. Перечислите виды поиска.
- •21. Назовите типы поисковых систем, к которым относятся поисковые системы Lexxe, ImHalal и Yauba.
- •22. Раскройте понятие «электронная библиотека».
- •23. В чем суть электронных библиотек и основное их отличие от национальных корпусов?
- •25. Что такое «уникальный текст» и «копирайтинг»?
1. Дайте определение понятию «лингвистическая база данных».
Разновидность компьютерных баз данных, ядром которой являются языковые единицы : фонемы, морфемы, лексемы, предложения, тексты, а также отношения между этими единицами.
2. Дайте определение термину «компьютерная лингвистика».
Компью́терная лингви́стика (также: математи́ческая или вычисли́тельная лингви́стика, англ. computational linguistics) — направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков. Полем деятельности компьютерных лингвистов является разработка алгоритмов и прикладных программ для обработки языковой информации.
3. Что относится к лингвистическим базам данных?
Не совсем могу понять вопрос, но, по-моему, он имел в виду 3 основных сферы применения (ибо больше ничего тут не приписать. Конспект той лекции в полной объеме, больше ничего нету)
3 основных сферы применения:
- обеспечение функционирования различных автоматизированных систем, связанных с обработкой текста и речи ( экспертные системы, обучающие системы, системы машинного перевода)
- Автоматическая лексикография (Автоматизация всех словарей)
- Автоматизация трудов различных лингвистов.
4. Назовите время возникновения и авторов гипотезы лингвистической относительности.
30-е гг XX века. Американцы Э.Сэпир и Б.Уорф.
5. Благодаря какому событию вошел в историю Уоррен Уивер?
Был родоначальником автоматического перевода. В 1947 году впервые сформулировал концепцию машинного перевода.
6. В чем суть Джорджтаунского эксперимента? Назовите год этого эксперимента
1954 год. Продемонстрировал возможности автоматического перевода. Машине было предложено 6 грамматических правил и 250 слов
7. Как назывался первый большой компьютерный корпус?
Brown Corpus или Брауновский корпус. (В 1963 г. в Брауновском университете (США) для создания частотного словаря американского варианта английского языка был создан большой корпус на цифровом носителе (Brown Corpus), включающий 1 млн. слов.)
8. С какого времени начинается создание национальных корпусов языков?
Первые национальные корпусы появились еще в 60-х гг (Brown University Corpus и Lancaster/Oslo-Bergen Corpus)
9. Раскройте термин «обработка естественного языка» (Natural Language Processing).
Общее направление искусственного интеллекта и математической лингвистики, изучающее проблемы компьютерного анализа и синтеза естественных языков.
10. Перечислите основные задачи, решаемые в области Natural Language Processing.
-синтез речи
- распознавание речи
-анализ текста
-машинный перевод
- вопросно-ответные системы
-информационно-поисковые системы
-извлечение информации
11. Что такое лингвистическое программное обеспечение?
Лингвистическое программное обеспечение (англ. lingware = linguistic + software) — компьютерные программы и данные, обеспечивающие анализ, обработку, хранение и поиск аудиоданных, рисунков (OCR) и текстов на естественном языке
12. Дайте определение понятию «информационный поиск».
Информацио́нныйпо́иск (англ. Informationretrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.
13. Дайте определения терминам: «информационно-поисковая система», «запрос», «объект запроса», «релевантность».
Поиско́ваясисте́ма — программно-аппаратный комплекс с веб-интерфейсом(клиент-серверное приложение, клиент- браузер, а сервер — веб-сервер ), предоставляющий возможность поиска информации в Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы.
Релева́нтность (лат. relevo — поднимать, облегчать) в информационном поиске — семантическое соответствие поискового запроса и поискового образа документа (степень соответствия запроса и найденного, т.е. уместность результата).
Запро́с — Запрос — это формализованный способ выражения информационных потребностей пользователем системы.
Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска.