Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LINGVO_BD.docx
Скачиваний:
2
Добавлен:
16.09.2019
Размер:
13.17 Кб
Скачать

1. Дайте определение понятию «лингвистическая база данных».

Разновидность компьютерных баз данных, ядром которой являются языковые единицы : фонемы, морфемы, лексемы, предложения, тексты, а также отношения между этими единицами.

2. Дайте определение термину «компьютерная лингвистика».

Компью́терная лингви́стика (также: математи́ческая или вычисли́тельная лингви́стика, англ. computational linguistics) — направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков. Полем деятельности компьютерных лингвистов является разработка алгоритмов и прикладных программ для обработки языковой информации.

3. Что относится к лингвистическим базам данных?

Не совсем могу понять вопрос, но, по-моему, он имел в виду 3 основных сферы применения (ибо больше ничего тут не приписать. Конспект той лекции в полной объеме, больше ничего нету)

3 основных сферы применения:

- обеспечение функционирования различных автоматизированных систем, связанных с обработкой текста и речи ( экспертные системы, обучающие системы, системы машинного перевода)

- Автоматическая лексикография (Автоматизация всех словарей)

- Автоматизация трудов различных лингвистов.

4. Назовите время возникновения и авторов гипотезы лингвистической относительности.

30-е гг XX века. Американцы Э.Сэпир и Б.Уорф.

5. Благодаря какому событию вошел в историю Уоррен Уивер?

Был родоначальником автоматического перевода. В 1947 году впервые сформулировал концепцию машинного перевода.

6. В чем суть Джорджтаунского эксперимента? Назовите год этого эксперимента

1954 год. Продемонстрировал возможности автоматического перевода. Машине было предложено 6 грамматических правил и 250 слов

7. Как назывался первый большой компьютерный корпус?

Brown Corpus или Брауновский корпус. (В 1963 г. в Брауновском университете (США) для создания частотного словаря американского варианта английского языка был создан большой корпус на цифровом носителе (Brown Corpus), включающий 1 млн. слов.)

8. С какого времени начинается создание национальных корпусов языков?

Первые национальные корпусы появились еще в 60-х гг (Brown University Corpus и Lancaster/Oslo-Bergen Corpus)

9. Раскройте термин «обработка естественного языка» (Natural Language Processing).

Общее направление искусственного интеллекта и математической лингвистики, изучающее проблемы компьютерного анализа и синтеза естественных языков.

10. Перечислите основные задачи, решаемые в области Natural Language Processing.

-синтез речи

- распознавание речи

-анализ текста

-машинный перевод

- вопросно-ответные системы

-информационно-поисковые системы

-извлечение информации

11. Что такое лингвистическое программное обеспечение?

Лингвистическое программное обеспечение (англ. lingware = linguistic + software) — компьютерные программы и данные, обеспечивающие анализ, обработку, хранение и поиск аудиоданных, рисунков (OCR) и текстов на естественном языке

12. Дайте определение понятию «информационный поиск».

Информацио́нныйпо́иск (англ. Informationretrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.

13. Дайте определения терминам: «информационно-поисковая система», «запрос», «объект запроса», «релевантность».

Поиско́ваясисте́ма — программно-аппаратный комплекс с веб-интерфейсом(клиент-серверное приложение, клиент- браузер, а сервер — веб-сервер ), предоставляющий возможность поиска информации в Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы.

Релева́нтность (лат. relevo — поднимать, облегчать) в информационном поиске — семантическое соответствие поискового запроса и поискового образа документа (степень соответствия запроса и найденного, т.е. уместность результата).

Запро́с — Запрос — это формализованный способ выражения информационных потребностей пользователем системы.

Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]