
- •1. Соотношение теоретической и прикладной лингвистики. Основные задачи и методы прикладных лингвистических работ.
- •2. Декларативные и процедурные знания. Формы представления знаний в прикладной лингвистике. Фреймы, сценарии, планы, модели мира.
- •3. Ситуации и ключевые слова. Ключевые слова и текст. Ключевые слова и поисковый образ документа.
- •4. Теоретические и прикладные аспекты моделирования общения.
- •5. Гипертекст как особая форма передачи информации. Структурные и функциональные особенности гипертекста. Основные типы гипертекстов.
- •6. Квантитативная (количественная) лингвистика, ее лингвистические и математические основания. Структурно-вероятностная модель языка и ее приложения.
- •11. Прикладные аспекты лексикографии. Типология словарей. Компьютерная поддержка создания и использования словарей.
- •12. Структурные компоненты (зоны) словарной статьи. Параметризация лексики. Интегральное представление лексики в словаре.
- •13. «Новый объяснительный словарь синонимов русского языка» (рук. Ю.Д. Апресян) как словарь нового типа, отражающий системные связи лексики.
- •14. Частотные словари. Их создание и использование. Специфика информации, содержащейся в частотных словарях. Строение словарной статьи частотного словаря. Лексические зоны частотного словаря.
- •15. Компьютерная поддержка лексикографических работ. Автоматические словари.
- •16. Термин, терминология и специальные подъязыки. Прикладные работы в области терминологии. Стандартизация терминологической лексики.
- •18. Словари лингвистических терминов.
- •19. Корпусная лингвистика, ее идеология и основные понятия.
- •20. Текстовый корпус как модель коммуникативной сферы. Текстовая структура Британского национального корпуса.
- •21. Корпусы текстов по русскому языку. Национальный корпус русского языка. Текстовая структура, поисковые возможности.
- •22. Конкордансы и автоматические конкордансы. Автоматический конкорданс unilex.
- •23. Автоматический морфологический анализ и процедура лемматизации.
- •1. Маркеры - вставка маркеров абзаца и строки.
- •2. Сканирование - получение словника из текста.
- •3. Лемматизация - лемматизация полученного словника.
- •4. Сортировка - сортировка по [леммам и] словоформам.
- •5. Статистика - слияние, получение частоты и ранга.
- •6. Индекс - создание индекса к словнику.
- •6. Сортировка - получение алфавитного, частотного, обратного словника и по частям речи.
- •7. Печать - печать полученного словника.
- •24. Проблема переводимости. Переводческая эквивалентность.
- •25. Переводческие трансформации.
- •I. Лексические трансформации
- •1) Словообразовательные
- •3) Синтаксические
- •26. Лингвистические модели (теории) переводческой деятельности.
- •III. Семантическая модель (Кетфорд)
- •IV. Трехфазовая модель
- •VI. Теория уровней эквивалентности.
- •27. Специфика перевода текстов разных функциональных стилей.
- •I. Научные и научно-технические
- •II. Научно-учебный текст
- •III. Научно-популярный текст
- •IV Энциклопедические тексты
- •29. Информационный поиск. Ипс, их типы, использование. Лингвистические основы разработки и функционирования ипс.
- •30. Контент-анализ, его идеология, основные понятия, использование.
22. Конкордансы и автоматические конкордансы. Автоматический конкорданс unilex.
В российской лексикографической традиции практически отсутствуют словари конкордансов, являющиеся важным инструментом изучения языка писателя.
Конкорданс в лексикографии понимается пример употребления слова в контексте фиксированной длины.
Конкорданс – список словоформ встречающихся в тексте, расположенных в алфавитном порядке, слово даётся с его словесным окружением.
Словари конкордансов включают примеры употребления всех слов в отдельном произведении или во всем творчестве писателя. Известны словари-конкордансы к поэмам О. Мандельштама, к поэзии А. Пушкина. Относительно недавно опубликован конкорданс к русскому варианту библии. Устройство словаря-конкорданса довольно просто. Словарным входом служит словоформа. Она помещается в центр строки и отделяется от текста примера дополнительными пробелами слева (разумеется, возможно, использование и других способов выделения). Пример имеет фиксированную длину, поэтому концы приводимого контекста обычно обрезаются. Пример сопровождается индексом, привязанным к какому-то достаточно полному изданию, что позволяет найти пример в тексте произведения.
Конкорданс - традиционный, давно известный, но до сих пор недостаточно оцененный способ изучения текста. Он дает полный индекс слов в ближайших и расширенных контекстах.
Вы хотите знать, что думал Достоевский о счастье? Для этого Вам достаточно открыть конкорданс любого произведения и выйти на все слова с морфемой "счаст".
Компьютерный конкорданс позволит Вам сравнить все контексты употребления слова, проанализировать их, увидеть слово в самом тексте художественного произведения. Это один из эффективных инструментов изучения литературного текста.
Система УНИЛЕКС-Т предназначена как для получения традиционных частотных словарей, словоуказателей и конкордансов, так и для формирования базы данных, позволяющей работать со словником и текстами в режиме "запрос - ответ", то есть в режиме Автоматического конкорданса. В системе не предусмотрено задание параметров для красивой (полиграфической) печати, поскольку основные пользователи системы - филологи-исследователи, для которых частотные словари, словоуказатели и конкордансы являются не конечным продуктом, предназначенным для издания, а промежуточными рабочими материалами. В частности, результаты обработки текста могут быть использованы в качестве заготовок словарных статей или как картотека при создании, пополнении или коррекции словаря, причем вход в картотеку возможен по разным параметрам: по словоформе, частоте словоформы, а при осуществлении лемматизации - дополнительно по лемме, частоте леммы и части речи. Система все же более ориентирована именно на конкордансы, но нет никаких принципиальных препятствий, которые мешали бы использовать ее только для получения частотных словарей.
Работу системы можно разделить на несколько этапов. Первый - первичная обработка текста, которая заключается в составлении словника по тексту, причем каждому слову приписываются адреса и ссылки на исходный текст. После этого можно либо осуществить лемматизацию, которая припишет словоформам леммы (словарные формы) и части речи, либо обойтись без нее, то есть остаться только со словоформами. Следующий шаг - сортировка словника по алфавиту и подсчет частот для словоформ и, если они есть, для лемм. Если пользователю не нужен диалоговый режим (автоматический конкорданс), то этим можно и ограничиться, разве что воспользоваться еще возможностью отсортировать словник по разным параметрам: по алфавиту (прямой и обратный словарь), по частоте, а если есть леммы и части речи, то по ним. Для получения словоуказателя или конкорданса по некоторому списку слов пользователь должен составить запрос по определенным правилам (если по всему словнику, то запрос не нужен). Элементами запроса могут быть словоформы, леммы, части речи, адреса. Размер контекста задается или числом символов, или числом фрагментов (если текст фрагментирован). Так же можно получить и выборку из частотного словаря, при этом подсчитывается вторая относительная частота - относительно общего объема выборки. Мы, однако, рекомендуем загрузить словник в базу данных - это позволит работать в наиболее удобном для пользователя режиме: просматривать словник и контексты на экране и только то, что ему нужно, отправлять в отдельный список - файл.