- •Оглавление
- •1. Понятие прикладной лингвистики. Основные проблемы и направления.
- •2. Денотатные модели содержания текста. Понятие о денотатной структуре текста.
- •3. Принципы формального описания языков. Формальные грамматики.
- •4. Разрешение семантической неоднозначности. Основные методы.
- •5. Вероятностное моделирование лингвистических процессов
- •6. Моделирование как основной метод прикладной лингвистики. Типы моделей
- •7. Тема-рематическое структурирование текста. Понятие темы и ремы. Формальный анализ.
- •10. Типы и виды диалогов. Модели управления диалогом
- •11. Понятие политической лингвистики. Специфика речевого общения в политической сфере коммуникации.
- •12. Проблемы квантитативной лингвистики
- •13. Принципы морфологической разметки в корпусе русского литературного языка (narusco).
- •14. Корпусная лингвистика. Типы корпусов.
- •15. Аннотирование корпусов. Виды разметки корпусов.
- •18. Оптимизация обработки информации с помощью компьютера
- •20. Характеристика основных программ анализа звучащей речи (Praat, CoolEditPro, WinPitch) (основные действия, для чего, основные принципы анализа)
- •21. Основы современных программ распознавания речи. Марковские цепи
- •22. Характеристика программ распознавание письменного текста.
- •24. Дешифровка текста и диагностика искажений в словах.
- •25. Экспертные системы. Лингвистическое обеспечение экспертных систем
- •26. Автоматический семантический анализ. Проблемы и достижения. Поверхностные и глубинные уровни семантического анализа
- •27. Семантические сети. Принципы организации и применение. WordNet, RusNet
- •28. Автоматический морфологический анализ. Словарные и бессловарные методы. Тэггинг
- •29. Моделирование речевой деятельности. Модели порождения речи.
- •30. Автоматический синтаксический анализ. Парсинг. Деревья зависимостей.
- •31. Модели восприятия речи. Соотношение восприятия и понимания.
- •32. Основные проблемы терминоведения. Терминологические словари. Представление терминологии в информационных системах.
- •33. Мультимедийные и онлайновые словари. Компьютерная лексикография.
- •34. Проблемы компьютерной лингводидактики. Типы обучающего по.
- •35. Основные проблемы преподавания иностранных языков. Этапы и типы обучения ия. Структурный и коммуникативный подходы.
- •37. Обучающие и образовательные технологии и системы. Проблема эффективности компьютерных обучающих средств.
- •39. Проблемы речевого взаимодействия: коммуникативные стратегии, тактики, постулаты, импликатуры.
- •41. Пропозициональный анализ текста как одно из направлений формально-логического анализа.
- •44. Типология текстов и особенности перевода различных типов текста (Художественный и специальный перевод).
- •45. Формальный подход к переводческой эквивалентности. Методы. Особенности реализаций.
- •46. Понятие машинного перевода, классификация систем мп.
- •47. Понятие эквивалентности в теории перевода. Типы и уровни эквивалентности.
- •48. Формальный подход к оценке качества перевода. Методы. Особенности реализаций.
- •49. Системы прямого перевода, алгоритм прямого перевода.
- •50. Системы статистического перевода, особенности формирования массива переводческих пар.
- •51. Системы автоматизированного перевода. Назначение, классификация, особенности реализации.
- •52. Моделирование как метод исследования перевода. Языковые и коммуникативные модели.
- •I этап: 40-ые гг. «Первые шаги»
- •II этап: 50-ые гг. «Первое разочарование»
- •III этап: 60-ые гг. «Низкий старт»
- •IV этап: 70-80-ые гг. «Новый импульс»
- •V этап: Современное состояние:
- •53. Судебная (юридическая) лингвистика как одно из актуальных направлений прикладной лингвистики. Предмет, цели, задачи
- •55. Методология и методика лингвистической экспертизы.
- •56. Основные понятия когнитивной лингвистки. Общая характеристика когнитивного подхода к языку и речевой деятельности.
- •57. Модель концептуальной зависимости р. Шенка. Применение в пл.
- •59. Теория концептуальной метафоры Дж. Лакоффа.
- •60. Модель «смысл - текст» и.А. Мельчука. Применение в пл.
49. Системы прямого перевода, алгоритм прямого перевода.
Машинный перевод - процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой полностью специальной компьютерной программой.
Одна из классификаций МП говорит о существовании 3-х основных типов систем машинного перевода:
1. Системы, основанные на промежуточном языке (interlingua approach).
- исходят из возможности создания внеязыкового промежуточного семантико-синтаксического представления исходного текста, пригодного для его воплощения средствами нескольких языков;
- происходит в 2 этапа:
* с языка А на внутренний (вспомогательный) язык L; * с L на язык В.
при этом применяется 2 набора правил (R1 и R2).
- достоинства:
* многократное использование при переводе с определенного исходного языка;
* пригодность для работы с текстом на любом языке.
2. Системы, основанные на трансфере (transfer-based)
- предполагают 3 стадии перевода, включающие глубинную (абстрактную, семантико-синтаксическую) репрезентацию текста как для исходного языка (ИЯ), так и для языка перевода (ПЯ).
3. Системы «прямого перевода» (direct translation).
- обычно двуязычны, специально разработаны для конкретной пары языков и пригодны для перевода только в одном направлении (т.е. не способны восстановить из переводного текста исходный);
- элементы текста на языке А заменяются на элементы текста на языке В по набору правил R.
Т.е. перевод производится напрямую: система включает большой двуязычный словарь и программу анализа и генерирования текстов. Анализ исходного текста настолько подробен, насколько это необходимо для создания его переводного эквивалента на заданном языке, и не более того.
Алгоритм прямого перевода:
Наиболее распространенной является следующая последовательность формальных операций:
1. Ввод текста и поиск входных словоформ.
На этом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например, дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова м.б. получены также сведения, относящиеся к другим уровням организации языковой системы.
2. Перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области.
Этот этап включает в себя:
- перевод идиоматических словосочетаний и фразеологических единств, штампов предметной области (например, обороты in case of, in accordance with исключаются из дальнейшего грамматического анализа);
- определение основных характеристик элементов входного текста, производимое в рамках входного языка:
* грамматических * морфологических * синтаксических
* семантических * лексических
- разрешение омографии (конверсионной омонимии словоформ, например, round м.б. и существительным, и прилагательным, и наречием, и глаголом, и предлогом)
- лексический анализ и перевод лексем
Обычно на этом этапе однозначные слова отделяются от многозначных, после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие \ отсутствие контекстных определителей значения.
3. Грамматический анализ.
На этом этапе доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, при том, что в оригинале м.б. и единственное число).
4. Синтез выходных словоформ и предложений.
На этом этапе генерируется выходной текст с учетом информации, собранной на предыдущих этапах.
