
- •Оглавление
- •1. Понятие прикладной лингвистики. Основные проблемы и направления.
- •2. Денотатные модели содержания текста. Понятие о денотатной структуре текста.
- •3. Принципы формального описания языков. Формальные грамматики.
- •4. Разрешение семантической неоднозначности. Основные методы.
- •5. Вероятностное моделирование лингвистических процессов
- •6. Моделирование как основной метод прикладной лингвистики. Типы моделей
- •7. Тема-рематическое структурирование текста. Понятие темы и ремы. Формальный анализ.
- •10. Типы и виды диалогов. Модели управления диалогом
- •11. Понятие политической лингвистики. Специфика речевого общения в политической сфере коммуникации.
- •12. Проблемы квантитативной лингвистики
- •13. Принципы морфологической разметки в корпусе русского литературного языка (narusco).
- •14. Корпусная лингвистика. Типы корпусов.
- •15. Аннотирование корпусов. Виды разметки корпусов.
- •18. Оптимизация обработки информации с помощью компьютера
- •20. Характеристика основных программ анализа звучащей речи (Praat, CoolEditPro, WinPitch) (основные действия, для чего, основные принципы анализа)
- •21. Основы современных программ распознавания речи. Марковские цепи
- •22. Характеристика программ распознавание письменного текста.
- •24. Дешифровка текста и диагностика искажений в словах.
- •25. Экспертные системы. Лингвистическое обеспечение экспертных систем
- •26. Автоматический семантический анализ. Проблемы и достижения. Поверхностные и глубинные уровни семантического анализа
- •27. Семантические сети. Принципы организации и применение. WordNet, RusNet
- •28. Автоматический морфологический анализ. Словарные и бессловарные методы. Тэггинг
- •29. Моделирование речевой деятельности. Модели порождения речи.
- •30. Автоматический синтаксический анализ. Парсинг. Деревья зависимостей.
- •31. Модели восприятия речи. Соотношение восприятия и понимания.
- •32. Основные проблемы терминоведения. Терминологические словари. Представление терминологии в информационных системах.
- •33. Мультимедийные и онлайновые словари. Компьютерная лексикография.
- •34. Проблемы компьютерной лингводидактики. Типы обучающего по.
- •35. Основные проблемы преподавания иностранных языков. Этапы и типы обучения ия. Структурный и коммуникативный подходы.
- •37. Обучающие и образовательные технологии и системы. Проблема эффективности компьютерных обучающих средств.
- •39. Проблемы речевого взаимодействия: коммуникативные стратегии, тактики, постулаты, импликатуры.
- •41. Пропозициональный анализ текста как одно из направлений формально-логического анализа.
- •44. Типология текстов и особенности перевода различных типов текста (Художественный и специальный перевод).
- •45. Формальный подход к переводческой эквивалентности. Методы. Особенности реализаций.
- •46. Понятие машинного перевода, классификация систем мп.
- •47. Понятие эквивалентности в теории перевода. Типы и уровни эквивалентности.
- •48. Формальный подход к оценке качества перевода. Методы. Особенности реализаций.
- •49. Системы прямого перевода, алгоритм прямого перевода.
- •50. Системы статистического перевода, особенности формирования массива переводческих пар.
- •51. Системы автоматизированного перевода. Назначение, классификация, особенности реализации.
- •52. Моделирование как метод исследования перевода. Языковые и коммуникативные модели.
- •I этап: 40-ые гг. «Первые шаги»
- •II этап: 50-ые гг. «Первое разочарование»
- •III этап: 60-ые гг. «Низкий старт»
- •IV этап: 70-80-ые гг. «Новый импульс»
- •V этап: Современное состояние:
- •53. Судебная (юридическая) лингвистика как одно из актуальных направлений прикладной лингвистики. Предмет, цели, задачи
- •55. Методология и методика лингвистической экспертизы.
- •56. Основные понятия когнитивной лингвистки. Общая характеристика когнитивного подхода к языку и речевой деятельности.
- •57. Модель концептуальной зависимости р. Шенка. Применение в пл.
- •59. Теория концептуальной метафоры Дж. Лакоффа.
- •60. Модель «смысл - текст» и.А. Мельчука. Применение в пл.
18. Оптимизация обработки информации с помощью компьютера
Преобладающая часть информации существует в виде устных и письменных текстов на естественном языке. Поэтому большое значение имеет обработка естественно-языковой информации. Прикладная лингвистика может быть определена как дисциплина, в которой целенаправленно изучаются и разрабатываются способы оптимизации различных сфер функционирования языковой системы.
Основные недостатки обработки информации человеком – низкая скорость и низкая эффективность, а также склонность к ошибкам. Причины, по которым возникают подобные проблемы:
1. Недостаточная емкость оперативной памяти (7 + \ - 2)
2. Последовательная обработка информации (быстрое переключение внимания, автоматизм деятельности)
3. Медленный процесс записи информации для сохранения в долговременной памяти (нужно прилагать усилия для того, чтобы запомнить надолго)
4. Сокращение и упрощение реального мира и его закономерностей при создании абстрактных пространственных моделей (человек не умеет ориентироваться в пространстве, не упрощая существенные для реального мира признаки).
Компьютер помогает избежать данных проблем.
Существует несколько видов лингвистических программ для оптимизации обработки информации.
1. Программы, связанные с распознаванием устной речи
- типы систем распознавания речи:
* пофонемное распознавание звукового сигнала
Получение акустических характеристик и распознавание фонем по ним.
Например, акустич. хар-ка: источники шума (имплазивные \звук - преграда\, турбулентные \щель - ветер\).
Главный недостаток программ: ограниченные возможности у систем при распознавании слога; пофонемные программы не учитывают трансформацию акустических сигналов в потоке речи.
Используются в технических сетях.
* распознавание изолированных слов
- Главный недостаток: маленький словарь (ок. 100 слов)
Использование в робототехнике
- Основная проблема: вариативность произнесения слов различными дикторами.
- Словарь в памяти компьютера организован как система акустических эталонов слов. Каждый эталон – набор вариантов произнесения слова (мужчина \ женщина).
* большие системы
- распознавание сегментов речи путем дробления их на более мелкие отрезки, вплоть до фонем, и установление графических соответствий каждому отрезку (соотношение устной речи и письменного текста).
- Вся программа – путь от речевого сигнала к словарю (письменный вариант)
- строятся на Марковских цепях, т.е. на оценке вероятности последовательности символов в речевой цепи
Основная проблема: перевод фонем в графемы:
* распознавание отрезков речевой цепи, в которой выделяются более мелкие единицы
* элементы речевой цепи могут распознаваться как фонетические слова
Достоинство: словарь м. исчисляться 1000-ми слов
Для таких программ необходимы базы данных графических сочетаний (диграфы, триграфы) и типы структур русского слога.
Использование: ответы компьютера на человеческие звонки (запись к врачу, вокзал, почта…)
2. Программы, связанные с распознаванием письменного текста
Учитывается:
- статистические данные о комбинации знаков алфавита (например, что перед Ь\Ъ не может быть пробела)
- вероятностные характеристики сочетаний знаков (оценка вероятности сочетания букв)
- частотность слов \ частотность последовательности алфавитных символов (например, предлог «В» частотнее предлога «ВО»)
- частотность устойчивых и свободных словосочетаний
Задача графического распознавания:
- поиск искажений
- дешифровка новых текстов
- пополнение словаря новыми единицами