
- •Оглавление
- •1. Понятие прикладной лингвистики. Основные проблемы и направления.
- •2. Денотатные модели содержания текста. Понятие о денотатной структуре текста.
- •3. Принципы формального описания языков. Формальные грамматики.
- •4. Разрешение семантической неоднозначности. Основные методы.
- •5. Вероятностное моделирование лингвистических процессов
- •6. Моделирование как основной метод прикладной лингвистики. Типы моделей
- •7. Тема-рематическое структурирование текста. Понятие темы и ремы. Формальный анализ.
- •10. Типы и виды диалогов. Модели управления диалогом
- •11. Понятие политической лингвистики. Специфика речевого общения в политической сфере коммуникации.
- •12. Проблемы квантитативной лингвистики
- •13. Принципы морфологической разметки в корпусе русского литературного языка (narusco).
- •14. Корпусная лингвистика. Типы корпусов.
- •15. Аннотирование корпусов. Виды разметки корпусов.
- •18. Оптимизация обработки информации с помощью компьютера
- •20. Характеристика основных программ анализа звучащей речи (Praat, CoolEditPro, WinPitch) (основные действия, для чего, основные принципы анализа)
- •21. Основы современных программ распознавания речи. Марковские цепи
- •22. Характеристика программ распознавание письменного текста.
- •24. Дешифровка текста и диагностика искажений в словах.
- •25. Экспертные системы. Лингвистическое обеспечение экспертных систем
- •26. Автоматический семантический анализ. Проблемы и достижения. Поверхностные и глубинные уровни семантического анализа
- •27. Семантические сети. Принципы организации и применение. WordNet, RusNet
- •28. Автоматический морфологический анализ. Словарные и бессловарные методы. Тэггинг
- •29. Моделирование речевой деятельности. Модели порождения речи.
- •30. Автоматический синтаксический анализ. Парсинг. Деревья зависимостей.
- •31. Модели восприятия речи. Соотношение восприятия и понимания.
- •32. Основные проблемы терминоведения. Терминологические словари. Представление терминологии в информационных системах.
- •33. Мультимедийные и онлайновые словари. Компьютерная лексикография.
- •34. Проблемы компьютерной лингводидактики. Типы обучающего по.
- •35. Основные проблемы преподавания иностранных языков. Этапы и типы обучения ия. Структурный и коммуникативный подходы.
- •37. Обучающие и образовательные технологии и системы. Проблема эффективности компьютерных обучающих средств.
- •39. Проблемы речевого взаимодействия: коммуникативные стратегии, тактики, постулаты, импликатуры.
- •41. Пропозициональный анализ текста как одно из направлений формально-логического анализа.
- •44. Типология текстов и особенности перевода различных типов текста (Художественный и специальный перевод).
- •45. Формальный подход к переводческой эквивалентности. Методы. Особенности реализаций.
- •46. Понятие машинного перевода, классификация систем мп.
- •47. Понятие эквивалентности в теории перевода. Типы и уровни эквивалентности.
- •48. Формальный подход к оценке качества перевода. Методы. Особенности реализаций.
- •49. Системы прямого перевода, алгоритм прямого перевода.
- •50. Системы статистического перевода, особенности формирования массива переводческих пар.
- •51. Системы автоматизированного перевода. Назначение, классификация, особенности реализации.
- •52. Моделирование как метод исследования перевода. Языковые и коммуникативные модели.
- •I этап: 40-ые гг. «Первые шаги»
- •II этап: 50-ые гг. «Первое разочарование»
- •III этап: 60-ые гг. «Низкий старт»
- •IV этап: 70-80-ые гг. «Новый импульс»
- •V этап: Современное состояние:
- •53. Судебная (юридическая) лингвистика как одно из актуальных направлений прикладной лингвистики. Предмет, цели, задачи
- •55. Методология и методика лингвистической экспертизы.
- •56. Основные понятия когнитивной лингвистки. Общая характеристика когнитивного подхода к языку и речевой деятельности.
- •57. Модель концептуальной зависимости р. Шенка. Применение в пл.
- •59. Теория концептуальной метафоры Дж. Лакоффа.
- •60. Модель «смысл - текст» и.А. Мельчука. Применение в пл.
5. Вероятностное моделирование лингвистических процессов
Имена: Зиндер, Андреев, Алексеев, Пиотровский, Ерофеева, Угланова
Вероятностными методами можно изучать динамические процессы (в них есть и порядок, и беспорядок). Для вер. моделирования каких-либо языковых явлений используются данные, полученные с помощью методов квантитативной лингвистики, в частности, статистических.
Система речевой вероятности – совокупность относительных количественных характеристик, описывающих численное соотношение между элементами в некотором массиве тексов [Зиндер, Андреев] (мат. вероятность – числовая оценка степени возможности какого-либо события). Частота и вероятность связаны примерно так же, как речь и язык: частота есть конкретное выражение абстрактной вероятности [Ерофеева Е.В.] Языковая система представляет собой совокупность языковых элементов и вероятностей их появления в тексте, язык при этом выступает в роли генеральной совокупности, а тексты – в роли выборки. По мнению Зиндера и Андреева, у человека с овладением системой языка выстраивается система вероятности речевых элементов и формируются механизмы вероятностного прогнозирования (представление о вероятностной природе речевого поведения индивида, когда он, опираясь на прошлый речевой опыт и сложившуюся под его влиянием систему закономерностей, легче ориентируется в новой ситуации, при этом снижается риск ошибочных реакций). Речевая вероятность формируется как результат взаимодействия двух факторов: во-первых, места элемента в системе языка, во-вторых, роли его денотата в экстралингвистической действительности. В сознании носителя языка речевые вероятности отражаются не как отдельные единицы, обладающие каждый определенным «индексом частоты», а в соотношении с другими единицами. [Андреев] Исследования И.Г. Овчинниковой и Н.И. Бересневой показали, что вероятностный прогноз как один из механизмов языковой компетенции, обеспечивающий ориентировку в коммуникации и планирование речевого поведения, формируется в дошкольном возрасте. Однако оценка слова как языковой единицы развивается в младшем школьном возрасте.
Виды реч.вероятности по Андрееву:
Языковая (приближенная интуитивная оценка реч.вер-ти в сознания ННЯ, определяется по шкале всегда-часто-неопределенно-редко-никогда)/ речевая (объективная вер-ть появления единицы в речи)/ метаязыковая (исследовательское приближение к реч.вер-ти, находится с помощью экспериментов).
Таким образом, в аспекте современного развития представлений о языке и человеке актуальным представляется привлечение вероятностных оснований для исследований как непосредственно самой функциональной системы, каковой является язык, так и речевого поведения человека в частности. Поскольку вероятность как данность языка является ноуменом (не данным в непосредственном опыте), то единственным источником, приближающим нас к ее познанию, оказывается область эмпирии. Как отмечает П.М. Алексеев, «чем больше сделано наблюдений, чем выше частоты того или иного элемента, чем больше существует и будет сделано частотных словарей, тем ближе мы подойдем к ненаблюдаемой вероятностной организации языковой системы» [Угланова, Субъективная оценка частоты слова и ее категоризация: онтолингвистический аспект : Дис. ... канд. филол. наук]
Вероятностное моделирование тех или иных языковых феноменов должно основываться на поиске вероятностных дифференциальных признаков (существенное превышение или снижение частоты языковой единицы в каком-либо массиве текстов над фоновой, которое не является случайным, а обусловлено какими-либо факторами, например, особенностями индивидуального стиля автора, стилем или жанром речи, принадлежностью индивида к какой-либо социальной группе и т.д.)
Вероятностные аспекты нормы. Лекции Е.В. Ерофеевой
Вероятность родства языков (см вопрос 27.)
Вероятностные подходы в социолингвистике. Вариационная социолингвистика позволяет не только описывать речевое поведение различных социальных групп, но и давать прогноз относительно речи индивида на основе знания его социальных параметров: «в идеале точная спецификация характеристик некоторого говорящего должна вполне коррелировать с осуществляемым им выбором». В работах Т.И. Ерофеевой исследовалось взаимодействие таких социальных факторов, как «место рождения», «пол», «возраст», «уровень образования», «специальность». Показано, что в разных городах Пермской области могут взаимодействовать, способствуя влиянию диалекта на речь информанта, разные градации этих факторов. Таким образом, исследования взаимодействия факторов выявили, что некоторые факторы, объединяясь друг с другом, могут способствовать образованию качественно новых социальных групп. Так, если фактор1 и фактор2 независимо друг от друга способствуют увеличению в речи частоты какого-либо явления, то их одновременное присутствие может значительно повысить использование данного явления в речи. Например, и фактор «образование», и фактор «специальность» оказывают влияние на то, насколько речь индивида близка к литературной норме; когда градации факторов «высшее образование» и «филолог», повышающие близость речи к литературной норме, совпадают, речь информантов приближается к литературной максимально. С точки зрения Ерофеевых, группы факторов можно рассматривать и как один сложный фактор, а говорящих, объединенных по нескольким факторам, как единую социальную группу.
Вероятность на разных уровнях языка.
Фонетический. Вероятность первого порядка – вер-ть появления той или иной фонемы в речи (например, в русском языке на 1 гл. приходится 6 согласных, а в устной речи – 1,3); вер-ть второго порядка – вер-ть появления второй фонемы после первой (зависит от нескольких условий: фонетический состав языка позиция в слове, состав аффиксов языка, их частотность) Вероятностное прогнозирование при восприятии речи подробно описано А.С. Штерн и ее учениками, в том числе Е.В. Ерофеевой (практика с И.А. Углановой). Результаты вероятностного моделирования частотности тех или иных фонем применяются в механизмах распознавании устной речи (марковские цепи, см. вопрос 14).
Лексический уровень. Данные о частотности слов хранятся в частотных словарях (Засориной, Шарова) и корпусе. Частотность слов сильно варьирует в разных типах текста, поэтому в словарях приводится значения частотности слова для разных текстов, как правило для художественных, публицистических, научных.
Грамматический уровень. Морфология. Частотность морфем, частей речи, падежей, глагольного управления и т.д. Наиболее интересные: исследования Гридиной по норме (изучается распределение внутри нормы, когда есть несколько вариантов, - сохранились ли все варианты, или один умер, например, окончания –а и –у в род.падеже ед.числа сохранились оба) и Горьковского ун-та по продуктивным (слова, образованные по таким моделям, встречаются на протяжении всего частотного списка, а их значения легко распознаются) и непродуктивным (отражают историю языка, не встречаются в конце частотного списка) словообразовательным моделям (продуктивность – прогноз, определяющий сходное поведение говорящих при порождении или распознавании новой комбинации морфем).
Грамматический уровень. Синтаксис. Вероятностное моделирование лежит в основе метода для анализа стилей речи и идиостиля. Текст разбивается по методу дерева зависимостей и идет подсчет количества узлов, длины дерева, густота дерева (количество узлов без стрелок зависимости), ширина узла (кол-во выходящих из узла стрелок) и т.д. Также измеряются разнообразие лексики, повторяемость слов, уникальность лексики. Подробнее в лекциях Е.В. Ерофеевой.
Перспективы исследований в области вероятностного моделирования линг.процессов заключается в поиске причин того или иного частотного распределения элементов