
- •Основы прикладной лингвистики
- •Раздел I. Введение
- •Раздел II. Автоматическая обработка текста (аот)
- •Фонетика и графика
- •Морфология (морфонализ)
- •Синтаксис
- •Cемантика
- •100.000 Словоупотреблений. Морфологическая и синтаксическая разметка.
- •Атрибуция текста
- •4 Методики:
- •Автоматическая проверка правописания
Основы прикладной лингвистики
Раздел I. Введение
Источники информации
www.dialog-21.ru
www.aot.ru
www.ruscorpora.ru
и др. интернет-источники, о которых позже…
Учебники (?)
Баранов А.Н. Введение в прикладную лингвистику. М., 2001.
Марчук Ю.Н. Основы компьютерной лингвистики. М., 2000.
Названия направлений и дисциплин
квантитативная лингвистика
вычислительная лингвистика
компьютерная (computational) лингвистика
инженерная лингвистика
математическая лингвистика
прикладная (applied) лингвистика
корпусная лингвистика
Понимание ПЛ
в широком смысле:
разработка методов решения практических задач, связанных с использованием языка и знаний о языке.
в узких смыслах:
преподавание иностранных языков
автоматическая обработка речи
Классические прикладные задачи
Создание и совершенствование систем письма. Реформирование графики и орфографии. Системы письма для слепых.
Транскрипция речи. Транслитерация.
Повышение скорости набора текста.
Стенография (сегодня практически не актуально).
Преподавание иностранных языков.
Логопедия, нейролингвистика и проч.
Систематизация терминологии. Изучение процессов номинации изделий, товаров.
Лексикография. Словари и справочники.
Создание и изучение искусств. языков.
Прикладная (квантитативная) лингвистика как практика применения АОТ
распознавание речи,
машинный перевод,
автоматическая классификация документов,
аннотирование текстов,
кодирование текстов,
информационный поиск
(полу)автоматический набор текста
и т.д.
Методологические основы
Оптимизация языка. Создание модели проблемной области (моделирование).
Формализация языковых данных.
Словарь как традиционный пример формализованного описания.
Но и он делается для человека-читателя.
Словарное толкование (МАС)
ХИРУ́РГ, -а, м. Врач — специалист по хирургии.
ХИРУРГИ́Я, -и, ж. Раздел медицины, изучающий заболевания, основным методом лечения которых является оперативное вмешательство, и разрабатывающий приемы, методы и технику выполнения операций.
ВРАЧ… СПЕЦИАЛИСТ…
МЕДИЦИНА… ЗАБОЛЕВАНИЕ… ОПЕРАЦИЯ…
Многозначное слово (МАС)
ДЕ́ЛАТЬ, несов., перех. (сов. сделать).
1. Создавать обычно с помощью инструментов, специальных приспособлений, машин и т. п. различного рода предметы, вещи, изделия; изготовлять, производить. Делать станки.
2. Заниматься чем-л., работать, проявлять какую-л. деятельность. Я хотел приняться за работу — не мог; хотел ничего не делать и не думать…
3. Поступать, действовать каким-л. образом. Делать все по-своему.
4. из кого-чего. Обращать, превращать в кого-, что-л. Делать из кого-л. посмешище.
◊ Делать авансы кому см. аванс; Делать акцент на чем см. акцент; Делать вид см. вид1; Делать большие (или круглые) глаза см. глаз; Делать из мухи слона см. муха; Не делать секрета из чего см. секрет1; От нечего делать — от безделья, от скуки … …
Сколько единиц хранения?
Лингвистика теоретическая vs. прикладная
ТЛ: Описание языка. Познавательный характер науки.
ПЛ: Решение конкретных задач. Техпаспорт.
! Понятие «практическая ценность исследования».
Вопросы точности и полноты исследования, количественной оценки результатов.
Взаимовлияние ТЛ и ПЛ
использование теор. данных
постановка новых теор. задач, новые требования к четкости определений, логичности классификаций
выявление нерешенных проблем
Конструкции из теор. работы
интересно также отметить и…
часто встречается у… (характерно для…)
С другой стороны:
Мат. методы (в том числе математическая статистика) – это лишь инструмент для работы. Представления и гипотезы о причинной связи должны быть привнесены из некоторой другой теории, которая позволяет содержательно объяснить изучаемое явление.
Иными словами, даже верные статистические показатели могут создать картину, которая противоречит языковой действительности.
ПЛ: данные о языке…
можно представить формализованно
перевести в компьютерный алгоритм.
Предпосылки: Человек и информационная среда
проблема ввода, распознавания, обработки информации
изменчивость и разрастание информационного пространства
дефицит времени и денег
развитие и интеграция информационных устройств
Предпосылки: Развитие научной базы
математика и информатика
психология, социология и т.д.
когнитивная лингвистика, теория представления знаний
Актуальные направления (1)
Автоматический анализ и синтез речи.
Практическая лексикография.
Корпусная лингвистика.
Информационный поиск.
Автоматическое аннотирование.
Кодирование/декодирование текста.
Упрощение ввода текста. Словари. Компьютерная проверка правописания и грамматики.
Актуальные направления (2)
Гипертекстовые системы.
Антиспам. Лингвистические аспекты борьбы с вирусами. Кстати, и спам.
Автоматический перевод.
Атрибуция текста.
Политическая и юридическая лингвистика. Лингвистические экспертизы.
Проблемы ТЕСТологии.
Искусственный интеллект как лингвистическая проблема.
Теоретические аспекты ПЛ
Моделирование языка/речи
«Лингвистический мониторинг»
Содержательные блоки курса
прикладная лингвистика и уровни автоматической обработки текста (основная часть)
информационные технологии – сферы применения лингвистических знаний