- •I часть. «Прикладная и компьютерная лингвистика»
- •Язык и теория знаков. Семиотика (предмет, объект, методы, задачи).
- •Структурная и Математическая лингвистика. Моделирование в лингвистике. Понятие лингвистической модели. Основные требования к модели. Понятие формализации.
- •Аналитический вид
- •Синтетический вид
- •Языки и модели представления знаний и семантики (семантические сети, фреймы, логика предикатов, продукции, сценарии и др.).
- •Лингвистические модели (исследовательские, модели анализа и синтеза, порождающие). Задачи Теории формальных языков. Иерархия Хомского.
- •Иерархия Хомского:
- •Компьютерные программы поддержки лексикографических работ
- •Новые разработки в лексикографии
- •Основные понятия
- •Типы корпусов
- •Основные требования к корпусам и основная задача
- •Опыт разработки корпусов текстов
- •Технологии анализа и синтеза естественного языка. Области использования. Уровневый анализ ея, начиная с технологий ocr/icr и т.Д.
- •Морфологический анализ. Виды ма. Лингвистическое обеспечение морфоанализаторов (словарь Зализняка и др.). Лексико-грамматический анализ и разметка (pos-tagging). Области применения.
- •Синтаксический анализ, задачи вывода и разбора (формальные грамматики, модели составляющих и зависимостей, нисходящий и восходящий парсинг).
- •Формальные системы, используемые в автоматизированных и синтаксических анализах.
- •3 Основных способа представления синтаксической структуры предложения.
- •Дерево вывода.
- •Стилистика. Прикладной характер стилистических исследований. Стилистические средства языка. Функциональные стили речи. Основные особенности.
- •II) Некоторые понятия звуковых технологий
- •Синтез речи – задачи и принцип работы систем. Методы синтеза речи, способы моделирования человеческой речи, типы синтезаторов речи. Системы синтеза текст-речь.
- •II)Классификация программ call.
- •III)Дистанционное обучение ( Distant Learning)
- •3 Основных компонента в www:
- •2.2 Гипертекстовая технология
- •Как указывать ключевые слова?
- •Социолингвистика
- •Информационный язык
- •Прямой поиск
- •Инвертированный файл
- •Область технической коммуникации как новое направление прикладной лингвистики. Компетенции разработчика технической документации. Стандартизация документов.
- •Прикладная и теоретическая лингвистика – проблемы взаимовлияния.
I часть. «Прикладная и компьютерная лингвистика»
Объект и методы прикладной лингвистики. Теоретическая и прикладная лингвистика. Задачи и направления прикладной лингвистики. Область Applied Linguistics и Computational Linguistics за рубежом. История развития направления компьютерной лингвистики. Новые направления и перспективы.
«Лингвистика (языкознание, языковедение) - это наука о естественном человеческом языке вообще и обо всех языках мира как индивидуальных его представителях». Постепенно развилась в сложную и разветвленную систему дисциплин как теоретического, так и прикладного характера.
Объектом прикладной лингвистики является язык как естественный, так и искусственный.
Как всякая наука, языкознание возникло в связи с практическими потребностями. Считается что «зачатки» лингвистики появились с появлением письменности – 2-3 тыс.лет до н.э. на Др. Востоке. Первым практическим лингвистическим результатом были примитивные словари (Месопотами), а теоретическими – грамматика санскрита (Индия, 5в. до н.э.). Языкознание как наука оформилось лишь в 17-18 веке. В 19-20 вв. произошел большой подъем в области языкознания. Сам термин «Прикладная лингвистика» появился лишь в 20-хх гг. ХХ в. с расцветом технических средств.
Система основных лингвистических дисциплин:
1. Общее языкознание - изучает свойства присущие языку вообще, общие элементы языка.
2. Описательное языкознание – изучает современные языки, их структуру в настоящее время.
3. Диалектология – изучает местные территориальные разновидности одного языка.
4. Сравнительно – историческое языкознание (компаративистика).
5. Типология (универсализм) – сравнительное изучение структурных и функциональных свойств языков с точки зрения некоторых выбранных общих свойств.
6. Ареальная лингвистика – исследует распространение языковых явлений, выявляет ареалы языков.
7. Дешифровка – исследует сообщение текстов в незнакомом коде для получения информации.
8. Паралингвистика – изучает неязыковые средства в речи.
9. Этнолингвистика – изучает язык и его отношение к культуре народа.
10. Психолингвистика – связана с изучением речи.
11. Социолингвистика – изучает роль языка в обществе, воздействие общества на язык.
12. Прикладная лингвистика – в нее входят математическая лингвистика (структурная), компьютерная лингвистика (машинный перевод, языки программирования, информатика, информационный поиск), лингводидактика (обучение языку) и др.
В языкознание выделяют 3 глобальных направления:
1. Теоретическое – объяснение яз. систем и процессов
2. Описательное – описание яз. явлений
3. Прикладное – совершенствованием яз. системы и прикладными задачами связанными с языком
В рамках последнего направления сформировалась научная дисциплина «Прикладная лингвистика»
Существует несколько определений «прикладной лингвистики»:
1) Прикладная лингвистика – это комплексная дисциплина, изучающая язык в разных ситуациях его проявления и разрабатывающая методы совершенствования языковых систем и языковых процессов;
2) Прикладная лингвистика – это решение о методах решения разнообразных практических задач, с использованием знаний о языке.
Задачи прикладной лингвистики:
1) Создание и совершенствование алфавита и письменности
2) Составление словарей и тезаурусов
3) Устный, письменный перевод
4) Обучение родным и иностранным языкам. И разработка соответствующих методик
5) Создание и совершенствование искусственных языков
6) Автоматическое распознавание и синтез речи
7) Автоматический метод переработки текстовой информации
8) Информационный поиск, машинный перевод
9) Анатирование и реферирование информации
10) Разработка лингвистического обеспечения различных компьютерных систем
11) Создание систем письма для слепых и лечение речевых расстройств
И т.д.
В России П.л. понимается шире, чем за рубежом. И существуют разнообразные синонимичные направления: математическая л., структурная л., компьютерная л., вычислительная л., и т.д.
За рубежом термин «прикладная лингвистика» понимается, как более узкое направление - «Applied Linguistics»
Предметная область компьютерной лингвистики
Компьютерная лингвистика - стала активно разрабатываться за рубежом в 60-70 года 20 века и под ней в первую очередь понималось использование статистических методов языкознания. Отсюда название – «computational linguistics» (т.е. вычислительная лингвистика).
В России родственный термин – математическая лингвистика получила распространение в 70е годы. В связи с развитием компьютерных технологий и их активных приложений в лингвистических задачах этот термин трансформировался в компьютерную лингвистику.
1. Ассоциация компьютерной лингвистики (ACL):
Computational linguistics – is the scientific study of language from a computational perspective. Computational linguistics are interested in providing computational models of various kinds linguistic phenomena.
С т.з. западного подхода, основным направлением компьютерной лингвистики является автоматическая обработка естественного языка и речи (natural language processing).
Западные лингвисты включают следующие направления в области компьютерной лингвистики:
Computational morphology and syntax
Natural linguistic processing
Digital libraries
Machine translation
Speech processing (распознавание и синтез речи)
Summarization (автоматическое реферирование и аннотирование информации)
И др.
2. Российская ассоциация компьютерной лингвистики (КОЛИНГ).
Российские лингвисты приоритетно выделяют навправления:
Машинный перевод
Компьютерная лексикография
Системы поиска и классификации
Компьютерная семантика
Корпусная лингвистика
Формальные модели анализа и распознавания языковых структур (АОТ)
История компьютерной лингвистики как науки
Исторически обработки языка и речи по отдельности изучались в информатике, лингвистике, психологии и физике. Только в 20 веке компьютерная лингвистика объединила все науки и научные направления. Возникновение данной науки датируется 40-50ми годами 20 века.
.
С 1951 по 1956: создана теория конечных автоматов и регулярных выражений, сформулированы понятия о формальной грамматике и формальном моделирование языка, заложены основы формальной теории языка, определяются понятия БНФ-нотации для описания выражения, разрабатывается теория информатики Шенноном, вводится понятие информационного шума, каналов передачи информации. Декодирование сообщений. В это же время изобретается техническое устройство спектограф и закладывается теория акустики и распознавания речи.
В 57-70 года наметилось 2е парадигмы во взгляде на компьютерную лингвистику:
1. символическая, которая ввела такие понятия как синтаксический разбор предложения (парсинг), понятие ИЯ и т.д. Были созданы первые компьютерные программы и системы понимания естественного языка: -general problem solver , logic theorist
2. стохастическая, которая основывалась на понятиях математической статистики и дало развитие такому направлению как лингвостатистика. В этот же период был создан первый оптический распознаватель графем, а также появляются первые корпусы ЕЯ, например, Брауновский корпус.
В 70-83 годы : разработка алгоритмов распознавания речи, развивается семантический анализ языка, для искусственных языков создается семантический анализатор и специальный язык логического программирования: Пролог. Появляется первый робот, который умеет манипулировать предметами по команде на ЕЯ, появляются такие понятия как фрейм, сценарий, мотивы и цели пользователя.
В 83-93 годах: Появляются коммерческие системы морфологического и синтаксического анализа. Разрабатываются и используются технологии корпусной лингвистики.
В 94 по наше время. сетевые технологии и компьютерные технологии стали доступны рядовому пользователю. Особо развитыми стали системы обработки текста; редакторы текста (word); создание корпусов текстов и поисковых систем, лингвистическое обеспечение (soft); машинный перевод.
Новые направления и перспективы
В будущем можно надеяться, что переводчики станут более широко использовать — при техническом переводе — весь арсенал предоставляемых в их распоряжение вспомогательных машинных средств: от систем экранного редактирования и терминологических банков, работающих в режиме „он-лайн", до систем машинного перевода (МП). Соответственно системы МП будут пользоваться большим успехом на рынке.