Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Книги / TURIN / ЛЕКЦИИ10.DOC
Скачиваний:
40
Добавлен:
10.12.2013
Размер:
151.04 Кб
Скачать

176

10. Языки и грамматики

"В начале было слово..."

Ветхий завет

10.1. Понятие о математической лингвистике

До начала ХХ века, говоря о языках, имели в виду только естественные языки (русский, английский, латинский и т.д.), являющиеся или являвшиеся в прошлом средством общения между людьми в их обычной повседневной жизни.

Язык - важнейшее средство человеческого общения - социальное средство хранения и передачи информации, одно из средств управления человеческим поведением. Язык возник с возникновением общества в процессе совместной трудовой деятельности первобытных людей. Реализуется и существует в речи 2,2-5 тыс.языков.

В конце прошлого века была предпринята попытка создания единого языка. Эсперанто - наиболее широко распространенный искусственный международный язык (1887). Назван по псевдониму создателя Л.Заменгофа - Doctoro Esperanto(надеющийся). Основан на лексике, общей для многих европейских языков. Использует латинский алфавит.

Наука о языках - лингвистика (языкознание, от lingva- язык) - сводилась в основном к изучению конкретных естественных языков, их классификации, выяснению сходств и различий между ними.

Возникновение и развитие метаматематики, изучающей по существу язык математики, логико-философские исследования языка науки, предпринятые в 20-30-е г.г. исследования средств коммуникации у животных. Стимулировали поиск новых подходов к языку. Тогда появилась идея структуралистского подхода к лингвистике. Суть этого подхода состоит в представлении о языке, как о системе "чистых отношений", сближающее язык с абстрактными системами, изучаемыми в математике. Это представление может быть конкретизировано в концепции функционирования языка как преобразование некоторых абстрактных объектов "смыслов" - в объекте другой природы - "тексты" и обратно. Это создает возможность изучения этого преобразования математическими средствами. Этапы такого преобразования объектов языка: 1) переход от смыслов к синтаксическим структурам без линейного порядка; 2) получение линейных последовательностей слов; 3) получение цепочек звуков. Это привело в 30-х г.г. к существенно более широкому представлению о языке, при котором под языком понимается всякое средство общения, состоящее из: 1) знаковой системы, т.е. множества допустимой последовательности знаков; 2) множества смыслов этой системы (семантики); 3) соответствия между последовательностями знаков и смыслами, делающего "осмысленными" последовательности знаков. Значками могут быть буквы алфавита, иероглифы, математические обозначения, звуки, жесты и т.д. Наука об осмысленных знаковых системах называетсясемиотикой. Семиотический подход оказывается весьма плодотворным в различных областях знания - в биологии, социологии, этнографии, лингвистике; однако при этом разные ветви семиотики имеют значительную специфику и не везде еще используют точные математические средства.

Наиболее продвинутыми являются исследования знаковых систем, в которых знаками являются символы алфавитов, а последовательностями знаков - тексты; к таким знаковым системам относятся естественные языки, языки науки, а также сильно развившиеся за последние 50 лет языки программирования.

Именно интерес к языкам программирования, совпавший с новыми подходами в структурной лингвистике и необходимостью решать задачу машинного перевода естественных языков, привел в 50-х г.г. к возникновению новой науки - математической лингвистике, которая рассматривает языки как произвольные множества осмысленных текстов.

Математическая лингвистика - математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков. Возникла в 50-е годы 20 века. Математическая лингвистика - ответвление математической логики.

Правила, определяющие множество текстов, образуют синтаксис языка; описание множества смыслов и соответствия между текстами и смыслами - семантику языка. Семантика языка зависит от характера объектов, которые описываются языком, и средства ее изучения для различных типов языков различны.

О семантике языка математики - формальных теорий - мы говорили выше, исследование семантики языков программирования стало самостоятельной отраслью теоретического программирования; попытки точного описания семантики естественных языков связаны прежде всего с работами по машинному переводу.

Что же касается синтаксиса, то его особенности гораздо меньше зависят от назначения и целей языка; оказывается возможным сформулировать понятия и методы исследования синтаксиса языков, не зависящие от содержания и назначения языков. Кроме того, как уже отмечалось по поводу теории Райса, синтаксические свойства языков проще изучать и распознавать, чем семантические (хотя и при изучении синтаксиса также возникают алгоритмически неразрешимые проблемы). Поэтому наибольших успехов математическая лингвистика достигла в изучении синтаксиса, где за последние 40 лет сложился специальный математический аппарат - теория формальных грамматик, очень содержательная и интересная в теоретическом отношении и эффективная в приложениях (языки программирования, искусственный интеллект, машинный перевод). С точки зрения синтаксиса язык понимается уже не как средство общения, а как множество формальных (в смысле теории формальных систем) объектов - последовательностей символов алфавита. В теории алгоритмов и формальных систем их называют не текстами, а словами. В лингвистике естественных языков термины "текст", "слово" имеют разный смысл; поэтому в математической лингвистике последовательность символов обычно называют нейтральным термином "цепочка" (string), а язык, понимаемый как множество формальных цепочек, - формальным языком.

Соседние файлы в папке TURIN