Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Тимофеева, УМК_Математ. методы в филологии

.pdf
Скачиваний:
62
Добавлен:
28.03.2016
Размер:
5.43 Mб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное бюджетное образовательное учреждение высшего профессионального образования

НОВОСИБИРСКИЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Учебно-методический комплекс «Математические методы в филологии» (для студентов гуманитарного факультета)

Новосибирск

2011

Форма обучения

очная

Документ подготовлен в рамках реализации Программы развития государственного бюджетного образовательного учреждения высшего профессионального образования «Новосибирский национальный исследовательский государственный университет» (НГУ)

на 2009–2018 годы.

Учебно-методический комплекс составлен в соответствии с ФГОС высшего профессионального образования по направлениям подготовки (квалификация (степень) "бакалавр"): 032700 Филология (стандарт утверждѐн Приказом № 34 Министерства образования и науки РФ от 14 января 2010 г.), 035800 Фундаментальная и прикладная лингвистика (стандарт утверждѐн Приказом № 1869 Министерства образования и науки РФ от 15 декабря

2010 г.)

Учебно-методический комплекс разработан доктором филологических наук М.К. Тимофеевой.

 

СОДЕРЖАНИЕ

 

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

4

1.

ЦЕЛИ ДИСЦИПЛИНЫ:

5

2.

ТРЕБОВАНИЯ К УРОВНЮ ОСВОЕНИЯ СОДЕРЖАНИЯ ДИСЦИПЛИНЫ

5

2.1. Балльно-рейтинговая система оценки знаний

5

3.

РЕКОМЕНДАЦИИ ПО ОРГАНИЗАЦИИ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

 

 

СТУДЕНТОВ

6

4.

ОБЪЁМ ДИСЦИПЛИНЫ И ВИДЫ УЧЕБНОЙ РАБОТЫ.

7

5.

СОДЕРЖАНИЕ ДИСЦИПЛИНЫ

7

5.1. Разделы дисциплины и виды занятий

7

5.2. Тематический план

9

Модуль 1. Множества, функции, отношения

9

Модуль 2. Логика

24

Модуль 3. Формальные грамматики

32

Модуль 4. Статистические методы

54

6.

МАТЕРИАЛЫ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

59

6.1.

Тренировочные задания

59

6.2.

Темы для подготовки к зачѐту по курсу «Математические методы в филологии»

69

6.3.

Задания для подготовки к тестам

70

7.

РЕСУРСЫ ИНТЕРНЕТ

79

Пояснительная записка

Учебно-методический комплекс «Математические методы в филологии» вместе с одноимѐнным сервером электронного тестирования (Портал тестирования НГУ) предназначен для обеспечения подготовки бакалавров в рамках курса «Математические методы в филологии», реализуемого на гуманитарном факультете НГУ по направлению 032700 Филология на 2 курсе во 2 семестре и по направлению 035800 Фундаментальная и прикладная лингвистика на 1 курсе во 2 семестре. Данный курс является частью профессионального цикла ООП по указанным направлениям подготовки бакалавров.

При составлении учебной программы учитывались требования соответствующих федеральных государственных образовательных стандартов высшего профессионального образования.

В соответствии с этими стандартами базовые компетенции, на развитие которых нацелен учебный курс «Математические методы в филологии», были определены следующим образом:

владение культурой мышления; способность к восприятию, анализу, обобщению информации, постановке цели и выбору путей ее достижения;

способность логически верно, аргументировано и ясно строить устную и письменную речь;

стремление к саморазвитию, повышению квалификации и мастерства;

владение основными понятиями и категориями современной лингвистики;

способность использовать в познавательной и профессиональной деятельности базовые знания в области основ информатики, элементы естественнонаучного и математического знания.

Современная наука характеризуется сильной тенденцией к междисциплинарным исследованиям. Наряду с бесспорными преимуществами, которые способен дать подобный многосторонний взгляд на изучаемые проблемы, такой подход чреват рядом труднопреодолимых сложностей. Одна из сложностей обусловлена заимствованием терминов и инструментов, переносом их из одной дисциплины в другую. Заимствование не всегда бывает корректным. Нередко перенос термина из одной профессиональной области в другую сопровождается обеднением его содержания, а перенос инструментального средства – обеднением области его применения. Возможны и более серьѐзные отклонения в использовании заимствованных терминов. Кроме того, некоторые термины, исторически происходящие из родственных источников, используются в разных дисциплинах параллельно и имеют лишь отчасти пересекающиеся трактовки. Естественно, что при проведении междисциплинарных исследований необходимо явным образом выбрать одну из этих трактовок как базовую.

Чтобы снизить вероятность некорректного усвоения (а впоследствии и использования) терминов и инструментов, основное внимание уделяется не запоминанию формулировок,

аглубине их понимания и развитию способности их практического использования. Поэтому практические занятия направлены на применение математических терминов и

инструментов, сравнение совпадающих терминов разных дисциплин, анализ вымышленных и реально встретившихся в литературе примеров их некорректного использования.

Учебно-методический комплекс содержит все определения понятий, тренировочные задания, образцы тестовых материалов необходимые для освоения курса «Математические методы в филологии».

По своему содержанию курс «Математические методы в филологии» продолжает курс «Математика и информатика» (3-й семестр бакалавриата) и предшествует курсам «Компьютерные методы в филологии», «Логические проблемы прагматики» (1-й год магистратуры).

1.Цели дисциплины:

развитие навыков точного мышления,

развитие навыков абстрактного мышления,

теоретическое знакомство с математическими понятиями и инструментами, наиболее значимыми для современного лингвиста,

приобретение базовых навыков использования таких понятий и инструментов.

Курс ориентирован на студентов гуманитарных специальностей, примеры и задачи подбираются с учетом профессиональных интересов студентов.

Особое внимание уделяется практическому освоению терминологии. В рамках каждой темы курса даются определения базовых терминов.

Курсовые работы по данному курсу не предусмотрены.

2.Требования к уровню освоения содержания дисциплины

Врезультате изучения дисциплины студенты должны освоить основные математические средства, значимые для филологических исследований; научиться использовать эти средства, расширив, тем самым, свой кругозор, усовершенствовав навыки мышления и аргументации, освоив точные методы проведения исследовательской работы.

2.1. Балльно-рейтинговая система оценки знаний

Программа курса делится на четыре логически завершенных по тематике и по времени модуля. Балльно-рейтинговое оценивание результатов обучения осуществляется в ходе текущего контроля на практических занятиях, рубежного контроля по каждому из модулей, итогового контроля.

Форма текущего контроля: выполнение индивидуальных заданий на практических занятиях. В частности, возможны короткие реферативные сообщения.

Формы рубежного и итогового контроля: компьютерное тестирование по Модулям 1-3, устный зачѐт по Модулю 4.

Необходимым условием получения положительной итоговой оценки по курсу является успешное освоение материала всех модулей (то есть оценка не менее «3» по результатам каждого рубежного контроля).

Рейтинг освоения каждого модуля (RMi) складывается из результата соответствующего рубежного контроля и баллов, полученных студентом за выполнение индивидуальных заданий по материалу данного модуля.

Текущий рейтинг работы студента (R) определяется как сумма рейтингов освоения модулей, т.е.

R= RMi

i

Текущие рейтинги подсчитываются после каждого рубежного контроля. Возможности получения баллов сведены воедино в следующей таблице.

 

 

Промежуточное

Выполнение ин-

Название

компьютерное

дивидуальных

 

 

тестирование

заданий

 

 

 

 

Модуль 1. Множества,

«3» - 5 баллов,

 

«4» - 10 баллов,

 

функции, отношения

 

«5» - 15 баллов

 

 

 

 

 

 

 

 

Модуль 2. Логика предика-

«3» - 10 баллов,

 

«4» - 15 баллов,

 

тов первого порядка

 

«5» - 20 баллов

3 балла

 

 

 

 

 

 

Модуль 3. Формальные

«3» - 10 баллов,

 

«4» - 15 баллов,

 

грамматики

 

«5» - 20 баллов

 

 

 

 

 

 

 

 

Модуль 4.

Статистические

«3» - 5 баллов,

 

«4» - 10 баллов,

 

измерения

 

 

 

«5» - 15 баллов

 

 

 

 

 

 

 

 

Итоговый

контроль (ком-

«3» - 30 баллов,

 

«4» - 35 баллов,

 

пьютерное тестирование)

 

«5» - 40 баллов

 

 

 

 

 

 

 

 

Модуль 2 («Логика предикатов первого порядка») и Модуль 3 («Формальные грамматики») являются более важными и более сложными для освоения, поэтому оцениваются более высокими баллами.

В конце семестра подсчитываются текущие рейтинги.

Согласно Положению о модульной балльно-рейтинговой системе оценки качества знаний студентов на гуманитарном факультете НГУ для получения дифференцированного зачета сумма баллов за дисциплинарные модули должна составлять от 60 до 72 баллов для оценки «удовлетворительно», 73-86 баллов для оценки «хорошо», 87-100 баллов для оценки «отлично». Если эта сумма менее 60 баллов (оценка «неудовлетворительно»), то порядок действий определяется указанным Положением.

3. Рекомендации по организации самостоятельной работы студентов

Дисциплина «Математические методы в филологии» предполагает два вида самостоятельной работы студентов: 1) на аудиторных занятиях (лекциях, семинарах, консультациях), 2) вне рамок аудиторных занятий. Цель самостоятельной работы: осмысление информации, полученной на занятиях, развитие базовых навыков еѐ практического использования, подготовка к текущим семинарам, промежуточным формам контроля знаний, сдаче итогового зачета.

Возможные формы самостоятельной работы на аудиторных занятиях:

выполнение предложенных преподавателем индивидуальных заданий;

самооценка, выявление неясностей, сложностей, формулировка вопросов по содержанию курса.

Программа курса предполагает 32 часа самостоятельной работы студентов во внеаудиторное время. Возможны следующие виды такой работы:

изучение вопросов, предложенных для самостоятельного освоения;

чтение рекомендованной учебной литературы;

поиск дополнительной литературы по содержанию курса;

выполнение тренировочных заданий, позволяющих проверить и повысить уровень освоения знаний;

подготовка индивидуальных заданий углублѐнного характера по вопросам, вы-

звавшим интерес.

Успешное освоение содержания курса возможно только при систематической самостоятельной работе студента.

4. Объѐм дисциплины и виды учебной работы.

Объѐм дисциплины – 2 зачѐтные единицы (72 часа). Из них 32 часа – аудиторные занятия (16 лекционных и 16 практических), 4 часа – компьютерное тестирование (промежуточные и итоговое), 36 часов – самостоятельная работа.

Преподавание дисциплины предусматривает следующие формы организации учебного процесса: лекции, практические занятия, контрольные работы, компьютерные тестирования, самостоятельная работа студента.

Итоговый контроль знаний – дифференцированный зачѐт.

Виды учебной работы

Всего

часов

 

 

 

Общая трудоемкость дисциплины

72

Аудиторные занятия

32

Лекции

16

Практические занятия

16

Самостоятельная работа

36

Компьютерное тестирование

4

Итоговый контроль

дифф. зачѐт

5. Содержание дисциплины

По своему содержанию курс делится на четыре дисциплинарных модуля («Множества, функции, отношения», «Логика», «Формальные грамматики», «Статистические методы») и 14 тем.

5.1. Разделы дисциплины и виды занятий

Примерный учебный план курса «Математические методы в филологии»

 

 

Количество часов

Название темы

Лекции

Семинары

Самостоятельная

 

(по группам)

работа

 

 

Модуль 1. Множества, функции, от-

4

4

10

ношения

 

 

 

Тема 1.1. Работа с системой

 

 

 

 

WordTabulator

 

2

2

 

5

Тема 1.2. Электронные тезаурусы

 

 

 

 

 

 

 

 

 

 

 

 

 

Тема

1.3.

Дешифровочные

модели

 

 

 

 

языка

 

 

 

 

 

 

Тема 1.4. Лексические функции

 

2

2

 

5

Тема 1.5. Модель порождения загадок.

 

 

 

 

 

Модель

порождения юмористиче-

 

 

 

 

ских текстов

 

 

 

 

 

Контрольная работа по модулю 1 (ком-

 

 

1

 

 

пьютерный тест)

 

 

 

 

 

 

 

 

 

 

Модуль 2. Логика

 

4

4

 

10

 

 

 

Тема 2.1. Логика предикатов первого

2

2

 

5

порядка

 

 

 

 

 

 

 

 

 

Тема 2.2. Равносильность формул

 

 

 

 

Тема 2.3. Общезначимые формулы

2

2

 

5

Тема 2.4. Некоторые понятия аристо-

 

 

 

 

 

телевской силлогистики

 

 

 

 

 

Контрольная работа по модулю 2 (ком-

 

 

1

 

 

пьютерный тест)

 

 

 

 

 

 

 

 

 

 

Модуль 3. Формальные грамматики

4

4

 

10

 

 

Тема 3.1. Формальные грамматики как

 

 

 

 

средство описания синтаксиса язы-

2

2

 

5

ка

 

 

 

 

 

 

 

 

 

 

 

Тема 3.2. Порождающие грамматики

 

 

 

 

Тема 3.3. Категориальные грамматики

 

 

 

 

Тема

3.4.

Примеры использования

2

2

 

5

грамматик для моделирования язы-

 

 

 

 

 

ка

 

 

 

 

 

 

 

Контрольная работа по модулю 3 (ком-

 

 

1

 

 

пьютерный тест)

 

 

 

 

 

 

 

 

 

 

Модуль 4. Статистические методы

4

4

 

6

 

 

 

 

Тема 4.1. Основные направления при-

2

 

 

3

менения в филологии

 

 

 

 

 

2

 

 

Тема

4.2.

Экспериментальные

иссле-

2

 

3

 

 

дования

 

 

 

 

 

 

 

 

 

 

Контрольная работа по модулю 4

 

2

 

 

 

 

 

 

 

Итоговый компьютерный тест

 

 

1

 

Всего аудиторных занятий

 

16

16

 

 

Компьютерные тестирования (про-

 

 

4

 

межуточные и итоговое)

 

 

 

 

 

 

 

 

 

Самостоятельная работа

 

 

 

 

36

Итого

 

 

 

 

 

72

 

5.2. Тематический план

Далее характеризуется содержание тем, входящих в состав модулей курса «Математические методы в филологии».

Учебно-методический комплекс содержит определения и иллюстративные материалы для всех основных математических средств, используемых в рамках курса. Списки рекомендуемой литературы приводятся в конце каждого модуля. Задания для самостоятельной работы, подготовки к промежуточным тестам и итоговому дифференцированному зачѐту содержатся в разделе 6 («Материалы для самостоятельной работы»).

Наиболее активно в филологии используются три группы математических методов: теоретико-множественные, формально-логические, статистико-вероятностные. Этому соответствуют выделяемые модули. Модуль 1 посвящѐн наиболее часто используемым в филологических исследованиях понятиям «множество», «функция», «отношение»; следующие два модуля – понятию «формальное исчисление» (Модуль 2 – логические языки, Модуль 2 – формальные грамматики); Модуль 4 – статистическим измерениям.

Модуль 1. Множества, функции, отношения

Основные сферы использования указанных базовых математических понятий таковы.

1.Компьютерные средства, предназначенные для поддержки языковых исследований

ипозволяющие существенно упростить (за счѐт частичной автоматизации) традиционные процедуры сбора и обработки данных. Взаимодействие с компьютером часто основывается на использовании формализованных языков, что, в частности, предполагает умение оперировать понятиями «множество», «функция», «отношение». Для иллюстрации рассматриваются два примера: программа WordTabulator и электронные тезаурусы.

2.Моделирование различных аспектов языковой коммуникации или исследовательской деятельности лингвиста. В качестве иллюстративных примеров рассматриваются:

исследовательская модель, разработанная И.И. Ревзиным;

описание систематических соотношений между смыслами лексических единиц в

модели «СМЫСЛ ТЕКСТ» (И.А.Мельчук);

семиотическая модель синтеза загадки (А.Н.Журинский),

семиотическая модель порождения юмористических текстов (Ю.К.Щеглов).

Тема 1.1. Работа с системой WordTabulator

Программа WordTabulator работает в среде Windows 9x/NT/2000/XP. На сайте русской виртуальной библиотеки, в разделе «Программное обеспечение» (http://www.rvb.ru/soft/wt/wt.htm) имеется подробная инструкция для пользователя. С того же сайта можно скачать саму программу (http://www.rvb.ru/soft/index.html).

Программа WordTabulator позволяет находить частоты встречаемости различных языковых единиц в заданных текстах, сравнивать состав и частотные характеристики языковых единиц из заданных совокупностей текстов. Возможен поиск всех форм заданного слова. При сравнительном анализе двух совокупностей текстов сначала формируются сами эти совокупности (Input Texts Set и Exclusion Set). Способ сравнения текстов определяется посредством задания той или иной операции над множествами (объединение, пересечение, разность). Найденные вхождения слов в текст оформляются в виде гиперссылок, система навигации позволяет перемещаться от одного вхождения к другому.

Программа может работать с тремя типами языковых единиц – словоформами, словосочетаниями, синтагмами, – определяемыми следующим образом.

Словоформа (слово) есть последовательность букв, ограниченная слева и справа знаками препинания или пробелами, начинающаяся с буквы и, возможно, включающая (-)

или апостроф ('). Например: "из-за", "О'Генри". Множество символов, встречающихся в составе словоформы, может быть переопределено пользователем.

Синтагма – это непустая последовательность словоформ, ограниченная разделителями. По умолчанию множество разделителей таково: {.,!?:;+=()[]/"<>}. Набор разделителей может быть переопределѐн пользователем.

Словосочетание – это последовательность из заданного числа словоформ в пределах одной синтагмы.

На следующей таблице изображены возможные теоретико-множественные операции над сравниваемыми множествами текстов. Через А обозначено «множество обрабатываемых текстов» (Input Texts Set), через В – «множество исключений» (Exclusion Set).

По умолчанию элементы множества исключений «вычитаются» из множества обрабатываемых элементов

В режиме «пересечение» учитываются только элементы, встречающиеся в обеих совокупностях

В режиме «объединение» исключения добавляются к множеству входных текстов

Далее на простых примерах показаны некоторые возможности программы WordTabulator (приведены формы пользовательских запросов и результаты работы программы). В примерах 1-5 используется только «множество обрабатываемых текстов».

Пример 1. Поиск всех вхождений слов, оканчивающихся на -ed. (Во втором столбце таблицы содержатся гиперссылки, позволяющие перейти к тексту, содержащему данное вхождение.) Анализируется один текст. Результат работы программы представлен в виде таблицы. В последней строке таблицы указано суммарное число найденных вхождений заданной языковой единицы.

Query: *ed (символ «*» означает, что начальный отрезок слова может быть любым)

Item type: a Word

#

Items (элементы)

Links (ссылки)

Freq. (частота)

 

 

 

 

1.

constructed

1 (1)

1

 

 

 

 

2.

oriented

1 (1)

1

 

 

 

 

3.

proposed

1 (1)

1

 

 

 

 

4.

Related

1 (2)

2

 

 

 

 

5.

revealed

1 (1)

1

 

 

 

 

6.

studied

1 (1)

1

 

 

 

 

7.

truth-oriented

1 (1)

1

 

 

 

 

 

 

 

8