
- •Оглавление
- •Элементы теорий вероятностей и информации в лингвистике
- •1. Вопросы к разделу «Случайное событие, классическая и статистическая вероятности случайного события, операции сложения и умножения вероятностей случайных событий»
- •2. Вопросы к разделу «Информация и информационные характеристики текста»
- •3. Вопросы к разделу «Случайные величины и числовые характеристики случайных величин»
- •4. Примеры решения типовых лингвистических задач
- •Литература
- •Приложение
- •Закодированный текст
КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
МЕТОДИЧЕСКОЕ ПОСОБИЕ
ПО КУРСУ
«ИНФОРМАТИКА И МАТЕМАТИКА»
(для студентов филологического факультета)
Казань
2009
Печатается по решению Редакционно-издательского совета филологического факультета Казанского государственного университета
Рекомендовано
кафедрой теоретической и прикладной лингвистики Казанского государственного университета
(протокол № от 2009)
Составитель
доцент Т.И. Ибрагимов
Рецензенты
кандидат физ.-мат. наук, доцент Ф.И. Салимов,
кандидат филологических наук, доцент Р.Э. Кульшарипова
МЕТОДИЧЕСКОЕ ПОСОБИЕ ПО КУРСУ «ИНФОРМАТИКА И МАТЕМАТИКА» (для студентов филологического факультета). – Казань: Казанский государственный университет, 2009. - 24 с.
Предназначено для студентов–филологов и составлено в соответствии с программой курса. Содержит вопросы, упражнения и задачи для самостоятельной работы студентов.
Оглавление
Введение 4
Элементы теорий вероятностей и информации в лингвистике 4
1. Вопросы к разделу «Случайное событие, классическая и статистическая вероятности случайного события, операции сложения и умножения вероятностей случайных событий» 5
2. Вопросы к разделу «Информация и информационные характеристики текста» 6
3. Вопросы к разделу «Случайные величины и числовые характеристики случайных величин» 8
4. Примеры решения типовых лингвистических задач 12
Литература 20
Приложение 21
Введение
Курс рассчитан на 72 часа, из них лекционных 20. Курс включает два раздела. В первом разделе даются основные понятия информатики, такие как информационная система, информация, способы измерения информации, единицы измерения информации и т.д. В части «Компьютерные технологии в обработке информации» приводятся некоторые сведения об алгоритмах и алгоритмическом решении задач. Основное внимание уделяется обучению студентов работе с текстовым процессором Word и электронной таблицей Excel.
Вторая часть курса предполагает ознакомление с основными положениями теории вероятностей и информации. Изучение этих разделов математики обусловлено их актуальностью в современной теоретической и прикладной лингвистике. На примерах по типологии языков, построению частотных словарей, изучению жанровых особенностей текста студенты получают навыки применения математических методов в исследовании языка. Изложение материала курса в такой последовательности (сначала информатика, а затем математика) связано с незнанием студентами языка программирования. При решении лингвистических задач с применением теории вероятностей и математической статистики обучающиеся должны использовать вычислительные средства Word и Excel, которые в настоящее время достаточно полно обеспечены методической литературой.
Что касается математической части курса, то методических разработок для филологических специальностей (с таким объемом часов на изучение дисциплины) практически нет. Настоящее методическое пособие предназначено для студентов–филологов и составлено в соответствии с программой курса. Содержит вопросы, упражнения и задачи для самостоятельной работы студентов.
Элементы теорий вероятностей и информации в лингвистике
Основные понятия. Случайное событие, вероятность случайного события, классическое определение вероятности. Вероятности невозможного и достоверного событий. Статистическая вероятность случайного события. Несовместные случайные события, вероятность суммы двух несовместных случайных событий. Независимые случайные события, умножение вероятностей независимых событий. Постановка статистического эксперимента. Эмпирическая (статистическая) и априорная вероятности случайного события. Статистическая совокупность, генеральная статистическая совокупность. Выборка, формирование выборки. Оценка абсолютной и относительной погрешностей вероятности случайного события. Закон больших чисел. Определение объема выборки при заданных точности вычисления и доверительной вероятности.
Информация и неопределенность - семантическая, синтактическая и прагматическая. Измерение синтактической информации, единицы измерения информации. Зависимые случайные события. Условная вероятность случайного события, вероятность совместного наступления двух зависимых случайных событий. Контекстная обусловленность единиц языка, избыточность в естественных языках.
Случайная величина. Закон распределения вероятностей случайной величины. Числовые характеристики случайной величины, среднее арифметическое значение, математическое ожидание, дисперсия случайной величины, среднее квадратичное отклонение случайной величины от среднего значения. Оценка вероятности отклонения среднего арифметического значения случайной величины от математического ожидания (доверительный интервал). Определение количества необходимых измерений случайной величины при условии, что вероятность расхождения между средним арифметическим случайной величины и ее и математическим ожиданием не превышает заданную сколь угодно малую положительную величину близка к единице. Методы проверки статистических гипотез (критерии согласия полученных статистических измерений с теоретическими).