- •Часть1. Тематический план дисциплины
- •Часть 2. Конспекты лекций 8
- •Часть 3. Вопросы и задания для практических работ. 79
- •Часть 4. Задания для самостоятельной работы 92
- •Часть 5. Лабораторные работы 97
- •Часть1. Тематический план дисциплины «Основы математической обработки информации»
- •Часть 2. Конспекты лекций
- •1.1. Исторические периоды развития математики.
- •1.2. Основы теории множеств
- •1.2.1. Начальные понятия теории множеств.
- •2.1.3. Основные понятия комбинаторики
- •2) Перестановка из n элементов – это размещение из n элементов по n.
- •2.2. Начальные понятия теории вероятностей
- •2.2.2. Определения вероятности событий
- •3.1. Действия над событиями
- •3.2. Вероятность суммы событий
- •3.3. Вероятность произведения событий.
- •3.4. Вычисление вероятности цепочек языковых элементов.
- •3.5. Формула полной вероятности. Формула Байеса.
- •1 H2) Формула полной вероятности.
- •3.6. Теорема Бернулли
- •3.7. Вероятностное моделирование порождения текста.
- •3.8. Предельные теоремы в схеме Бернулли
- •4.1. Случайная величина (св). Начальные понятия.
- •4.2. Функция распределения св (интегральная функция распределения) f(X)
- •4.3. Функция плотности вероятности нсв f(X)
- •4.4. Числовые характеристики св
- •4.5. Законы распределения случайных величин.
- •1) Биномиальный закон распределения.
- •2) Закон Пуассона
- •3) Нормальное распределение (закон Гаусса)
- •6. Вероятность попадания нсв х в заданный промежуток
- •7. Логнормальное распределение
- •5.1. Система двух случайных величин (двумерная св) (1 час)
- •5.1.1. Начальные понятия.
- •5.1.2. Операции над независимыми случайными величинами
- •5.1.3. Числовые характеристики системы двух св
- •5.2. Предельные теоремы теории вероятностей: Закон больших чисел, Центральная предельная теорема и их значение для лингвистического эксперимента.(1 час)
- •5.2.1. Теорема Чебышева для среднего арифметического случайных величин.
- •6.1. Предмет математической статистики. Генеральная и выборочная совокупность.
- •6.2. Статистическое распределение выборки и его графическое изображение
- •6.2.1. Дискретный статистический ряд
- •6.2.2. Интервальный статистический ряд
- •6.3. Числовые характеристики статистического распределения
- •Лекция 7. Элементы теории статистических оценок и проверки гипотез.
- •7.1 Статистические оценки параметров распределения и их свойства. Оценка параметров генеральной совокупности по выборке
- •7.1.1. Свойства статистических оценок:
- •7.1.2. Точечные оценки математического ожидания, дисперсии и вероятности.
- •7.1.3. Интервальное оценивание параметров.
- •7.1.4. Доверительные интервалы для параметров нормального распределения
- •7.1.5. Число степеней свободы
- •7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- •7.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез.
- •7.2. Проверка статистических гипотез.
- •7.2.1. Статистические гипотезы.
- •7.2.2. Статистический критерий
- •4.2.3. Принцип проверки статистических гипотез
- •7.2.4. Ошибки при проверке гипотез
- •7.2.5. Проверка лингвистических гипотез с помощью параметрических критериев.
- •7.2.6. Проверка гипотез с помощью непараметрических критериев.
- •Часть 3. Вопросы и задания для практических работ.
- •I. Элементы комбинаторики.
- •Часть 4. Задания для самостоятельной работы
- •1. Графический способ.
- •2. Критерий асимметрии и эксцесса.
- •3. Критерий Колмогорова-Смирнова.
- •4. Критерий Пирсона
- •Приложение 1. Значения интегральной функции Лапласа
- •Приложение 2. Критические значения ( распределение Пирсона)
2.1.3. Основные понятия комбинаторики
1) Размещение из n элементов по m (m≤ n) - упорядоченное подмножество из m элементов множества, которое содержит n элементов.
Например, все размещения из 4 элементов множества {A,B,M,K} по 2 составляют следующее множество: {A,B},{A,M},{A,K},{B,M},{B,K},{M,K},{B,A},{M,A},{K,A},{M,B}, {K,B}, {K,M}.
Два размещения отличаются составом или порядком расположения элементов.
Число размещений из n элементов по m обозначается и находится по формуле:
Доказательство:
2) Перестановка из n элементов – это размещение из n элементов по n.
Например, все перестановки из 3 элементов множества {f; p;q} составляют следующее множество: {f;p;q}, {f;q;p}, {p;q;f}, { p;f;q}, {q;f;p}, {q;p;f}.
Две перестановки отличаются только порядком расположения элементов.
Число перестановок из n обозначается и определяется по формуле:
Доказательство:
3) Сочетание из n элементов по m (m≤ n) - неупорядоченное подмножество из m элементов, множества, которое содержит n элементов.
Например, все сочетания из 4 элементов множества {A,B,M,K} по 2 составляют следующее множество: {A,B},{A,M},{A,K},{B,M},{B,K},{M,K}.
Два сочетания отличаются только составом элементов.
Число сочетаний из n элементов по m обозначается и находится по формуле:
Доказательство:
2.1.4. Число перестановок, размещений, сочетаний с повторениями (для тех случаев, когда среди образующих элементов есть одинаковые)
1) Число перестановок из n элементов с повторениями:
(где ni - количество одинаковых элементов в i – той группе)
2) Число размещений из n элементов по m с повторениями:
3) Число сочетаний из n элементов по m с повторениями
2.1.5. Комбинаторные задачи в лингвистике:
Имеется алфавит из n элементов. Из этих элементов составляют комбинации (соединения), без повторения или с повторением элементов. Сколько таких соединений можно составить?
Например:
1) Имеется алфавит из 20 букв. Сколько можно составить трёхбуквенных «слов», если буквы в «слове» не повторяются?
2) Сколько можно составить 2-буквенных комбинаций для денежных знаков, если взять 30 букв в русском алфавите ( без ъ, й, ь)?
3) Сколько перестановок можно составить из всех букв слова “WORD” ?
4) Найти количество комбинаций, которые можно составить из букв слова «математика».
5) Из 7 слов некоторого языка составляют 3-х словные предложения без повторения слов. Причём, два предложения различаются только составом, но не порядком расположения слов. Сколько таких предложений можно составить?
2.2. Начальные понятия теории вероятностей
Теория вероятностей – раздел математики, изучающий закономерности, присущие массовым случайным явлениям.
Предметом теории вероятностей являются математические модели случайных явлений.
Цель – осуществление прогноза в области случайных явлений.
Возникновение теории вероятностей как науки относится к XVII веку и связано с такими именами, как Галилей, Гюйгенс, Паскаль, Ферма, Якоб Бернулли.
«Познавательная ценность теории вероятностей обусловлена тем, что массовые случайные явления в своём совокупном действии создают строгие закономерности. Само понятие математической вероятности было бы бесплодно, если не находило бы своего осуществления в виде частоты появления какого-либо результата при многократном повторении однородных условий». (Из предисловия А.Н. Колмогорова к сочинению Я. Бернулли «О законе больших чисел». М.: Наука, 1986. С.4).4
В середине XIX – начале XX века вероятностно-статистические методы стали применяться в филологии в работах таких учёных, как И.А. Бодуэн де Куртенэ, А.М. Пешковский, М.Н. Петерсон, Е.Д. Поливанов, В.В. Виноградов и других.
Б.Н. Головин в труде «Язык и статистика» указывает основания вероятностно-статистического изучения языка и речи.5
1) Объективная присущность языку количественных признаков, количественных характеристик (анализ всех грамматических категорий устанавливает их относительный функциональный вес в разных стилях литературного языка, соотношения между словами, слогами и фонемами позволяют дать классификацию языков, которую можно использовать и при изучении их истории).
2) Внутренняя зависимость, существующая между качественными и количественными характеристиками языковой структуры (количественные различия на низшем уровне дают качественные различия на высшем уровне: количество фонем в языке отражается на качестве морфем и слов, количество морфем – на качестве слов, количественные характеристики на морфологическом уровне дают о себе знать в качестве синтаксических явлений).
3) Частоты различных элементов подчиняются статистическим законам (полученные опытным путём данные о частотах и вероятностях частей речи, некоторых типов предложений, формах глагола говорят о колебаниях частоты каждого изучавшегося элемента языка около некоторой средней величины, причём колебания эти статистически закономерны).
«Язык может рассматриваться как структура, элементы которой и функционируют в речи и развиваются, подчиняясь тем или иным вероятностно-статистическим законам». 6
К числу первичных понятий теории вероятностей относятся:
1) Опыт со случайным исходом или испытание - совокупность условий, при которых данное событие может произойти, а может и не произойти.
Классическими примерами опытом со случайным исходом являются: подбрасывание монеты с выяснением того, выпадет «орел» или «решка»; подбрасывание игральной кости с выяснением количества выпавших очков или их четности; шара определенного цвета из урны с шарами нескольких цветов. В лингвистике в качестве такого опыта можно рассматривать опыт появления определенного количества глаголов в фрагменте из стихов некоторого поэта и т.п.
2) Исход опыта (элементарное событие) – результат опыта со случайным исходом, вероятность (степень ожидания) которого считается известной.
Так, в математике считается, что опыт с подбрасыванием монеты имеет всего два элементарных исхода, вероятности которых одинаковы (и составляют 0,5), так как монета правильная (имеет форму цилиндра, везде одинаковой плотности, ее центр тяжести расположен в середине отрезка, соединяющего центры оснований цилиндра).
Описание опыта может быть заменено описанием множеством всех его элементарных исходов. Так, например, опыт с подбрасыванием игральной кости может быть заменен множеством из 6 равновероятных элементарных исходов (вероятность каждого 1/6) – количества выпавших очков; или множеством из 2 равновероятных элементарных исходов – выпало четное количество очков или нечетное (вероятность каждого 0,5).
3) Случайное событие – это любое подмножество множества всевозможных элементарных исходов опыта.
Достоверное случайное событие – произойдёт обязательно при данном испытании, так как равно самому множеству всевозможных исходов опыта. Невозможное
в) невозможное - никогда не произойдёт при данном испытании.
Примеры:
А=«выпало число 6 на игральной кости» - случайное событие;
В=«извлекли белый шар из урны с белыми и красными шарами» - случайное событие;
С=«извлекли белый шар из урны с белыми шарами» - достоверное событие;
D=«извлекли белый шар из урны с синими шарами» - невозможное событие;
E=«в произвольно взятом отрывке текста данного автора длиной 100 словоформ содержится 12 глаголов» - случайное событие.
3) Совместные события могут произойти вместе при одном испытании, несовместные – не могут произойти вместе.
Пример:
событие А = «попал по мишени 1-й стрелок» и событие В = «попал по мишени 2-й стрелок» при одновременной стрельбе двух стрелков – совместные события;
событие Е = «выпало 5 очков» и событие М= «выпало 6 очков» при одном подбрасывании игральной кости – несовместные событие.
4) Равновозможные события – события, для которых нет оснований полагать, что одно из них более возможно, чем другое.
Пример: события «на игральной кости выпало число 6» и «на игральной кости выпало число 1» - равновозможные события (исходя из предположения о симметричности кости);
6) Событие А благоприятно событию В, если всегда, когда произойдёт А, произойдёт В. ? Вводят понятие благоприятных исходов опыта!
Пример: событие «выпало 6 очков на игральной кости» благоприятно событию «выпало чётное число очков».
8) Противоположные события - несовместные события, такие, что если одно из них не произошло, то обязательно произойдёт другое. образуют полную группу событий.
Пример: А = «хотя бы один спортсмен команды занял призовое место», тогда
= «ни один спортсмен команды не занял призовое место».
Лингвистическое испытание - это наблюдение (опыт или измерение) за поведением и признаками изучаемых лингвистических объектов. Результатом лингвистического испытания является лингвистическое событие.
Например, испытание состоит в угадывании буквы, стоящей после сочетания «которо..». События, которые могут произойти: А={появилась буква е}, В={ появилась буква г}, С={появилась буква м}, Д={ появилась буква й}. Все данные события являются случайными, элементарными, несовместными, и образуют полную группу. Достоверное событие - появление буквы «о» после сочетания «которог..». Появление любой другой буквы – невозможное событие. Событие А={появилась буква у} и событие={появился пробел} являются противоположными при угадывании буквы после цепочки «котором..».7