Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математика и информатика

.pdf
Скачиваний:
18
Добавлен:
16.03.2015
Размер:
630.41 Кб
Скачать

Тема 13. Случайные величины

Тема 13 посвящается основному понятию теории вероятностей — понятию «случайной величины», разновидностям случайных величин, способам их описания и манипулирования с ними.

В этой теме студентам предлагается познакомиться с новым понятием случайной величины, используя знания о простейших способах вычисления вероятности события путем непосредственного подсчета доли благоприятных случаев.

Студентам рекомендуется обратить внимание на то, что этот способ применим далеко не всегда, а только в тех, сравнительно редких, случаях, где опыт сводится к схеме случаев, т. е. обладает симметрией возможных исходов. Рекомендуется выделить основные определения. Так, например, случайной величиной называется величина, которая в результате опыта может принять то или другое значение, неизвестно заранее — какое именно.

Чтобы всесторонне овладеть понятием случайной величины, студентам рекомендуется рассмотреть примеры дискретной случайной величины.

Следует уяснить, что дискретной называется такая случайная величина, возможные значения которой отделены друг от друга какимито интервалами. На оси абсцисс эти значения изобразятся отдельными точками.

Студентам предлагается отметить, что бывают случайные величины другого типа, которые называются непрерывными. Значения таких случайных величин сплошь заполняют какой-то участок числовой оси. Границы этого участка иногда бывают четкими, а иногда — расплывчатыми, неопределенными.

Студентам рекомендуется отметить следующее: говорить о «случайной величине» в том смысле, который приписывается этому понятию в теории вероятностей, необходимо уточнить, в чем состоит опыт, в результате которого случайная величина принимает то или другое значение.

Студентам предлагается обратить внимание на следующее: на самом деле все случайные величины, которые назывались «непрерывными», могут быть измерены только в каких-то единицах (минутах, сантиметрах, тоннах и т. д.), и в этом смысле, строго говоря, они являются дискретными.

Учитывая то обстоятельство, что значения случайной величины X не одинаково вероятны — среди них есть более и менее вероятные, важно ввести новые понятия и привести их примеры.

Так, законом распределения случайной величины называется всякая функция, которая описывает распределение вероятностей между ее значениями.

61

Студентам рекомендуется изучить не все законы распределения, а только некоторые, самые простые.

Закон распределения дискретной случайной величины может быть записан в виде так называемого, ряда распределения, в котором указываются все возможные значения случайной величины x1, x2, ..., хn и соответствующие им вероятности p1, p2, ..., pn.

Каждая вероятность pi есть не что иное, как вероятность события,

состоящего в том, что случайная величина X примет значение x, т.е. pi P( X xi ), ɝɞɟi 1, , n .

Сумма всех вероятностей pi равна p1 p2 pi 1. Заметим,

что эта единица как-то распределена между значениями случайной величины; отсюда и термин «распределение».

Важно обратить внимание, что вероятность невозможного события

равна нулю.

Последующее изучение темы целесообразно связать с рассмотрением законов распределения, выбрав среди них наиболее важные для практического использования.

Дальнейший теоретический материал рекомендуется рассмотреть с постановки следующего проблемного вопроса: как можно говорить о распределении вероятностей для непрерывной случайной величины, в случае, когда каждое из ее значений имеет одну и ту же вероятность — нуль?

О распределении вероятностей между отдельными значениями непрерывной случайной величины говорить не имеет смысла. А всетаки распределение и таких случайных величин существует. В этом случае целесообразно перейти к новому понятию — плотность вероятности.

Плотностью вероятности непрерывной случайной величины X

называется предел отношения вероятности попадания случайной величины X на малый участок, примыкающий к точке х, к длине этого участка, когда последняя стремится к нулю.

Полная площадь, ограниченная кривой распределения, равна единице. Вероятность попадания случайной величины X на участок от а до b будет равна площади, опирающейся на этот участок.

С учетом свойств плотности вероятности f (x) вероятность

попадания случайной величины на участок от а до b выражается через

b

определенный интеграл: P(a, b) ³ f (x)dx .

a

Материалы лекции закрепляются на практическом занятии с использованием вычислительных средств и с применением методик обработки опытных данных в рамках вычислительных процедур с применением математического программного комплекса MathCAD.

62

Особенность изучения вопросов, касающихся числовых характеристик случайных величин, заключается в том, что ее материал ссылается на вопросы, изученные в предыдущей теме, в частности на свойства плотности вероятности.

Студентам рекомендуется рассмотреть рад важных понятий. «Числовые характеристики» — это некоторые числа,

характеризующие те или другие свойства, отличительные признаки случайных величин — например, среднее значение, вокруг которого происходит случайный разброс, степень этого разброса (как бы «степень случайности» случайной величины) и ряд других признаков. Оказывается, многие задачи теории вероятностей можно решать, не прибегая (или почти не прибегая) к законам распределения, а пользуясь только числовыми характеристиками.

Студенты должны рассмотреть две самые широко применяемые в практике числовые характеристики случайной величины:

математическое ожидание и дисперсия.

Математическим ожиданием M ^X ` (или его можно обозначать:

M >X @, M x ) дискретной случайной величины X называется сумма произведений всех ее возможных значений на соответствующие им

вероятности:

M >X @

x1 p1 x2 p2

xn pn

или, пользуясь знаком

суммы M >X @

n

 

 

 

¦xi pi , где x1, x2 , ,xn — возможные значения случайной

величины X ;

i 1

 

 

случайная величина X

pi

вероятность

того, что

примет значение xi .

Следовательно, математическое ожидание случайной величины X есть не что иное, как «среднее взвешенное» всех ее возможных значений, причем каждое из них входит в сумму с «весом», равным его вероятности. Если число возможных значений случайной величины (как в первом варианте) бесконечно, то сумма (вторая формула) состоит из бесконечного числа слагаемых.

Математическое ожидание или среднее значение случайных величин является как бы ее «представителем», которым можно ее заменить при грубых расчетах. В сущности, так и поступают, когда в каких-нибудь задачах не учитывают случайности.

Для непрерывной случайной величины X тоже вводится понятие математического ожидания, но, естественно, сумма заменяется

f

интегралом: M x ³xf (x)dx , где f (x) — плотность вероятности

f

непрерывной случайной величины X.

Студентам рекомендуется рассмотреть вторую важнейшую числовую характеристику случайной величины — дисперсию.

63

Слово «дисперсия» в переводе значит «рассеивание» — дисперсия случайной величины характеризует как раз разброс (рассеивание) ее значений вокруг среднего. Дисперсия дискретной случайной величины X вычисляется так: из каждого возможного значения вычитается среднее (математическое ожидание); полученное отклонение значения от среднего возводится в квадрат, множится на вероятность соответствующего значения, и все такие произведения суммируются; получается дисперсия, которую мы обозначим D^X `(или D>X @, Dx ).

D>X @ (x M 2

>X @ p (x

M 2 >X @ p

2

(x

n

M 2 >X @ p

)

 

1

1 2

 

 

n

 

или

 

 

 

 

 

 

 

 

D>X @

n

 

 

 

 

 

 

 

¦(xi M >X @)2 pi .

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

Подчеркнем, что использованная формула — не самая удобная для вычисления дисперсии. Ее обычно удобно вычислять по другой формуле:

D>X @ M >X 2 @ M 2 >X @,

т. е. дисперсия случайной величины равна математическому ожиданию ее квадрата минус квадрат математического ожидания.

Для непрерывных случайных величин дисперсия вычисляется аналогично, где, естественно, вместо суммы использован интеграл:

Dx ³ff (x M 2 >X @ f (x)dx .

Часто используют другую формулу: Dx ³ff x2 f (x)dx M 2 >X @.

Среднее квадратическое отклонение — очень наглядная и удобная характеристика рассеивания. Она сразу же дает понятие о «размахе колебаний» случайной величины около среднего значения. Для большинства встречающихся на практике случайных величин с

практической достоверностью можно утверждать, что они не отклонятся от своего математического ожидания больше чем на 3VX

(три сигма) — уровень доверия зависит от закона распределения случайной величины, но во всех не искусственно придуманных случаях он довольно высок. Приведенное выше правило носит название «правило трех сигм».

Таким образом, студентам рекомендуется отметить, что, если каким-либо способом удалось найти две числовые характеристики случайной величины X — ее математическое ожидание и среднее квадратическое отклонение, то сразу получаем ориентировочное представление о том, в каких пределах могут лежать ее возможные значения.

Рекомендуется отдельно изучить особенности правил вычисления числовых характеристик: правило сложения математических ожиданий; правило сложения дисперсий; правило вынесения постоянного

64

множителя из-под знака математического ожидания и правило вынесения постоянного множителя из-под знака дисперсии.

Подчеркнем, что набор рассмотренных правил является достаточным для решения некоторых важных задач, которые рассматриваются на практических занятиях по данной теме.

Студентам рекомендуется обобщить изученный материал темы и сделать выводы о практическом применении основных понятий данной темы.

Материалы темы закрепляются на практических занятиях с использованием вычислительных средств и современного математического программного комплекса MathCAD.

При изучении основных законов распределения случайных величин студентам рекомендовано отметить особую роль, которую играет нормальный закон в теории вероятностей.

Заметим, что случайная величина Х распределена по нормальному закону (или «имеет нормальное распределение»), если ее плотность вероятности выражается формулой:

f (x)

 

1

e

( x m)2

 

 

2V2

,

 

2S

V

 

 

 

где S — известное из геометрии число, а е — основание натуральных логарифмов ( e 2,71828).

Кривая нормального закона имеет симметричный вид колокола, достигая максимума в точке m; по мере удаления от m плотность вероятности падает и в пределе стремится к нулю. Закон

 

 

1

e

( x m)2

 

f (x)

 

2V2

зависит от двух параметров: m и V. Первый из

 

2S

V

 

 

 

них, m —математическое ожидание случайной величины X, а второй V — ее среднее квадратическое отклонение. При изменении m кривая f (x) , не меняя своей формы, будет смещаться вдоль оси абсцисс (х). Если же менять V, кривая f (x) будет менять форму, становясь при возрастании

V более «растянутой», а при уменьшении V — более вытянутой вверх, «иглообразной».

Особенно рекомендуется отметить роль, которую играет нормальный закон в теории вероятностей и ее практических приложениях.

Так, если складывать большое число независимых (или слабо зависимых) случайных величин, сравнимых между собой по порядку своих дисперсий, то каковы бы не были законы распределения слагаемых, закон распределения суммы будет близко к нормальному тем ближе, чем больше случайных величин складывается.

Приведенное выше положение — это грубая формулировка так называемой центральной предельной теоремы, играющей очень

65

большую роль в теории вероятностей. У этой теоремы много различных форм, различающихся между собой условиями, которым должны удовлетворять случайные величины, чтобы их сумма с увеличением числа слагаемых «нормализовалась».

На практике очень многие случайные величины образуются по «принципу суммы» и, значит, распределены нормально или почти нормально.

Например, ошибки всевозможных измерений, представляющие собой сумму многих «элементарных», практически независимых, ошибок, вызванных отдельными причинами.

Отдельно следует обратить внимание, что такая важная случайная величина, как частота события при большом числе опытов N, тоже имеет приближенно нормальное распределение.

В изучаемом материале данной темы рекомендуется выделить свойства особых с практической точки зрения дискретных и непрерывных распределений случайных величин.

Отмечается, что в некоторых практических задачах встречаются непрерывные случайные величины, о которых заранее известно, что их возможные значения лежат в пределах некоторого определенного интервала. Кроме того, известно, что в пределах этого интервала все значения случайной величины одинаково вероятны (точнее, обладают одной и той же плотностью вероятности). О таких случайных величинах говорят, что они распределены по равномерному закону (или по закону равномерной плотности), если ее плотность вероятности f (x) постоянна на этом отрезке и равна нулю — вне этого отрезка, т.е.

 

­

 

1

,a d x d b

f (x)

°

 

 

 

a

®b

.

 

°

 

 

x a, x ! b

 

¯0,

 

Функция распределения случайной величины Х, распределенной по

 

­0,

 

x d a

 

°

 

 

 

равномерному закону, имеет следующий вид: F(x)

°x a

,a x db .

®

 

 

 

 

 

°b

a

x !b

 

°1,

 

 

¯

 

 

 

Для математического ожидания и дисперсии случайной величины Х, распределенной по равномерному закону, справедливы следующие соотношения:

M (X )

a b

,

D(X )

(b a)2

2

12

 

 

 

В учебном материале изучаемой темы студентам рекомендуется рассмотреть для закрепления теоретических вопросов следующий

пример

66

Так, пусть поезда метрополитена идут регулярно с интервалом в 2 минуты. Пассажир выходит на платформу в случайный момент времени. Пусть случайная величина Х — время ожидания поезда. Какова вероятность того, что ждать пассажиру поезда придется не больше полминуты. Требуется найти математическое ожидание и среднее квадратическое отклонение случайной величины Х.

Решая задачу, следует отметить, что случайная величина Х — время ожидания поезда — на временном отрезке [0, 2] (в минутах) имеет

равномерный закон распределения f (x)

1

2 .

Так как площадь, ограниченная кривой распределения, равна единице, то вероятность того, что пассажиру придется ждать не более

полминуты, равна

1 .

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

0,5

1

 

1

 

 

00,5

1

 

Тогда P(X d 0,5) ³

dx

x

 

.

 

2

2

4

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для определения математического ожидания и среднеквадратического отклонения имеем:

M (X )

0 2

1(мин),

 

 

 

 

2

 

 

 

 

 

 

 

 

 

(2 0)2

 

 

1

 

 

 

1

 

D( X )

 

, Vx

D(X )

| 0,58 (мин).

12

3

3

 

 

 

 

Студентам рекомендуется обобщить изученный учебный материал и сделать выводы по нему.

Материалы лекции закрепляются на практическом занятии с использованием вычислительных средств и математического программного комплекса MathCAD.

Тема 14. Основы математической статистики

Приступая к изучению данной темы, следует уяснить, что предметом математической статистики является изучение случайных величин по результатам наблюдений. Причем основными задачами математической статистики являются:

представление экспериментальных данных в упорядоченном удобном для анализа виде;

оценка (приблизительная) характеристик наблюдаемой СВ;

проверка статистических гипотез, т.е. принятие решения о согласованности результатов оценивания с опытными данными.

При определении понятия выборки следует понять, что под термином генеральная совокупность следует понимать совокупность всех подлежащих изучению объектов или результатов всех возможных

67

наблюдений, производимых над одним объектом в неизменных условиях.

Следует уяснить, что на практике часто проводить исследование всей генеральной совокупности не представляется возможным или оказывается нецелесообразным, дорогостоящим или ограниченно временными и другими рамками.

В таких случаях применяют выборочное наблюдение: из генеральной совокупности выбирают часть ее объектов и подвергают их изучению. При этом выборкой называется совокупность объектов, отобранных случайным образом из генеральной совокупности.

Следует четко представлять сущность понятий объем выборки, реализация выборки, статистическое распределение выборки, вариационный ряд, статистический ряд и интервальный статистический ряд, пояснив суть указанных понятий на примерах.

Рассматривая интервальный статистический ряд, следует особо отметить, что его применение целесообразно в случаях, когда объем выборки велик или имеют дело с непрерывными случайными величинами.

Более детально следует рассмотреть методику построения интервального статистического ряда.

Отдельно стоит остановиться на способах графического представления статистического распределения, рассмотрев в качестве таковых полигоны частот (относительных частот) и гистограммы частот и относительных частот.

Следует уяснить, что гистограмма относительных частот, является статистическим аналогом плотности вероятности и остановиться на методике построения эмпирической функции распределения.

При рассмотрении числовых характеристик статистического распределения целесообразно рассмотреть определения и методику вычисления выборочного среднего, выборочной дисперсии, выборочного СКО, исправленной выборочной дисперсии, исправленного выборочное СКО, выборочной моды и выборочной медианы.

При изучении темы студентам рекомендуется отметить особое значение теории оценивания неизвестных параметров как основной практический инструмент для специалистов в области судебных экспертиз.

Отмечается, что статистической оценкой 4ˆ n параметра 4

теоретического распределения называют его приближенное значение, зависящее от данных выбора.

Следует выделить в учебном материале, что оценка 4ˆ — значение некоторой функции результатов наблюдений над случайной величиной, т. е. 4ˆ 4ˆ (X1, X 2 , , X n ) .

68

Важно указать, что к оценке любого параметра предъявляется ряд требований, которым она должна удовлетворять, чтобы быть «близкой» к истинному значению параметра, т.е. быть в каком-то смысле «доброкачественной» оценкой.

Студентам рекомендуется выделить свойства статистических оценок. При этом отмечается, что статистическая оценка должна быть несмещенной, состоятельной и эффективной. Рекомендуется раскрыть каждое и приведенных свойств отдельно.

В теории статистического оценивания параметров студентам рекомендуется рассмотреть точечные оценки для математического ожидания и дисперсии.

Отдельно рекомендуется выделить методы нахождения точечных оценок: метод моментов, метод максимального правдоподобия и метод наименьших квадратов.

Отдельным вопросом при изучении темы рекомендуется рассмотреть понятие интервального оценивания параметров. При этом необходимо отметить, что точечные оценки неизвестного параметра 4 используются в качестве первоначальных результатов обработки наблюдений. Их недостаток в том, что неизвестно, с какой точностью они дают оцениваемый параметр. Для выборок небольшого объема

вопрос о точности оценок очень существенен, так как между 4ˆ и 4 может быть большое расхождение в этом случае.

Важно отметить, что при решении практических задач часто требуется определить еще и надежность оценок параметров. В этом случае рассматривается задача о приближении параметра 4 не одним

числом, а целым интервалом (4ˆ 1, 4ˆ 2 ). Оценка неизвестного параметра

в этом случае называется интервальной и она определяется двумя числами — концами интервалов.

Отдельным вопросом студентом рекомендуется рассмотреть правила построения доверительных интервалов для параметров нормального распределения.

При изучении вопросов, касающихся проверки статистических гипотез, студентам рекомендуется выделить задачи статистической проверки гипотез относительно некоторой генеральной совокупности, где высказывается та или иная гипотеза Н и из этой генеральной совокупности извлекается выборка. При этом следует выделить правило, при помощи которого можно было бы по выборке решить вопрос о том, следует ли отклонить гипотезу Н или ее принять.

Рекомендуется рассмотреть только основные статистические критерии проверки статистических гипотез.

Успех изучения материала темы в значительной степени определяется качеством решения задач и примеров, поясняющих особенности теории проверки статистических гипотез.

69

Учебный материал изучаемой темы закрепляется на практических занятиях с использованием вычислительных средств и математического программного комплекса MathCAD.

Тема 15. Прикладные программы пакета MS Office. Текстовые редакторы: назначение, функции и использование. MS Word

При подготовке к практическим занятиям необходимо в первую очередь усвоить назначение и функции текстовых редакторов, их основные и дополнительные возможности, представлять этапы подготовки текстовых документов. Затем перейти к изучению средств конкретного текстового редактора MS Word, входящего в состав программного пакета MS Office.

Особое внимание надо уделить основным правилам ввода (набора) текста, в частности переходу к следующему абзацу, «принудительному» переходу к следующей строке. Студенту следует уяснить понятие абзаца как основной структурной единицы текста.

Редактирование текста предполагает выполнение определенных манипуляций с фрагментами текста. Поэтому студенту следует выбрать для себя наиболее простые приемы выделения различных фрагментов текста и средства (и порядок их использования) для выполнения вставки, замены, удаления и перемещения выделенных фрагментов текста. Также следует определить, какие средства следует использовать при вводе и редактировании текста. Редакционная обработка текста, как правило, заканчивается орфографическим и грамматическим контролем, поэтому необходимо освоить приемы такого контроля и исправления обнаруженных ошибок. При этом нужно обратить внимание на то, что ошибка может быть предполагаемой, например, «ошибочного» слова не содержится в словаре.

При подготовке к освоению средств оформления текстовых документов следует, прежде всего, уяснить содержание таких понятий, как абзац, раздел, формат печатного документа, колонтитул и колонцифра, оформительские характеристики абзаца, шрифтовое выделение. Поскольку основной структурной единицей оформления текстового документа является абзац, надо обратить внимание на параметры оформления абзаца, назначение и использование этих параметров. Используя учебно-методи- ческое пособие кафедры, следует, исходя из структуры представленного в качестве образца документа и с учетом отдельных пунктов задания, определить, какие средства и каким образом целесообразно использовать для оформления отдельных структурных элементов документа. Этот выбор должен быть студентом обоснован.

70