Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Смольянов. тексты лекция

.pdf
Скачиваний:
29
Добавлен:
15.03.2016
Размер:
1.22 Mб
Скачать

20

д.), а для классов, находящихся в стороне значений вариант больших A – со знаком плюс (+1, +2, +3, +4 и т. д.). Вычисление моментов рекомендуется производить с точностью до 0,001.

Проверку правильности вычисления начальных моментов производят по

формуле

ν 4* =ν 0 + 4ν1 + 6ν 2 + 4ν 3 +ν 4 ,

(3.3)

где: ν 4* – четвертый начальный момент относительно нового начала отсчета отклонений, сдвинутого на один разряд ниже.

*

=

n (Vк

+1)n

(3.4)

ν4

N

,

 

 

 

 

где (Vк +1)– условное отклонение от нового начала (от условной средней).

2.2 Способ сумм

Все необходимые данные для вычисления моментов получают путем последовательного суммирования частот. Против частоты соответствующей произвольному началу, проводится черта, которая разделяет таблицу на две части. В каждой части таблицы проводится последовательное суммирование частот от концов столбцов к середине, причем в каждом последующем столбце суммирование прекращается на один класс раньше, чем в предыдущем (табл. 3.1).

Таблица 3.1

Вычисление начальных моментов по способу сумм

Ср. значения

Число

Последовательные суммы числа наблюдений

 

классов

наблюдений,

S1

S2

S3

 

S4

W

n

 

 

 

 

 

 

 

 

16

3

3

3

3

 

3

20

14

17

20

23

 

-

24

29

46

66

-

 

-

28

41

87

-

-

 

-

32

54

-

-

-

 

-

36

32

67

-

-

 

-

40

20

35

56

-

 

-

44

10

15

21

28

 

-

48

4

5

6

7

 

8

52

1

1

1

1

 

1

 

-S

153

89

26

 

3

 

+S

123

84

36

 

9

 

d

–30

–5

+10

 

+6

 

S

276

173

62

 

12

21

Внизу каждого столбца записывают суммы чисел верхней (отрицательной) и нижней (положительной) частот таблицы. Кроме того, под каждым столбцом записываются суммы (S) и разности (d) указанных чисел.

Для вычисления моментов используются формулы

ν 1

=

d

 

 

 

(3.5)

N

 

 

 

 

 

 

 

ν 2

 

=

 

S1 + 2S2

 

 

(3.6)

 

 

 

 

 

 

 

 

N

 

ν = d1 +6d2 +6d3

(3.7)

3

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

ν4

=

S1 +14S2 +36S3 +24S4

(3.8)

 

 

 

 

 

 

 

 

 

N

 

3 Вычисление центральных и основных моментов. Практическое использование моментов

Центральные моменты вычисляются от центра ряда, чем является средняя арифметическая величина. Пользуясь этим определением, легко записать формулы для вычисления центральных моментов µ (мю):

 

 

µ1 =

(α n)

 

µ3

=

(α 3 n)

 

 

 

 

;

(3.9)

 

N

;

(3.11)

 

 

 

 

 

N

 

 

 

 

(α 4 n)

 

µ

 

=

(α 2 n)

(3.10)

µ

 

=

(3.12)

2

 

 

;

4

 

,

 

 

 

N

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

где α = W M ср .

Индекс указывает, как и в начальных моментах, на его степень.

Поскольку отклонения от среднего значения бывают, как правило, дробными, то в практике центральные моменты чаще вычисляются по начальным моментам, для которых формулы перехода следующие:

µ =0 ;

µ =ν ν2 ;

(3.13)

1

 

2

2

1

 

µ3

=ν 3 −3 ν 2 ν1 + 2 ν13 ;

(3.14)

µ4 =ν4 −4 ν3 ν1 +6 ν2 ν12 −3 ν14 .

(3.15)

Для проверки центральных моментов ряда распределения применяют фор-

мулы:

 

 

 

 

 

µ 3

= ν 3

3 µ 2

ν 1

ν 13 ;

(3.16)

µ 4

= ν 4

4 µ 3

ν 1

6 µ 2 ν 12 ν 14 .

(3.17)

22

Моменты, получаемые путем деления центральных на корень квадратный из второго центрального момента в степени порядка момента, называются основными:

r1

=

 

 

 

2

= 0

;

(3.18)

r2

= (

µ2

)2

=1,0 ;

(3.19)

 

 

 

µ

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

=

 

 

 

3

 

 

 

 

 

 

 

 

µ

 

 

 

 

 

r3

 

 

 

 

 

 

;

(3.20)

r4

=

 

 

4

 

.

(3.21)

(

 

 

 

 

 

)3

 

(

 

 

)4

 

 

2

 

 

µ2

Они служат для вычисления асимметрии и эксцесса.

Вычисление выборочных статистических характеристик с помощью моментов. Выборочные статистические характеристики распределения вычисляют на основе моментов. В виду того, что моменты выражены в единицах интервала λ, то для получения отклонения в единицах измерения моментов приходится умножать на их величину.

Первый начальный момент используется для определения средней арифметической величины. Формула, применяемая для этого, имеет вид:

М ср = А + λν 1 ,

(3.21)

где А – произвольное начало; λ – величина интервала;

ν1 – первый начальный момент.

Для вычисления среднеквадратического отклонения используется следующая формула:

σ = λ ν 2 ν 12 .

(3.22)

Вопросы для самопроверки:

1 Статистический момент. Виды моментов.

2 Начальные моменты. Способы их вычисления.

3 Способы сумм и произведений, их сущность.

4 Центральные моменты, способы их вычисления.

5 Основные моменты. Качественная оценка вариационных рядов.

6 Использование начальных моментов при вычислении статистических показателей.

23

ЛЕКЦИЯ IV

Элементы теории вероятностей

План лекции

1 Элементы теории вероятности.

2 Основные теоремы о вероятности.

3 Понятие о законе больших чисел.

Статистические заключения, как главная составляющая метода исследования массовых явлений, имеют свои отличительные черты. Статистические заключения делают с численно выраженной определенностью. Теоретической основой для их построения является раздел математики, изучающий закономерности случайных событий и называемый теорией вероятностей.

1 Элементы теории вероятностей

Статистические методы предполагают изучение разнообразных массовых явлений, в которых признаки изменяются от одного значения к другому, т.е. варьируют. Более глубокое изучение этих явлений показало, что предметы, особи, факты, составляющие статистическую совокупность, имеют в то же время неодинаковую повторяемость (встречаемость). Изучая толщину деревьев в каком-либо насаждении, легко убедится в том, что деревья со средним диаметром встречаются чаще, а с малым и большим диаметром – реже.

Переменная величина, принимающая различные значения с определенными вероятностями, называется случайной. Общие закономерности распределения случайных событий и случайных величин изучаются в теории вероятности.

Выше говорилось о единообразии естественных процессов - статистической устойчивости. Но, наряду с этим, действие различных случайных факторов делает элементы этих процессов (явлений) случайными.

Явления, рассматриваемые с точки зрения возможного их осуществления или неосуществления, называют событиями. Событие считается случайным, если при данных условиях оно может либо произойти, либо не произойти.

В теории вероятностей обычно используют классические примеры с бросанием монеты или кубика. Выпадение «герба» на монете или любой «цифры» на верхней стороне шестигранного кубика является случайным событием. Получение значения 20 см при обмере диаметра случайно выбранного дерева в

24

насаждении тоже является случайным событием.

Случайные события связаны с не вошедшими в комплекс данных условий случайными факторами. Например, при исследовании естественного возобновления в лесу можно учесть такие факторы, как порода, возраст, густота насаждений, тип лесорастительных условий. Другие, неизвестные исследователю факторы, являются случайными. В данном примере это могут быть микроусловия рельефа и увлажненности почвы, воздействие диких копытных животных, очаги вредителей и болезней леса. Поэтому количественный и качественный состав естественного возобновления, полученного на одной учетной площадке, является случайной величиной или случайным событием.

Событие считается достоверным, если оно обязательно произойдет при данных условиях. Невозможным считается событие, которое точно не произойдет при данных условиях.

В единичном случае (одно бросание монеты, одна учетная площадка) делать какие-либо выводы невозможно. При многократном повторении опыта выявляются некоторые закономерности.

Теоретическая оценка случайных величин (событий) строится на большом числе испытаний. При этом под испытанием понимают любой эксперимент, в результате которого производят наблюдения. Проводить испытания следует при неизменных условиях, что обеспечивает однородность оцениваемых событий.

Установленное в результате опыта отношение числа появлений события к общему числу испытаний называют частотой события. В табл. 4.1 приведены результаты бросания монеты.

 

 

Таблица 4.1

 

Результаты опыта бросания монеты

 

 

 

 

Число испытаний

Число событий

Относительная

 

(бросаний)

(появление «герба»)

частота событий

 

 

 

 

 

4000

2038

0,5095

 

 

 

 

 

12000

5981

0,4984

 

 

 

 

 

24000

12009

0,5004

 

 

 

 

 

Результаты подтверждают, что увеличение числа испытаний приводит частоту к определенной величине: чем больше число испытаний, тем меньше различие частот в разных сериях испытаний. При очень большом числе испытаний частота стремится к пределу, называемому вероятность.

25

Под «вероятностью» понимают меру возможности события, долю шансов, благоприятствующих событию. По мнению А.К. Митропольского [6], вероятность некоторого события является абстрактным выражением устойчивости частости этого события и представляет меру объективной возможности осуществления этого события. Вероятность события определяется как отношение числа случаев, при которых событие проявляется, к числу всех возможных случаев.

Из определения видно, что вероятность есть правильная положительная дробь, значение которой находится в пределах от ноля (0) до единицы (1)

Если событие «А» имеет «а» благоприятных случаев и «в» – неблагоприятных, то вероятность того, что это событие произойдет, можно определить по

 

P( A) =

a

 

формуле

 

.

(4.1)

a + b

Отношение числа неблагоприятных случаев к числу всех возможных покажет вероятность того, что событие «А» не произойдет:

P(B) =

 

b

 

 

 

 

 

.

(4.2)

a + b

Просуммировав эти два равенства, получим:

 

 

 

P( A) + P(B) =

 

a

 

+

b

=

a + b

= 1.

 

 

 

 

 

 

a

+ b a + b a + b

Любая пара противоположных событий, как в данном примере, образует полную систему. Сумма вероятностей событий, образующих полную систему, равна 1.

Примером полной системы является эксперимент с монетой или кубиком. При бросании монеты вероятность выпадения «герба» (событие «А») равна Р(А)= 12 . Вероятность противоположного события «В» (выпадение «цифры», озна-

чающей номинал монеты) такая же: Р(В)= 12 .

Сумма вероятностей этих событий: Р(А) + Р(В)= 12 + 12 =1.

Следовательно, с вероятностью 1 монета упадет на ту или другую сторону. Так же и в случае с кубиком: вероятность появления какой-либо цифры на верхней грани Р(П)= 16, а в сумме вероятность выпадения любой цифры равна:

Р= Р(П)= 16 + 16 + 16 + 16 + 16 + 16 = 1.

Если Р(А)= 0, то событие «А» – невозможно; если Р(А)= 1, событие обязательно осуществится, т.е. это достоверное событие.

26

События, вероятность которых больше 12 , считаются более вероятными; если меньше 12 – маловероятными. Если событие имеет малую вероятность,

можно считать, что в единичном испытании оно не произойдет. Однако все зависит от того, насколько важно событие, о котором идет речь.

Вероятность того или иного события можно определять несколькими способами: статистическим, классическим и геометрическим.

1 Статистический. При этом подходе вероятность определяется через частоту появления события в большой серии испытаний. Так, в примере, описанном выше (табл. 4.1) частота появления «герба» при бросании монеты 4, 12 и 24 тыс. раз соответственно равнялась 0,5080; 0,5016; 0,5005. Очевидно, что она приближается к постоянному числу 12 .

Статистический подход позволяет находить вероятность событий, структура которых неизвестна. Например, только статистический подход позволил определить вероятность рождения мальчиков, равную 0,52 и девочек – 0,48.

2 Классический. При этом способе вероятность определяется через подсчет доли шансов, благоприятствующих событию. Например, при бросании кубика существует 6 равновозможных исходов, а значит, и вероятность выпадения какойлибо цифры равна 16. При этом подходе необходимо знать структуру рассматри-

ваемых событий.

3 Геометрический. Понятие об этом способе можно получить из следующего примера испытаний.

Предположим, в некотором квадрате (рис. 4.1) случайным образом выбирается точка. Какова вероятность того, что она окажется в области Д. Очевидно, что вероятность эта будет тем больше, чем больше область Д.

В качестве мерила вероятности здесь выступает площадь:

Р(Д) =

Sд

,

(4.3)

 

S

Рис. 4.1 Иллюстрация

 

 

о

 

 

 

где

Sд – площадь области Д;

понятия геометрической

 

Sо – общая площадь квартала.

вероятности

Геометрический подход к определению вероятности можно осуществлять не только на плоскости, но и на отрезке прямой или в пространстве.

27

При изучении вероятности нужно четко различать понятие несовместимости и независимости событий.

Несовместимость понимается в том смысле, что если реализуется одно событие, то реализация другого невозможна (не могут произойти одновременно). Например, монета при подбрасывании не может упасть одновременно обеими сторонами, на верхней грани кубика не может одновременно выпасть две цифры и т.д. Независимое событие совершается независимо от другого события. Если имеется три независимых события, то это означает, что вероятность каждого из них не зависит от того, наступили или не наступили два других события. Три станка могут работать независимо друг от друга. При подбрасывании двух монет одновременно выпадение той или другой стороны первой монеты не зависит от вероятности выпадения ее на другой.

2 Основные теоремы о вероятности Теорема умножения вероятностей. Вероятность нескольким независимым

событиям случиться одновременно (или последовательно) равна произведению их вероятностей Р( А, В) = Р( А) Р(В).

Для пояснения сущности этой теоремы воспользуемся примером с монетой. При одном бросании монеты вероятность выпадения «герба» равна 12 . При двух

подбрасываниях (или подбрасывании двух монет одновременно), как это следует из формулировки теоремы, вероятность выпадения «герба» на обеих монетах будет равна 14 ( 12 ּ 12 ), при трех – 18 . Покажем, что это действительно так. При

подбрасывании двух монет (появление «герба» обозначим «а», а появление «цифры» – «в») возможны следующие сочетания выпадений «герба» и «цифры»: ав; ва; аа; вв.

Всего сочетаний получилось четыре, из них благоприятных (аа) – одно. Следовательно, вероятность появления «герба» при двух бросаниях равна 14 .

Аналогично при трех испытаниях вероятность будет равна 18 ( 12 ּ 12 ּ 12 ), что подтверждается результатами непосредственного подсчета всех возмож-

ных комбинаций: вва; ваа; вав; ава; ввв; авв; аав; ааа. Как видим, всего сочетаний 8, а благоприятное (ааа) – только одно.

Теорема сложения вероятностей. Вероятность случиться одному из нескольких независимых событий без указания, какому именно, равна сумме вероятностей этих событий.

28

Для пояснения сущности этой теоремы воспользуемся примером с подбрасыванием кубика, на шести гранях которого нанесены цифры от 1 до 6.

Вероятность появления любой цифры Р(п) = 16.

Вероятность же появления четных цифр (2, 4, 6) будет равна:

Р (2, 4, 6) =

1

6

+ 1

6

+ 1

6

= 3

6

=

1

2

.

 

 

 

 

 

 

 

 

Следовательно, задача упрощается в три раза.

3 Понятие о законе больших чисел

Одним из важнейших положений статистического метода является закон больших чисел. Смысл этого закона заключается в том, что основные закономерности, свойственные какому-либо явлению, могут проявляться при условии, если отдельные индивидуальные факты рассматриваются в достаточно большом количестве. Иначе говоря, явления, характеризующиеся варьированием (изменчивостью), могут быть достаточно глубоко изучены только на основании множественных наблюдений.

Закон больших чисел в его наиболее общем виде сформулирован А.К. Митропольским. Для практики математической статистики наибольшее применение нашли два следствия из этого закона:

1 Если имеется достаточно большой ряд независимых наблюдений, при каждом из которых вероятность отдельного события остается постоянной, то отношение числа появлений события к числу наблюдений мало отличается от вероятности события при отдельном испытании.

Это положение закона больших чисел называется теоремой Бернулли и вскрывает сущность методов математической статистики.

При отдельном испытании может оказаться как одно, так и другое событие. Но при достаточно большом числе испытаний частности появлений того или иного события приближенно равны их вероятностям. При этом следует подчеркнуть, что приближенное равенство между частностью и вероятностью имеет место лишь при достаточно большом числе наблюдений.

Примером, иллюстрирующим это следствие закона больших чисел, может служить серия множественных испытаний монеты.

2 По мере возрастания числа наблюдений распределение частностей приближается к некоторому теоретическому распределению вероятностей, выраженному коэффициентами разложения бинома определенной степени.

29

Чтобы разобраться в содержании второго следствия, нужно вспомнить математическую основу этого вопроса – бином Ньютона.

Вопросы для самопроверки:

1 Понятие о вероятности. Основные теоремы вероятности.

2 Теорема умножения вероятностей.

3 Теорема сложения вероятностей.

4 Способы определения вероятностей событий.

5 Понятие о законе больших чисел.

6 Основные следствия закона больших чисел.

ЛЕКЦИЯ V

Теоретические виды распределений

План лекции

1 Биномиальное распределение.

2 Нормальное распределение.

3 Вычисление теоретических частот по таблице площади и ординат нормальной кривой.

1 Биномиальное распределение

Так называемое биномиальное распределение, или распределение Бернулли, получается в том случае, когда для каждого испытания существуют лишь два возможных несовместных исхода. Например, в результате действия многих объективных и субъективных факторов, при инвентаризации саженцев в питомнике, их относят к здоровым или поврежденным. При этом мы не принимаем во внимание, что исход «поврежденные» может быть подразделен на исходы: экземпляры с механическим повреждением, пораженные болезнями, вредителями и т.д. Аналогично при бросании кубика мы тоже можем различать только две альтернативы

– например, выпадение двойки и не выпадение двойки.

Особый интерес представляет случай, когда вероятности двух альтернативных исходов (обозначим их для простоты p и q) одинаковы: