Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
i-719273.pdf
Скачиваний:
269
Добавлен:
26.03.2016
Размер:
5.68 Mб
Скачать

2. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

2.1. Общие понятия и определения

Математическая статистика занимается как статистическим описанием результатов опытов и наблюдений, так и построением и проверкой подходящих математических моделей, содержащих понятие вероятности.

Фундаментальными понятиями статистической теории являются поня-

тия генеральной совокупности и выборки.

Генеральная совокупность есть совокупность всех мыслимых результатов наблюдений над случайной величиной, которые могут быть в принципе проведены при данных условиях. Содержательный смысл этого понятия заключается в том, что предполагается существование некоторых вполне определенных свойств, неслучайных закономерностей, присущих данной совокупности. Фактически эти свойства являются объективным отображением вероятностных свойств шумового поля, которые могут быть охарактеризованы с помощью соответствующих законов распределения вероятностей или связанных с ними числовых параметров. Предполагается, что свойства шумового поля не изменяются во времени, т.е. являются устойчивыми.

 

 

Выборка – это конечный набор значений случайной величины, полу-

чаемый в

результате наблюдений. Например, наблюдаемые значения

x , x

 

,...,xN

– представляют выборку объема N . Выборка представительна

 

 

 

 

(репрезентативна), если она достаточно полно характеризует генеральную совокупность.

Смысл статистических методов сводится к тому, чтобы по выборке ограниченного объема N высказать обоснованное суждение о свойствах генеральной совокупности в целом. Подобное определение может быть получено путем построения эмпирических (выборочных) аналогов вероятностных характеристик исследуемой случайной величины или, иными словами, путем оценивания параметров генеральной совокупности с помощью некоторых подходящих функций от результатов наблюдений.

Любая функция g(x , x ,...,xN ) от элементов некоторой генеральной

совокупности называется статистикой. Некоторая статистика, являющаяся подходящей для оценивания того или иного параметра генеральной сово-

купности, называется статистической (выборочной) оценкой данного пара-

метра. Естественно, что любая оценка неизвестного параметра генеральной совокупности по выборке есть случайная величина, в то время как сам параметр является неслучайным. Часто для обозначения оценок вводят символ «крышечку» ^. Так θ это оценка параметра .

Параметры , ,... обычно характеризуют определенное свойство теоретического распределения случайной величины X (например, матема-

62

тическое ожидание, дисперсию, асимметрию). Поскольку для оценки одного

и того же параметра

 

можно использовать разные статистики

g (x , x ,...,xN ) , g (x , x ,...,xN ) , …, то на практике предпочитают оценки θ,

которые сходятся по вероятности к при N (состоятельные оценки), у которых θ = θ (несмещенные оценки) или которые имеют наименьшую дисперсию θ (эффективные оценки).

2.2. Простейшие оценки

Для случайной выборки x , x ,...,xN объема N из генеральной совокуп-

ности можно вычислить следующие оценки.

Накопленная частость (накопленная относительная частота) — это оценка интегральной функции распределения, определяется по формуле

(x) nNx , (2.1)

где nx — число элементов выборки меньших текущего конкретного значения

x , N – общий объем выборки.

Эмпирическая функция плотности распределения вероятностей (гис-

тограмма выборки) определяется по формуле

 

 

 

k

n

j

 

 

=

 

 

 

,

(2.2)

 

 

 

 

N j x

 

где x — длина интервала; k – число интервалов разбиения выборки; n j — число элементов выборки, попавших в j –й интервал. Рекомендуется число

интервалов выбирать равным

k . lg N .

Найденное значение k округляют до ближайшего целого числа. Длину интервала

x xmax xmin ,

k

округляют для удобства построения графика.

В системе Mathcad построение эмпирической функции плотности распределения вероятностей для выборки x ,...,x представлено на рис. 2.1.

Выборочное среднее значение

 

 

N

 

x

 

xi ,

(2.3)

 

 

N i

 

является несмещенной и состоятельной оценкой математического ожидания. Для выборки из нормальной генеральной совокупности эта оценка также и

63

эффективна.

Для равномерного распределения эффективная оценка mx рассчитывается по формуле

=

x

м акс xм ин

,

(2.4)

 

 

 

 

 

 

 

 

 

где xм акс, xм ин — максимальное и минимальное значение выборки.

 

Состоятельной, но смещенной оценкой дисперсии является

 

 

 

N

 

σ2 =

xi x ,

(2.5)

 

 

N i

 

а для нормальной совокупности эта оценка и эффективна.

Состоятельная и несмещенная оценка дисперсии рассчитывается по

формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sx

 

 

 

N

 

 

x) .

 

 

 

 

 

 

 

 

 

 

(xi

(2.6)

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

Эта оценка не эффективна для нормальной генеральной совокупности

особенно при малых N .

 

 

 

 

 

 

 

 

 

 

 

Для двух выборок случайных величин X и X объема N каждое, вы-

борочное значение ковариации равно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

cov X

, X

 

 

x i x x i x ,

(2.7)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N i

 

а выборочное значение коэффициента корреляции

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x i x x i x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

 

 

N i

 

 

 

 

,

(2.8)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sx Sx

 

где x , x

 

,

S ,

S

— выборочные средние и выборочные дисперсии слу-

 

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чайных величин X

и X . Данная оценка коэффициента корреляции является

состоятельной и асимптотически несмещенной.

Вычисление некоторых оценок в системе Matchcad представлено на рис. 2.2.

64

N 100

-объем выборки

v 10 -вариант

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x runif(N 0 v)

- генерирование равном ерно распределенной выборки

k 1 3.2 log(N)

 

 

 

k 7.4

k ceil(k)

 

k 8

xmin min(x)

 

 

 

xmax max(x)

xmin 0.013

 

xmax 9.968

dx

xmax xmin

 

dx 1.244

i 0 k

 

inti xmin dx i

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

hist (int x)

 

-расчет числа наблюдений, попавших в квант

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

int int

0.5 dx

-центры интервалов квантования

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e 0 v v

 

 

 

F(e) dx dunif(e 0 v)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

xmin

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xmax

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(e)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

0

1

2

3

4

5

6

7

8

9

10

 

 

 

 

 

 

int e

 

 

 

 

 

 

Использование функции Mathcad histogram упрощает процесс определения эмпирической функции распределения вероятностей:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f histogram(k x)

 

 

 

 

 

f

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xmin

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xmax

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(e)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

1

 

 

 

 

 

 

2

 

3

 

 

4

5

6

 

 

7

8

 

 

9

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f 0

e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.1. Моделирование в системе Mathcad эмпирической и теоретической функции плотности распределения вероятностей

65

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]