Скачиваний:
114
Добавлен:
08.04.2015
Размер:
3.32 Mб
Скачать

Математическое ожидание, дисперсия, стандартное отклонения в сжатой форме отражают наиболее существенные особенности каждого конкретного распределения, поэтому их называют числовыми характеристиками случайной величины. Многие задачи анализа можно решать, оперируя только числовыми характеристиками случайных величин без рассмотрения законов распределения.

ОСНОВНЫЕ ТЕРМИНЫ (ГЛОССАРИЙ)

Случайная величина – величина, относительно которой заранее нельзя сказать, какое в точности значение она примет.

Числовые характеристики случайной величины – характе-

ристики, которые в сжатой форме отражают наиболее существенные особенности случайной величины и ее закона распределения. К ним относятся математическое ожидание, дисперсия, стандартное отклонения случайной величины и некоторые другие.

Средняя арифметическая – числовая характеристика случайной величины, используемая в качестве ее «типичного» значения. Вычисляется сложением (нахождением суммы) всех значений наблюдаемого количественного признака и делением полученной суммы на общее число наблюдений.

Выборочная средняя – оценка среднего значения генеральной совокупности, полученная на основе выборочных данных.

«Описательная статистика» – инструмент надстройки «Па-

кет анализа» в Excel, применяемый для обработки выборочных данных и вычисления числовых характеристик выборки.

Медиана – такое значение исследуемой величины, слева и справа от которого находится одинаковое число упорядоченных по возрастанию или убыванию выборочных данных.

Мода (Mo) – значение исследуемой величины, чаще всего, встречающееся в наборе данных (выборке).

Дисперсия – «измеритель» степени разброса значений случайной величины относительного среднего значения (математиче-

ского ожидания). Обозначается символом D или σ 2 = D .

Стандартное отклонение – «измеритель» степени разброса значений случайной величины относительного среднего (матема-

тического ожидания). Корень квадратный из дисперсии σ = D .

71

4.ЗАКОНЫ РАСПРЕДЕЛЕНИЯ

ИИХ ПРИМЕНЕНИЕ ДЛЯ РАСЧЕТОВ

ИАНАЛИЗА

4.1. Введение

Как уже отмечалось в п.3, многие экономические показатели можно отнести к разряду случайных величин, т.е. таких, относительно которых заранее нельзя сказать, какое в точности значение они примут. Наиболее полно случайную величину описывает закон распределения, показывающий, какие значения этой величины следует ожидать чаще (с большей вероятностью), а какие реже (с меньшей вероятностью). Первичное представление о законе распределения исследуемого показателя дает гистограмма, полученная на основе обработки статистических данных методом группировки (п.2). Она сама по себе уже является полезным источником информации. Однако, если по эмпирическому закону распределения (гистограмме) выбрать соответствующий ему теоретический закон распределения, из числа тех, которые хорошо изучены и имеют аналитическое описание, то круг задач, которые можно решать на их основе существенно расширяется. В этом случае появляется возможность проведения более глубоких исследований и получения более обоснованных выводов об изучаемом экономическом процессе.

4.2 Понятие о законах распределения случайных величин

Случайные величины подразделяют на дискретные, когда все возможные значения величины можно перечислить или пронумеровать и непрерывные, когда возможные значения случайной величины непрерывно заполняют некоторый промежуток.

72

Законом (рядом) распределения дискретной, случайной ве-

личины называют всякое соотношение, связывающее между собой ее возможные значения с соответствующими им вероятностями.

Если Y дискретная случайная величина, все значения кото-

рой можно перечислить (Y принимает только одно из N возможных значений y1 , y2 , ..., yN ) и известны вероятности, с которыми она

принимает соответствующие значения, то закон ее распределения можно представить таблицей (рядом распределения) – табл. 4.1.

 

 

 

 

Таблица 4.1.

 

 

 

 

 

 

Значения Y

y1

y2

. . .

yn

Вероятности P ( Y = yi )

P1

P2

. . .

Pn

 

Причем, для ряда распределения должно выполняться усло-

n

вие Pi =1.

i =1

Типичными примерами дискретных случайных величин являются число покупателей или посетителей магазина или ресторана, число проданных единиц товара, число вышедших из строя бытовых приборов, предъявленных на гарантийный ремонт и т.д. Дискретная случайная величина полностью определяется своим законом (рядом) распределения.

Для получения закона распределения исходные данные группируют по интервалам и составляют частотный ряд. В результате получают эмпирический аналог закона распределения. Оценками вероятностей служат относительные частоты (доли), а в качестве yi используют, как правило, значение середины интервала.

Наряду с дискретными случайными величинами, большое число показателей в реальной экономике носит непрерывный характер – сроки службы объекта, время обслуживания клиента, вес груза или обрабатываемой детали и т.д. Для непрерывной случайной величины записать таблицу ряда распределения невозможно, т.к. число ее значений на любом числовом промежутке бесконечно в силу непрерывности. Поэтому для задания закона распределения таких величин используют не вероятность события Y = yi , а вероятность события Y < yi , для чего вводят специальную

функцию распределения (интегральную функцию распределе-

ния) вида

F(yi) = P (Y < yi) .

73

Наряду с F(x), для задания закона распределения непрерывной случайной величины, используют также функцию плотности вероятности, обозначаемую как f(y).

Обе функции связаны между собой соотношением

f ( y) = F( y) .

Например, для нормально распределенных случайных величин графики функции распределения и функции плотности вероятности выглядят следующим образом – Рис. 4.1.

График функции распределения

График функции плотности

F(x)

вероятности

1

0,12

0,8

0,1

0,08

0,6

0,06

0,4

0,04

0,2

0,02

0

0

 

Рис. 4.1.

Вероятность того, что случайная величина с известной функцией плотности вероятности f(y) заключена в интервале (a,b) вычисляется по формуле

P(a < y < b) = b f ( y)dy = F(b) F(a)

a

Для наиболее распространенных законов распределения функции f(y) и F(y) получены в аналитическом либо табличном виде и хорошо изучены. Для определения их конкретных числовых значений и проведения расчетов существуют специальные таблицы, а в Excel предусмотрены стандартные функции (см. Приложение 1).

Случайная величина полностью определяется заданием либо функции распределения, либо функции плотности вероятности.

При обработке статистики с целью получения закона распределения, исходные данные группируют по интервалам и в резуль-

74

тате получают эмпирический аналог закона распределения так, как это показано в Главе 2.

Гистограмма эмпирического распределения является основой для выбора соответствующего теоретического закона с определенной функцией плотности вероятности f(y). Переход к теоретическому распределению позволяет использовать аналитические формулы и соотношения для последующего количественного анализа и получения вероятностно обоснованных оценок. В практической статистике такой прием используют достаточно широко.

В каждом конкретном случае необходимо проверять соответствие эмпирического закона распределения выбранному теоретическому закону распределения. Для этого разработаны специальные процедуры и критерии (Приложения 2, 3).

4.3.Эмпирические законы распределения

иих содержательный смысл

Гистограммы являются удобным инструментом для получения дополнительной информации об исследуемом показателе, поскольку наглядно иллюстрируют, какие из его значений встречаются чаще, а какие реже.

Пример 4.1. Пусть имеется некоторая выборка – дневные эксплуатационные издержки производства за полугодие (таблица 4.2).

Таблица 4.2.

Эксплуатационные производственные издержки (у.д.е.)

1170

1207

1581

1277

1305

1472

1077

1319

1537

1849

1332

1418

1949

1403

1744

1532

1219

896

1500

1671

1471

1399

1041

1379

821

1558

1118

1533

1510

1760

1826

1309

1426

1288

1394

1545

1032

1289

695

803

1440

1421

1329

1407

718

1457

1449

1455

2051

1667

1119

1020

1400

1442

1593

1962

1263

1788

1501

1688

1352

1340

1459

1823

1451

1138

1592

982

1981

1091

1428

1603

1699

1237

1325

1590

1142

1425

1550

913

1470

1783

1618

1431

1557

896

1662

1591

1551

1612

1249

1419

2162

1373

1542

1631

1567

1221

1972

1714

949

1539

1634

1637

1649

1607

1640

1739

1540

2187

1752

1648

1978

640

1736

1222

1790

1188

2091

1829

75

Если обработать этот статистический материал методом группировки, то будет получена гистограмма, показанная на рис.4.2, которую можно рассматривать как эмпирическую (построенную на основе выборочных данных) оценку закона распределения случайной величины Y – размера эксплуатационных затрат предприятия.

40%

 

 

 

33%

 

 

 

35%

 

 

 

 

 

 

 

 

 

 

 

 

 

30%

 

 

 

 

 

 

 

25%

 

 

18%

 

20%

 

 

20%

 

 

 

 

 

 

 

 

 

 

 

 

15%

 

9%

 

 

 

8%

 

10%

6%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3%

5%

3%

 

 

 

 

 

0%

 

 

 

 

 

 

 

 

600 - 800 800 -

1000 -

1200 -

1400 -

1600 -

1800 -

2000 -

 

1000

1200

1400

1600

1800

2000

2200

Рис.4.2.

Эмпирическое распределение может напрямую использоваться для получения различных оценок. Так, например, по результатам наблюдений можно сделать вывод о том, что примерно в 18% случаев эксплуатационные издержки будут находится в диапазоне от 1200 до 1400, а в 3% случаев в диапазоне от 600-800.

Гистограмма позволяет также получить оценки вероятности того, что величина предполагаемых, например, в будущем издержек окажется в заданном интервале. Так, приближенное значение вероятности того, что издержки будут лежать в диапазоне от 1200,

до 1800 составит 0,71 (~18% + ~33% + ~20% = 71%) – рис. 4.2. Или,

с вероятностью 0,89 можно утверждать, что величина издержек не превысит 1800 (в ~89% случаев издержки будут меньшими, чем 1800). Однако для проведения более детального анализа было бы удобнее использовать не графическую гистограмму с существенными погрешностями и приближениями, а какой-либо теоретический закон распределения, соответствующий данному эмпирическому. В этом случае появляется возможность проводить любые оценки и расчеты в аналитическом виде.

76

20%

50%

15%

40%

 

10%

30%

20%

 

5%

10%

 

0%

0%

Рис. 4.3

Рис. 4.4

Реальные эмпирические распределения могут быть различными. На рис. 4.3 изображен равномерный закон распределения – во всем диапазоне изменения случайной величины все значения приблизительно равновероятны. На рис. 4.4 – закон, близкий к Пуассоновскому. На рис. 4.2 распределение издержек близко к нормальному закону распределения – наиболее распространенному в реальной экономике.

4.4. Переход от эмпирических законов распределения к теоретическим

Установление вида закона распределения исследуемой случайной величины на основе выборочных данных является одной из важных задач математической статистики. На практике очень удобно использовать какой-либо известный теоретический закон распределения (нормальный, экспоненциальный, Пуассона и др.) для последующего проведения аналитических исследований и расчетов, связанных с изучением реальной случайной величины.

Критерии, которые используют для проверки гипотез о предполагаемом законе распределения случайной величины, называют критериями согласия. С их помощью устанавливается – достаточно ли хорошо опытные данные согласуются с предполагаемым законом распределения. Если да, то затем теоретический закон распределения можно использовать далее для описания случайной величины и различных оценок.

77

Основанием для выдвижения гипотезы о том, каков вид (тип) закона распределения случайной величины, может служить ее эмпирический ряд распределения, полученный методом группировки данных и его графическое представления в виде гистограммы.

 

 

Гистограмма (эмпирическое

 

 

 

 

распределение)

 

 

 

 

25%

 

 

 

 

 

18%

23%

19%

 

 

 

 

 

 

 

 

 

 

 

 

20%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15%

 

 

 

10%

 

 

 

11%

 

 

 

 

10%

 

 

 

 

 

 

 

7%

 

 

 

 

 

 

6%

 

 

 

 

 

3%

 

 

5%

 

2%

 

 

 

 

 

 

 

1% 0%

 

 

 

 

 

 

0%

 

0%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13 15 17 19 21 23 25 27 29 31 33 35

Функция плотности вероятности

теоретического распределения

0,12

 

 

0,1

 

 

0,08

 

 

0,06

 

 

0,04

 

 

0,02

 

 

0

 

 

12 14 16

18 20 22 24 26 28

30 32 34 36

Рис. 4.5.

Например, гистограмма – рис. 4.5, полученная по результатам обработки наблюдений, указывает на то, что, скорее всего, исследуемая случайная величина распределена по нормальному закону (см. Приложение 1).

Для того, чтобы подтвердить или опровергнуть гипотезу о том, каков вид закона распределения случайной величины, используют следующий алгоритм.

1. На основе выборочных данных y1 , y2 , K, yN (выборки

объема N ) методом группировки строят эмпирический ряд распределения – строка «Относительная частота» в табл.4.3:

 

 

 

 

 

 

 

 

Таблица 4.3

 

 

 

 

 

 

 

 

 

 

 

Интервал

 

1

 

2

 

...

 

m

ymin

÷ y(1)

y(1) ÷ y(2)

y(m1) ÷ ymax

 

Относитель-

 

n1

 

 

n2

 

 

nm

 

ная частота

 

N

 

N

 

N

 

 

 

 

Вероятности

 

p1

 

p2

 

pm

 

 

 

 

 

 

 

 

 

 

 

На основе эмпирического ряда распределения строят гистограмму. Вид гистограммы служит основанием для выбора предпо-

лагаемого теоретического закона распределения случайной вели-

78

чины. Этот этап называют выдвижением нулевой гипотезы – гипотезы, которая утверждает, что различие между сравниваемыми эмпирическим и теоретическим распределениями отсутствует, а наблюдаемые отличия объясняются лишь случайными отклонениями. Если выдвинутая гипотеза отвергается, то вместо нее при-

нимается альтернативная гипотеза.

2. Используя функцию плотности вероятности предполагае-

мого теоретического распределения f ( y) , вычисляют вероятности p1 , p2 , K, pm попадания случайной величины в каждый из интервалов – строка «Вероятности» в табл. 4.3.

yi

pi = f ( y) dy , (i =1,2,...m) .

yi 1

Для нахождения pi используют либо специальные таблицы,

составленные для всех основных законов распределения – [6, 10, 12], либо стандартные функции Excel – см. Приложение 1.

3. Для проверки гипотезы о том, согласуется ли эмпирическое распределение с предполагаемым теоретическим законом распределения, применяют специальный критерий согласия. В качестве критерия согласия обычно используют критерий «хи-квадрат», который «измеряет» расхождения между эмпирическим и теоретическим законами распределения. В качестве меры расхождения ис-

пользуют сумму квадратов отклонений относительных частот nNi

от «теоретических» вероятностей pi :

 

n

i

2

 

 

N

 

pi

 

m

 

 

 

N

 

 

 

χ2 =

.

(4.1)

 

 

 

 

i =1

 

 

pi

 

Установлено (см. Приложение 3), что если математическое ожидание и дисперсия случайной величины предполагаемого закона распределения точно неизвестны, а вместо них используются выборочные оценки y, S , то статистика (4.1) имеет распределение «хи-

квадрат» с m k 1 степенями свободы, где m – число карманов (интервалов), k – число параметров теоретического распределения.

79

4.По формуле (4.1) на основе данных таблицы 4.3 вычисляют значение критерия согласия для рассматриваемой выборки –

χвыб2 .

5.Для заданного уровня значимости α (уровня надежности

γ=1α) и числа степеней свободы m k 1 находят границу од-

носторонней критической

области χкр2

. – квантиль уровня

α: χкр2

. = χα2

; mk1 . Квантиль χα2

; mk1 можно найти либо из таблиц рас-

пределения «хи-квадрат» – [6, 10, 12], либо с помощью стандартной функции Excel – ХИ2ОБР ( α; m-k-1 ) – Приложение 3.

6.

На основе сравнения наблюдаемого (выборочного) значе-

ния χвыб2

. с критическим значением χкр2

. = χα2

; mk 1 принимают одно

из двух решений:

 

 

 

 

 

y

Если χвыб2

. < χкр2

. = χα2

; mk 1 , то для отклонения нулевой ги-

потезы нет оснований – выбранная теоретическая функция распределения согласуется с опытными данными.

y Если χвыб2 . > χкр2 . = χα2; mk 1 , то нулевая гипотеза отверга-

ется в пользу альтернативной – считается, что выбранная теоретическая функция распределения не согласуется с опытными данными.

Алгоритм проверки гипотез о соответствии выборочных данных какому-либо теоретическому закону распределения на основе критерия согласия «хи-квадрат» легко формализуется в Excel.

Пример 4.2. По результатам предшествующей деятельности управляющим была собрана статистика по месячным эксплуатационным расходам, приведенная в таблице 4.4.

Требуется

yобработать статистический массив и определить наиболее вероятные значения эксплуатационных расходов;

yоценить вероятность того, что месячные эксплуатационные расходы не превысят 50 тыс. руб.;

yоценить вероятность того, что в будущем расходы будут не ниже, чем 38 тыс. руб.;

yоценить вероятность того, что предстоящие расходы окажутся в диапазоне 38–50 тыс. руб.

80