Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
In Лекции по статистики от Феофанова 11_09_10.doc
Скачиваний:
10
Добавлен:
29.08.2019
Размер:
4.93 Mб
Скачать

Приложение 1 Стохастическая природа экономических данных, свойства и статистические оценки случайных величин (в изложении используется аппарат математической статистики)

Общие определения

Понятие случайной переменной

Фундаментальными понятиями статистического анализа являются понятия вероятности и случайной величины (переменной). Случайной переменной называют переменную, которая под воздействием случайных факторов может с определенными вероятностями принимать те или иные значения из некоторого множества чисел. Это переменная, которой (даже при фиксированных обстоятельствах) мы не можем приписать определенное значение, но можем приписать несколько значений, которые она принимает с определенными вероятностями. Под вероятностью некоторого события (например, события, состоящего в том, что случайная переменная приняла определенное значение) обычно понимается доля числа исходов, благоприятствующих данному событию, в общем числе возможных равновероятных исходов. Категория "равновероятные исходы" не определяется, а принимается интуитивно. Например, при бросании монеты выпадение орла и решки считается равновероятным (вероятность каждого равна 1/2), а случайная величина числа "орлов" при одном бросании монеты может быть равна 0 или 1 с вероятностями 1/2.

Совокупность значений {хk} случайной величины Х вероятностей {Pk} с которыми она их принимает, называют законом распределения случайной величины. Функция Р(х), как и любая функциональная зависимость, может быть представлена в форме таблицы, формулы или графика. Например, закон распределения числа очков при бросании игрального кубика может быть представлен в виде таблицы:

X

1

2

3

4

5

6

P

1/6

1/6

1/6

1/6

1/6

1/6

Очевидно, что сумма всех этих вероятностей должна равняться единице, поскольку считаем, что с вероятностью "единица" переменная принимает хоть какое-нибудь из этих значений. Обычная (неслучайная, или детерминированная) переменная является предельным случаем случайной переменной, принимая единственное (при фиксированных обстоятельствах) значение с вероятностью "единица".

Различают дискретные и непрерывные случайные величины. Случайная величина дискретна, если результаты наблюдений представляют собой конечный или счетный набор возможных чисел. Случайная величина непрерывна, если ее значения могут лежать в некотором континууме возможных значений. (Это предполагает, что их нельзя пересчитать, ставя в соответствие им натуральные числа 1, 2,... .) Значения непрерывной случайной величины могут лежать на отрезке, интервале, луче и т. д.

В реальной практике статистического учета и анализа преимущественно используются дискретные данные.

Понятия генеральной совокупности и выборки (выборочной совокупности)

В основе математической статистики лежат понятия генеральной совокупности и выборки (выборочной совокупности).

Под генеральной совокупностью понимается все возможные наблюдения интересующего нас показателя (все единицы интересующей совокупности), все исходы случайного испытания или всю совокупность реализаций случайной величины X. Пример генеральной совокупности - данные о доходах всех жителей какой-либо страны, о результатах голосования населения по какому-либо вопросу и т.д. Однако в большинстве случаев мы имеем дело только с частью возможных наблюдений, взятых из генеральной совокупности, и называем это множество (точнее подмножество) значений выборкой. Таким образом, выборка - это множество наблюдений, составляющих лишь часть генеральной совокупности. Выборка объема п - это результат наблюдения случайной величины в вероятностном эксперименте, который повторяется п раз в одних и тех же условиях (которые могут контролироваться), а следовательно, и при неизменном распределении случайной величины X. Процесс, который приводит к получению выборочных данных, называют выборочным исследованием.

Как правило, в экономике невозможно (или экономически неоправдано) определять все единицы генеральной совокупности на практике в распоряжении имеются лишь выборочные данные, и поэтому можно говорить лишь о приближенных, в той или иной степени, оценках генеральной совокупности основываясь на данных выборочных наблюдений. В связи с этим, одной из важных в практическом менеджменте задач, является соотношение между теоретическими характеристиками и их выборочными оценками, которые будут рассматриваться в данном разделе и на практических занятиях. Также задачами раздела является получение выводов о параметрах, виде распределения и других свойствах случайных величин (генеральной совокупности) по конечной совокупности наблюдений - выборке.

Выборку называют репрезентативной (представительной), если она достаточно полно представляет изучаемые признаки и параметры генеральной совокупности.

Основные характеристики случайных величин («статистики»)

Для любой случайной величины играют числовые характеристики ее распределения, важнейшими из которых является среднее значение (математическое ожидание случайной величины) и дисперсия. Среднее значение является характеристикой положения частотного распределения, а дисперсия – мерой ширины или разброса распределения. Например, часто для предварительной оценки качества ценных бумаг перед принятием решения о их приобретении, важно знать их средний доход и риски инвестирования. Соответственно первый параметр характеризуется средним значение доходности за время их обращения, а характеристикой риска является дисперсия, характеризующая степень разброса среднего дохода (что эквивалентно знанию положения и ширины частот распределения).

Среднее значение, математическое ожидание

Как отмечалось выше среднее значение является характеристикой положения, так, например, для выборки объема продаж компьютеров за 10 дней:{xk}={1, 5, 5, 6, 2, 5, 6, 2, 6, 5}, среднее определяется сумма всех продаж деленная на количество дней продаж:

Поскольку объемы продаж повторяются можно разделив число повторений на общую сумму данных в выборке, определить среднее через частоты:

где суммирование ведется по всем значениям случайной величины Х, встречающимся в выборке ( в данном примере {xk}={1, 2, 5, 6}), а в роли весов выступают частоты этих значений (причем сумма весов равна единице).

В пределе достаточно большого числа наблюдений N частоты wk значений xk переходит в соответствующие вероятности Pk=Prob{X=xk}, и дискретная случайная величина X может быть представлена в виде таблицы значений {xk}, которые может принимать случайная величина, и соответствующим им вероятностей Pk=Prob{X=xk}:

Значение

x1

x2

...

xn

Вероятность

Р1

Р2

...

Рn

Математическое ожидание (или среднее по генеральной совокупности) значение такой случайной величины определяется как взвешивание суммы всех возможных реализаций случайной величины Х, в роли весов которой выступают вероятности этих реализаций, причем сумма весов всегда равна единице:

Следует подчеркнуть, что это числовая характеристика Х (на это указывают квадратные скобки) и соответственно относится ко всей ее величине, а не к различным ее значениям.

Другими способами обозначения математического ожидания является:

Самым общим определением для математического ожидания непрерывной случайной величины, является:

.

Свойства математического ожидания:

;

;

;

,

где a, b и с любые постоянные числа – константы.

;

;

;

.

Выборка может как дискретная случайная величина , принимающая значения x(1), x(2), … x(n), с вероятностью 1/n (если некоторые значения xi совпадают, то для расчета выборочного среднего и других характеристик они могут условно рассматриваться как разные, это не меняет конечного результата), то есть pk=1/n для всех 1≤kn. Обозначая выборочное среднее как mn получаем:

,

где n показывает объем выборки, для которой вычисляется значение выборочной характеристики. Следует понимать, что для разных выборок из одной и той же генеральной совокупности выборочные средние могут быть и не равны друг другу.

Дисперсия

Дисперсия является мерой вариативности случайной величины (то есть количественной оценкой качества средней величины), которая оценивает меру разброса среднего значения (математического ожидания). Дисперсия (для непрерывной случайной - и σ2 – для дискретной) определяется как средний квадрат отклонений случайной величины от среднего значения:

или ,

где n - число наблюдений; wk - частоты значений xk.

Общее определение дисперсии как дискретной, так и непрерывной случайной выборки имеет вид:

.

Свойства дисперсии:

;

;

;

,

где a, b и с любые постоянные числа – константы.

Связь дисперсии с математическим ожиданием:

.

Стандартной отклонение случайной величины (σ – мера разброса средней случайной величины от среднего значения, имеет размерность данной случайной величины):

Коэффициент вариации случайной величины (V - мера относительного разброса случайной величины (безразмерная величина). Дисперсия и другие меры разброса часто применяются при анализе риска различных активов в портфеле и портфеля активов в целом в финансовом анализе, а также при анализе риска других действий со случайным исходом.

.

Общие свойства случайных величин

Независимо от конкретного распределения случайной величины имеют место общие свойства вероятностных распределений. К ним относятся различного рода неравенства, определяющие границы вероятности попадания случайной величины в заданный интервал, а также утверждения, касающиеся свойств достаточно большого числа случайных величин, - так называемые законы больших чисел.

Неравенство Чебышева

Неравенство Чебышева дает оценку вероятности попадания произвольной случайной величины с неизвестным средним значением М[X] и дисперсией σ2 в заданный интервал вокруг среднего значения. Согласно этому неравенству:

или .

То есть вероятность попадания случайной величины вне интервала вокруг ее среднего значения, пропорционального среднеквадратичному (стандартному) отклонению σ, быстро убывает с увеличением коэффициента пропорциональности (α) и, соответственно, длины этого интервала 2ασ.

Таким образом, неравенство Чебышева наглядно демонстрирует значение стандартного отклонения у как характеристики разброса случайной величины вокруг среднего значения.

Пользуясь неравенством Чебышева, можно оценить вероятность тех или иных отклонений от среднего значения, независимо от природы случайной величины.

Законы больших чисел. Теоремы Бернулли, Ляпунова, Чебышева

Основная особенность случайной величины состоит в том, что нельзя предвидеть, какое значение она примет в результате испытания. Однако при достаточно большом числе испытаний обобщающие характеристики выборок случайных величин практически утрачивают случайный характер. То же верно и в отношении суммы достаточно большого числа случайных величин. При увеличении числа слагаемых в сумме противоположные случайные колебания отдельных величин сглаживаются, и закон распределения суммы приближается при определенных условиях к нормальному распределению. Различные утверждения, относящиеся к этим предельным случаям, носят название законов больших чисел. Первым утверждением такого рода была теорема Бернулли, доказанная им еще в 1713 году.

Теорема Бернулли

При достаточно большом числе независимых испытаний n вероятность того, что сколь угодно малым будет отклонение частоты m/n некоторого события А от вероятности наступления этого события Р (при условии, что она постоянна в каждом испытании), стремится к единице, т.е. является почти достоверным событием:

,

Эта теорема имеет важное значение для статистики и эконометрики, обосновывая выбор частоты осуществления некоторого события в качестве оценки вероятности этого события.

Теорема Ляпунова (центральная предельная теорема)

Распределение суммы n произвольно распределенных и взаимно независимых случайных величин при n > стремится к нормальному распределению, если вклад отдельных слагаемых в сумму равномерно мал.

Именно эта теорема обосновывает ту огромную роль, которую играет в статистике, эконометрике и во многих других областях знания нормальное распределение. Множество факторов, определяющих тот или иной экономический показатель, как правило, достаточно велико, и при выполнении условий теоремы случайное отклонение этого показателя от среднего значения может быть приближенно описано нормальным распределением.

Теорема Чебышева

При достаточно большом числе п попарно независимых случайных величин с ограниченными дисперсиями (σ2k< С, k = 1,...,n) вероятность того, что сколь угодно малое отклонение среднего арифметического этих величин от среднего арифметического их математических ожиданий, стремится к единице:

, где

Согласно этой теоремы, среднее арифметическое достаточно большого числа случайных величин утрачивает характер случайной величины и ведет себя почти как постоянная величина. Теорема имеет важное значение для статистики и эконометрики, обосновывая выбор среднего арифметического выборочных величин в качестве оценки математического ожидания (среднего значения) всей совокупности единиц.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]