Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

econometrika / Оформление / Лабораторная работа № 1

.doc
Скачиваний:
13
Добавлен:
27.03.2016
Размер:
143.36 Кб
Скачать

Лабораторная работа № 1

Вариант № 3

Тема: Анализ непрерывной случайной величины

Цели: Построение гистограммы распределения непрерывной случайной величины

Задание на работу: Построить гистограмму распределения непрерывной случайной величины

Непрерывные случайные величины

Случайная величина непрерывна, если ее реализации принимают некоторый континуум возможных значений. (Это предполагает, что их нельзя пересчитать, ставя в соответствие им натуральные числа 1, 2,....) Значения непрерывной случайной величины могут представлять собой отрезок, интервал, луч и т.д.

При больших объемах выборки, содержащей значения некото­рой случайной величины, ее элементы группируют по интервалам значений. Для этого интервал выборки, содержащий все ее значения, разбивают на k непересекающихся интервалов, длина которых для удобства расчетов чаще всего выбирается одинаковой и равной размаху выборки, деленному на желаемое число интервалов:

x=S/k (x(n) - x(1))/k

После того, как частичные интервалы выбраны, так же, как и в "точечном" случае, определяют абсолютные частоты - количество элементов выборки п, попавших в j-й интервал, причем элемент, совпадаю­щий с верхней границей интервала относят к последующему интер­валу.

Наряду с частотами подсчитываются относительные частоты, на­копленные частоты и накопленные относительные частоты. Полу­ченные результаты также записывают в виде таблицы, первая стро­ка которой содержит границы последовательных интервалов (в Excel – значение нижней границы, интервал называют карманом), а вто­рая - соответствующие им частоты (абсолютные, относительные, интегральные относительные частоты). Как и для "точечной" выборки, для выборки, сгруппированной по интерва­лам по значениям накопленных частот, может быть построена вы­борочная функция распределения.

Для наглядного представления выборки часто используют ее графическое отображение - гистог­рамму частот и гистограмму относительных частот. Любая из этих гистограмм представляет собой кусочно-постоянную функцию, принимающую значения nj/x или j/x на j-м интервале упорядоченной по возрастанию выборки. Эту функцию представляют в виде ступен­чатой фигуры, состоящей из прямоугольников шириной x высотой nj/x (j/x) , построенных на соответствующих интервалах.

Площадь j-го прямоугольника равна x (nj/x) (или j), а площадь всей ступенчатой фигуры под графиком гистограммы равна объему вы­борки (для гистограммы частот) или единице (для гистограммы от­носительных частот).

Пример 1.1

Рассмотрим гистограмму распределения по росту людей в какой-либо выборке, например студентов одного из институтов:

Таблица 1

Рост x

155-160

160-165

165-170

170-175

175-185

180-185

185-190

nx/n

0,07

0,15

0,20

0,25

0,18

0,10

0,05

Рисунок 1

Высота каждого столбика в изображенной на рисунке гистограм­ме пропорциональна количеству людей, рост которых попадает в соответствующий интервал. Допустим, что у 250 из 1000 выбран­ных для обследования студентов рост находится в пределах от 170 до 175 см (170 <X < 175). Тогда на гистограмме высота столбика, соответствующего этому интервалу, равна nj/(nx)= 250/(10005).

Если рассматривать рост студентов X в качестве значений случайной переменной Н, то при достаточно большом числе наблюдений относительные частоты появления значений xk в интервале x < X < x+x будут стремиться к вероятности попадания значений роста в вышеуказанный интер­вал Prob{x < X < x+x}, а относительные накопленные частоты к вероятности Prob{X < x}.

При достаточно большом числе наблюдений относительные частоты появления значений xk в интервале x < X < x+x будут стремиться к вероятности попадания значений случайной величины в вышеуказанный интер­вал Prob{< X < x+x}, а относительные накопленные частоты к вероятности Prob{X < x}, которая является функцией конкретного значения x и называется функцией распределения FX(x) непрерыв­ной случайной величины X.

Если длину интервала x устремить к нулю, то вероятность по­падания в каждый конкретный интервал также будет стремиться к нулю. Однако отношение этой вероятности к длине интервала стре­мится при этом к так называемой плотности вероятности – функции конкретного значения x.

Плотность вероятности можно интерпретировать как вероятность попадания реализации случайной величины X в беско­нечно малый интервал, содержащий точку x, в расчете на единицу его длины:

fX(x)=

Более строго, если случайная величина является непрерывной, т.е. принимает любые значения из некоторого интервала, то вероятность того, что она принимает неко­торое конкретное значение (точечную вероятность) равна 0, поскольку в любом конечном интервале содержится бесконечное число значе­ний. Однако, функция распределения случайной величины FX(x), опреде­ляемая как вероятность того, что случайная величина принимает значение меньше данного числа x

сохраняет смысл и для непрерывной случайной величины. В дан­ном случае это некоторая непрерывная неубывающая функция дей­ствительного аргумента х.

В общем случае, разбивая интервал значений непрерывной вели­чины (-, х2) на два интервала (-, х1) и [х1, х2) (одновременные попадания случайной величины в которые являются взаимоисклю­чающими событиями), мы имеем

Prob{-X<x1}+ Prob{x1X<x2}= Prob{-X<x2}.

Отсюда находим, что искомая вероятность попадания непрерыв­ной случайной величины в интервал x1X<x2 равна разности функций распределения этой случайной величины:

Prob{x1X<x2}= Prob{-X<x2}- Prob{-X<x1}  Fx(x2) - Fx(x1)

Проводя такие же рассуждения, мы можем найти вероятность попадания непрерывной случайной величины в бесконечно малый интервал х Х < х + x

Prob{xX<x+x}= Prob{-X<x+x}- Prob{-X<x}Fx(x+x) - Fx(x) d Fx(x) Fx(x)dx

В последних двух равенствах мы использовали определение бес­конечно малого изменения функции распределения (или диффе­ренциала этой функции). Из найденного соотношения видно, что вероятность попадания непрерывной случайной величины в беско­нечно малый интервал xX<x+x бесконечна мала и пропорци­ональна величине этого интервала x. Отношение этой бесконечно малой вероятности к бесконечно малой величине интервала имеет конечное значение и характеризует плотность вероятности в точке х.

Итак, плотность распределения вероятности

И, наоборот,

Основные характеристики случайных величин ("статистики")

Для любой случайной величины важную роль, помимо функции распределения, играют числовые характеристики ее распределения, важнейшими из которых являются среднее значение (математичес­кое ожидание случайной величины) и дисперсия. Среднее значение - это характеристика центра группирования значений исследуемого признака, а дисперсия - мерой ширины или разброса распределения. Различают арифметическое, геометрическое, гармоническое средние значения, а также моду и медиану.

Во многих практических случаях информация о случайных переменных, со­держащаяся в частотном распределении является избыточной. На­пример, для принятия решения о покупке акций важно, в первую очередь, знать средний доход на них и риск инвестирования в них.

Выполнение работы:

Для вычисления коэффициента частоты между двумя наборами данных используется функция ЧАСТОТА. Для нахождения частоты между суммой продаж и выборкой используем функцию ЧАСТОТА, указав в окне диалога диапазоны. Полученные значения 98, 197, 286, 365. Аналогично прописывает Интегральный %.

После этого делаем «Анализ непрерывной случайной величины»

Вычисляем «Максимальное значение» формулой МАКС – и получаем число - 1998,56

Минимальное значение – МИН – 2,92

Размах выборки – максимальное число отнять минимальное, получаем - 1995,64

Для решения «Верхней границы интервала» необходимо применить такую формулу: начиная с минимального значения мы берем число плюсуем с размахом выборки (который вычислили с помощью «Анализа непрерывной случайной величины») и делим на четыре (четыре числа – размах выборки – которые дано изначально). После проведения операции получаем такие значения 2,92; 501,83; 1000,74; 1499,65; 1998,56.

За счет данных которые получили строим гистограмму. После чего получаем результат.

В зависимости от полученного мы видим, что интегральный % будет выше при частоте 365.

6.050103.4157ТЗ.ЛР1

Лист

Изм

Лист

№ докум

Подпись

Дата