econometrika / Оформление / Лабораторная работа № 1
.doc
Лабораторная работа № 1
Вариант № 3
Тема: Анализ непрерывной случайной величины
Цели: Построение гистограммы распределения непрерывной случайной величины
Задание на работу: Построить гистограмму распределения непрерывной случайной величины
Непрерывные случайные величины
Случайная величина непрерывна, если ее реализации принимают некоторый континуум возможных значений. (Это предполагает, что их нельзя пересчитать, ставя в соответствие им натуральные числа 1, 2,....) Значения непрерывной случайной величины могут представлять собой отрезок, интервал, луч и т.д.
При больших объемах выборки, содержащей значения некоторой случайной величины, ее элементы группируют по интервалам значений. Для этого интервал выборки, содержащий все ее значения, разбивают на k непересекающихся интервалов, длина которых для удобства расчетов чаще всего выбирается одинаковой и равной размаху выборки, деленному на желаемое число интервалов:
x=S/k (x(n) - x(1))/k
После того, как частичные интервалы выбраны, так же, как и в "точечном" случае, определяют абсолютные частоты - количество элементов выборки п, попавших в j-й интервал, причем элемент, совпадающий с верхней границей интервала относят к последующему интервалу.
Наряду с частотами подсчитываются относительные частоты, накопленные частоты и накопленные относительные частоты. Полученные результаты также записывают в виде таблицы, первая строка которой содержит границы последовательных интервалов (в Excel – значение нижней границы, интервал называют карманом), а вторая - соответствующие им частоты (абсолютные, относительные, интегральные относительные частоты). Как и для "точечной" выборки, для выборки, сгруппированной по интервалам по значениям накопленных частот, может быть построена выборочная функция распределения.
Для наглядного представления выборки часто используют ее графическое отображение - гистограмму частот и гистограмму относительных частот. Любая из этих гистограмм представляет собой кусочно-постоянную функцию, принимающую значения nj/x или j/x на j-м интервале упорядоченной по возрастанию выборки. Эту функцию представляют в виде ступенчатой фигуры, состоящей из прямоугольников шириной x высотой nj/x (j/x) , построенных на соответствующих интервалах.
Площадь j-го прямоугольника равна x (nj/x) (или j), а площадь всей ступенчатой фигуры под графиком гистограммы равна объему выборки (для гистограммы частот) или единице (для гистограммы относительных частот).
Пример 1.1
Рассмотрим гистограмму распределения по росту людей в какой-либо выборке, например студентов одного из институтов:
Таблица 1
Рост x
|
155-160 |
160-165 |
165-170 |
170-175 |
175-185 |
180-185 |
185-190 |
nx/n |
0,07 |
0,15 |
0,20 |
0,25 |
0,18 |
0,10 |
0,05 |
Рисунок 1
Высота каждого столбика в изображенной на рисунке гистограмме пропорциональна количеству людей, рост которых попадает в соответствующий интервал. Допустим, что у 250 из 1000 выбранных для обследования студентов рост находится в пределах от 170 до 175 см (170 <X < 175). Тогда на гистограмме высота столбика, соответствующего этому интервалу, равна nj/(nx)= 250/(10005).
Если рассматривать рост студентов X в качестве значений случайной переменной Н, то при достаточно большом числе наблюдений относительные частоты появления значений xk в интервале x < X < x+x будут стремиться к вероятности попадания значений роста в вышеуказанный интервал Prob{x < X < x+x}, а относительные накопленные частоты к вероятности Prob{X < x}.
При достаточно большом числе наблюдений относительные частоты появления значений xk в интервале x < X < x+x будут стремиться к вероятности попадания значений случайной величины в вышеуказанный интервал Prob{x < X < x+x}, а относительные накопленные частоты к вероятности Prob{X < x}, которая является функцией конкретного значения x и называется функцией распределения FX(x) непрерывной случайной величины X.
Если длину интервала x устремить к нулю, то вероятность попадания в каждый конкретный интервал также будет стремиться к нулю. Однако отношение этой вероятности к длине интервала стремится при этом к так называемой плотности вероятности – функции конкретного значения x.
Плотность вероятности можно интерпретировать как вероятность попадания реализации случайной величины X в бесконечно малый интервал, содержащий точку x, в расчете на единицу его длины:
fX(x)=
Более строго, если случайная величина является непрерывной, т.е. принимает любые значения из некоторого интервала, то вероятность того, что она принимает некоторое конкретное значение (точечную вероятность) равна 0, поскольку в любом конечном интервале содержится бесконечное число значений. Однако, функция распределения случайной величины FX(x), определяемая как вероятность того, что случайная величина принимает значение меньше данного числа x
сохраняет смысл и для непрерывной случайной величины. В данном случае это некоторая непрерывная неубывающая функция действительного аргумента х.
В общем случае, разбивая интервал значений непрерывной величины (-, х2) на два интервала (-, х1) и [х1, х2) (одновременные попадания случайной величины в которые являются взаимоисключающими событиями), мы имеем
Prob{-X<x1}+ Prob{x1X<x2}= Prob{-X<x2}.
Отсюда находим, что искомая вероятность попадания непрерывной случайной величины в интервал x1X<x2 равна разности функций распределения этой случайной величины:
Prob{x1X<x2}= Prob{-X<x2}- Prob{-X<x1} Fx(x2) - Fx(x1)
Проводя такие же рассуждения, мы можем найти вероятность попадания непрерывной случайной величины в бесконечно малый интервал х Х < х + x
Prob{xX<x+x}= Prob{-X<x+x}- Prob{-X<x} Fx(x+x) - Fx(x) d Fx(x) Fx(x)dx
В последних двух равенствах мы использовали определение бесконечно малого изменения функции распределения (или дифференциала этой функции). Из найденного соотношения видно, что вероятность попадания непрерывной случайной величины в бесконечно малый интервал xX<x+x бесконечна мала и пропорциональна величине этого интервала x. Отношение этой бесконечно малой вероятности к бесконечно малой величине интервала имеет конечное значение и характеризует плотность вероятности в точке х.
Итак, плотность распределения вероятности
И, наоборот,
Основные характеристики случайных величин ("статистики")
Для любой случайной величины важную роль, помимо функции распределения, играют числовые характеристики ее распределения, важнейшими из которых являются среднее значение (математическое ожидание случайной величины) и дисперсия. Среднее значение - это характеристика центра группирования значений исследуемого признака, а дисперсия - мерой ширины или разброса распределения. Различают арифметическое, геометрическое, гармоническое средние значения, а также моду и медиану.
Во многих практических случаях информация о случайных переменных, содержащаяся в частотном распределении является избыточной. Например, для принятия решения о покупке акций важно, в первую очередь, знать средний доход на них и риск инвестирования в них.
Выполнение работы:
Для вычисления коэффициента частоты между двумя наборами данных используется функция ЧАСТОТА. Для нахождения частоты между суммой продаж и выборкой используем функцию ЧАСТОТА, указав в окне диалога диапазоны. Полученные значения 98, 197, 286, 365. Аналогично прописывает Интегральный %.
После этого делаем «Анализ непрерывной случайной величины»
Вычисляем «Максимальное значение» формулой МАКС – и получаем число - 1998,56
Минимальное значение – МИН – 2,92
Размах выборки – максимальное число отнять минимальное, получаем - 1995,64
Для решения «Верхней границы интервала» необходимо применить такую формулу: начиная с минимального значения мы берем число плюсуем с размахом выборки (который вычислили с помощью «Анализа непрерывной случайной величины») и делим на четыре (четыре числа – размах выборки – которые дано изначально). После проведения операции получаем такие значения 2,92; 501,83; 1000,74; 1499,65; 1998,56.
За счет данных которые получили строим гистограмму. После чего получаем результат.
В зависимости от полученного мы видим, что интегральный % будет выше при частоте 365.
|
|
|
|
|
6.050103.4157ТЗ.ЛР1 |
Лист |
|
|
|
|
|
|
|
Изм |
Лист |
№ докум |
Подпись |
Дата |