![](/user_photo/2706_HbeT2.jpg)
- •Модуль 2. Анализ случайных величин. Основные характеристики, законы распределения
- •2.1 Понятия генеральной совокупности и выборки
- •2.2.1 Дискретные случайные величины
- •2.2.2 Репрезентативность выборки. Сравнение относительных частот в выборке и генеральной совокупности.
- •2.3 Непрерывные случайные величины
- •Лабораторная работа №2.3. Построение гистограммы распределения непрерывной случайной величины
- •Выполнение
- •2.4 Основные характеристики случайных величин ("статистики")
- •2.4.1. Среднее (арифметическое) значение. Математическое ожидание
- •2.4.2. Дисперсия
- •Пример 2.5
- •Свойства дисперсии:
- •2.4.3. Связь дисперсии с математическим ожиданием
- •Лабораторная работа №2.4. Характеристики случайной величины
- •Выполнение
Лабораторная работа №2.3. Построение гистограммы распределения непрерывной случайной величины
Для выполнения данной работы потребуется выборка, характеризующая случайную величину – цены на коттеджи в Подмосковье. Эти данные содержатся в файле LAB1.xls.
Необходимо построить гистограмму распределения цен. Для этого используем средство Сервис \ Анализ данных \ Гистограмма.
Выполнение
Скопируйте файл в свой рабочий каталог.
Предварительно определим размах выборки, ее максимальное и минимальное значение. Для этого, начиная с клетки D1, создайте таблицу по образцу.
Таблица 2.5.
Анализ непрерывной случайной величины | |
Максимальное значение |
= МАКС(B2:B51) |
Минимальное значение |
= МИН(B2:B51) |
Размах выборки |
= E2-E3 |
Чтобы ввести формулы в ячейки E2 иE3, воспользуйтесь командойВставка\ФункцияРазделСтатистические. Адреса клеток вводят латинскими буквами, либо указывают требуемый диапазон с помощью мыши. В ячейках с формулами отобразятся результаты вычислений.
Выберем количество интервалов 6. Для подсчета частоты, с которой значения попадают в тот или иной интервал, зададим их верхние границы в диапазоне H2:H8:
Верхняя граница интервала |
=E3 |
=H3+$E$4/5 |
=H4+$E$4/5 |
=H5+$E$4/5 |
=H6+$E$4/5 |
=H7+$E$4/5 |
Теперь введите данные в окно Сервис \ Анализ данных \ Гистограммапо образцу.
После
нажатия кнопки ОК на новой странице
появится таблица абсолютных и интегральных
частот, а также их график. На нем сплошной
линией будет отображена кривая
интегральных частот, ведущая себя также
как функция распределения, а столбчатая
гистограмма отображает распределение
абсолютных частот.
2.4 Основные характеристики случайных величин ("статистики")
Для любой случайной величины важную роль, помимо функции распределения, играют числовые характеристики ее распределения, важнейшими из которых являются среднее значение (математическое ожидание случайной величины) и дисперсия. Среднее значение - это характеристика центра группирования значений исследуемого признака, а дисперсия - мерой ширины или разброса распределения. Различают арифметическое, геометрическое, гармоническое средние значения, а также моду и медиану.
Во многих практических случаях информация о случайных переменных, содержащаяся в частотном распределении является избыточной. Например, для принятия решения о покупке акций важно, в первую очередь, знать средний доход на них и риск инвестирования в них денег, характеризуемый степенью разброса среднего дохода (дисперсией).
2.4.1. Среднее (арифметическое) значение. Математическое ожидание
Пример 2.4
Пусть имеется, например, выборка объемов продаж холодильниковза 10 дней:{хk} ={1,5,5,6,2,5,6,2,6,5}. Среднее значение объема продаж за один день для этой выборки мы получим, если сложим все выборочные данные и разделим сумму на их число:
=(1+5+5+6+2+5+6+2+6+5)/10
= 4,3
Если мы посмотрим на сумму в правой части равенства, то заметим, что многие числав нейповторяются. При этом число повторений, деленное на общее число данных в выборке, является ни чем иным, как частотой появления соответствующих значений в выборке. Среднее значение:
=
=
0,1 + 0,4 + 2,0 + 1,8 = 4,3
здесь суммирование ведется по всем различным значениям случайной величины X,встречающимся в выборке (в данном примере{xk} = {1,2,5,6}), а в роли весов выступают частоты этих значений{k} = {0,1; 0,2; 0,4; 0,3} (видно, что сумма весов равна единице).
Среднее значение можно определить так:
,
где суммирование ведется по всем различным значениям случайной величины X,встречающимся в выборке, а в роли весов выступают частоты этих значений (причем сумма весов равна единице).
В пределе достаточно большого числа
наблюдений Nчастотыkзначенийхkпереходят в соответствующие вероятности
,
и дискретная случайная величинаXможет быть представлена в виде таблицы
значений {хk}, которые
может принимать случайная величина, и
соответствующих им вероятностей
:
Х |
X1 |
X2 |
… |
Xn |
Р |
Р1 |
Р2 |
… |
Рnи |
Математическое ожидание или среднее (по генеральной совокупности) значение такой случайной величины определяется как взвешенная сумма всех возможных реализации случайной величины X, в роли весов в которой выступают вероятности этих реализаций, причем сумма весов равна единице:
M[X] = x1Р1 + x2Р2, + ... + xnРn = xkРk
Это - числовая характеристика (а не функция, на что указывают квадратные скобки) случайной величины X,что означает, что она соответствует всей величинеX,а не различным конкретным ее значениям.
Математическое ожидание непрерывной случайной величины определяется следующим образом:
Свойства математического ожидания:
М[с] = с;
М[Х+b] = М[Х] + b
М[аХ] = аМ[Х]
М[аХ+b] = аМ[Х] + b, -для любых чисел (констант)a,bиc.
Эти свойства вытекают из определения математического ожидания. Если Х и Y -случайные величины, то можно определить новые случайные величины(Х+ Y), (Х- Y), (X Y), X/Y, рассчитав вероятности принятия ими конкретных значений(х+у), {х-у), (х-у)иx/y.
Для любых случайных величин Х и Y М[Х+Y]= М[Х]+ М[Y].
Математическое ожидание (ожидаемое, или среднее, значение) часто рассчитывается при сравнении затрат и выгод действия со случайным исходом, например ожидаемого выигрыша в лотерее или ожидаемого дохода на акции или другие рисковые ценные бумаги.
Выборка
может рассматриваться как дискретная
случайная величина, принимающая
значения х1, х2...,
хnс вероятностями(если
некоторые значения хjсовпадают, то для расчета выборочного
среднего и других характеристик они
могут условно рассматриваться как
разные, что не меняет результата), то
есть
для
всех1
k
n. Обозначая
выборочное среднее какmn
,имеем
Нижний индекс ппоказывает объем выборки, для которой вычисляются выборочные характеристики.
Для разных конкретных выборок, соответствующих одной и той же генеральной совокупности, выборочные средние будут, вообще говоря, различны.