- •Вопросы для подготовки к экзамену по теории вероятностей и математической статистике
- •Факториал числа
- •Формулировка комбинаторных правил суммы и произведения. Четыре комбинаторных схемы выбора. Формулы для числа размещений и сочетаний в разных схемах выбора. Число перестановок.
- •Правило произведения
- •Перестановки
- •Размещения
- •Сочетания
- •3.Классическое, геометрическое и статистическое определения вероятности. Вывод свойств вероятности из определений. Ограниченность классических определений вероятности.
- •2) Устойчивость относительных частот появления а в различных сериях достаточно
- •4. Вероятностное пространство (ω, s, р). Аксиомы теории вероятностей и следствия из них. Описание конечного вероятностного пространства в аксиоматике Колмогорова.
- •Вероятностные пространства (в расширенном смысле и бесконечные)
- •5.Условная вероятность. Определение зависимых и независимых событий. Попарная незевисимость событий и независимость в совокупности.
- •Независимость событий
- •Независимость событий в совокупности
- •6.Теорема о вероятности суммы событий. Формула полной вероятности. Вероятность гипотез: постановка задачи. Формулы Байеса для вероятностей гипотез.
- •Формула Байеса (теорема гипотез).
- •7. Определение случайной величины. Закон распределения вероятностей случайной величины. Способы задания дискретной случайной величины. Дискретные случайные величины.
- •Закон распределения дискретной случайной величины
- •Дискретные случайные величины
- •8. Функция распределения случайной величины, ее свойства и график. Функция распределения.
- •9.Непрерывные случайные величины. Способы задания непрерывной случайной величины. Плотность вероятности и ее основные свойства.
- •10.Числовые характеристики дискретных и непрерывных случайных величин. Математическое ожидание случайной величины и его свойства. Дисперсия случайной величины и её свойства.
- •1. Параметры уравнения регрессии.
10.Числовые характеристики дискретных и непрерывных случайных величин. Математическое ожидание случайной величины и его свойства. Дисперсия случайной величины и её свойства.
Закон распределения (функция распределения и ряд распределения или плотность веро-ятности) полностью описывают поведение случайной величины. Но в ряде задач доста-точно знать некоторые числовые характеристики исследуемой величины (например, ее среднее значение и возможное отклонение от него), чтобы ответить на поставленный во-прос.
Рассмотрим основные числовые характеристики дискретных случайных величин.
Математическое ожидание.
Определение 7.1. Математическим ожиданием дискретной случайной величины называ-ется сумма произведений ее возможных значений на соответствующие им вероятности:
М(Х) = х1р1 + х2р2 + … + хпрп . (7.1)
Если число возможных значений случайной
величины бесконечно, то
,
если полученный ряд сходится абсолютно.
Замечание 1. Математическое ожидание называют иногда взвешенным средним, так как оно приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе опытов.
Замечание 2. Из определения математического ожидания следует, что его значение не меньше наименьшего возможного значения случайной величины и не больше наибольше-го.
Замечание 3. Математическое ожидание дискретной случайной величины есть неслучай-ная (постоянная) величина. В дальнейшем увидим, что это же справедливо и для непре-рывных случайных величин.
Свойства математического ожидания.
1) Математическое ожидание постоянной равно самой постоянной:
М(С) = С. (7.2)
Доказательство. Если рассматривать С как дискретную случайную величину, принимающую только одно значение С с вероятностью р = 1, то М(С) = С·1 = С.
2) Постоянный множитель можно выносит за знак математического ожидания:
М(СХ) = С М(Х). (7.3)
Доказательство. Если случайная величина Х задана рядом распределения
xi |
x1 |
x2 |
… |
xn |
pi |
p1 |
p2 |
… |
pn |
то ряд распределения для СХ имеет вид:
Сxi |
Сx1 |
Сx2 |
… |
Сxn |
pi |
p1 |
p2 |
… |
pn |
Тогда М(СХ) = Сх1р1 + Сх2р2 + … + Схпрп = С( х1р1 + х2р2 + … + хпрп) = СМ(Х).
Определение 7.2. Две случайные величины называются независимыми, если закон распределения одной из них не зависит от того, какие значения приняла другая. В противном случае случайные величины зависимы.
Определение 7.3. Назовем произведением независимых случайных величин Х и Y случайную величину XY, возможные значения которой равны произведениям всех возможных значений Х на все возможные значения Y, а соответствующие им вероят-ности равны произведениям вероятностей сомножителей.
3) Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий:
M(XY) = M(X)M(Y). (7.4)
4) Математическое ожидание суммы двух случайных величин ( зависимых или незави-симых ) равно сумме математических ожиданий слагаемых:
M (X + Y) = M (X) + M (Y). (7.5)
Дисперсия.
Для того, чтобы иметь представление о поведении случайной величины, недостаточно знать только ее математическое ожидание. Рассмотрим две случайные величины: Х и Y, заданные рядами распределения вида
|
0 |
100 |
||||||||
p |
0,5 |
0,5 |
Найдем М(Х) = 49·0,1 + 50·0,8 + 51·0,1 = 50, М(Y) = 0·0,5 + 100·0,5 = 50. Как видно, мате-матические ожидания обеих величин равны, но если для Х М(Х) хорошо описывает пове-дение случайной величины, являясь ее наиболее вероятным возможным значением (при-чем остальные значения ненамного отличаются от 50), то значения Y существенно отсто-ят от М(Y). Следовательно, наряду с математическим ожиданием желательно знать, на-сколько значения случайной величины отклоняются от него. Для характеристики этого показателя служит дисперсия.
Определение 7.5. Дисперсией (рассеянием) случайной величины называется математи-ческое ожидание квадрата ее отклонения от ее математического ожидания:
D(X) = M (X – M(X))². (7.6)
Теорема 7.1. D(X) = M(X ²) – M ²(X). (7.7)
Свойства дисперсии.
1) Дисперсия постоянной величины С равна нулю:
D (C) = 0. (7.8)
Доказательство. D(C) = M((C – M(C))²) = M((C – C)²) = M(0) = 0.
2) Постоянный множитель можно выносить за знак дисперсии, возведя его в квадрат:
D(CX) = C²D(X). (7.9)
Доказательство. D(CX) = M((CX – M(CX))²) = M((CX – CM(X))²) = M(C²(X – M(X))²) =
= C²D(X).
3) Дисперсия суммы двух независимых случайных величин равна сумме их дисперсий:
D(X + Y) = D(X) + D(Y). (7.10)
4) Дисперсия разности двух независимых случайных величин равна сумме их дисперсий:
D(X – Y) = D(X) + D(Y). (7.11)
Дисперсия дает среднее значение квадрата отклонения случайной величины от среднего; для оценки самого отклонения служит величина, называемая средним квадратическим отклонением.
Определение 7.6. Средним квадратическим отклонением σ случайной величины Х называется квадратный корень из дисперсии:
.
(7.12)
Числовые характеристики непрерывных случайных величин.
Распространим определения числовых характеристик случайных величин на непре-рывные случайные величины, для которых плотность распределения служит в некото-ром роде аналогом понятия вероятности.
Определение 7.7. Математическим ожиданием непрерывной случайной величины называется
(7.13)
Замечание 1. Общее определение дисперсии сохраняется для непрерывной случайной величины таким же, как и для дискретной (опр. 7.5), а формула для ее вычисления имеет вид:
(7.14)
Среднее квадратическое отклонение вычисляется по формуле (7.12).
Замечание 2. Если все возможные значения непрерывной случайной величины не выходят за пределы интервала [a, b], то интегралы в формулах (7.13) и (7.14) вычисля-ются в этих пределах.
Задача: Найти значения переменных x1...x4, при которых функция:
W = |
|
3 |
x1 |
+ |
3 |
x2 |
+ |
5 |
x3 |
принимает максимальное значение, при условии следующих ограничений :
|
|
|
|
2 |
x2 |
+ |
3 |
x3 |
+ |
|
x4 |
= |
|
8 |
|
(1) |
|
|
x1 |
+ |
|
x2 |
+ |
|
x3 |
|
|
|
= |
|
2 |
|
(2) |
|
2 |
x1 |
+ |
|
x2 |
- |
|
x3 |
+ |
|
x4 |
≤ |
|
4 |
|
(3) |
x1, x2, x3, x4 ≥ 0
Шаг:1 Избавимся от неравенства в ограничениях, введя в ограничение 3 неотрицательную переменную s1.
|
|
|
|
2 |
x2 |
+ |
3 |
x3 |
+ |
|
x4 |
|
|
|
= |
|
8 |
|
(1) |
|
|
x1 |
+ |
|
x2 |
+ |
|
x3 |
|
|
|
|
|
|
= |
|
2 |
|
(2) |
|
2 |
x1 |
+ |
|
x2 |
- |
|
x3 |
+ |
|
x4 |
+ |
|
s1 |
= |
|
4 |
|
(3) |
x1, x2, x3, x4, s1 ≥ 0 Шаг:2 Из последней системы ограничений можно выделить базисную переменную s1. Не все уравнения содержат базисные переменные , это значит, что исходная задача не содержит в себе допустимого базисного решения. Для его нахождения вначале составим и решим вспомогательную задачу. Такое решение еще называют решением с искусственным базисом. Введем в уравнения 1, 2 искусственные неотрицательные переменные u1, u2. Получим следующую систему ограничений,
|
|
|
|
2 |
x2 |
+ |
3 |
x3 |
+ |
|
x4 |
|
|
|
+ |
|
u1 |
|
|
|
= |
|
8 |
|
(1) |
|
|
x1 |
+ |
|
x2 |
+ |
|
x3 |
|
|
|
|
|
|
|
|
|
+ |
|
u2 |
= |
|
2 |
|
(2) |
|
2 |
x1 |
+ |
|
x2 |
- |
|
x3 |
+ |
|
x4 |
+ |
|
s1 |
|
|
|
|
|
|
= |
|
4 |
|
(3) |
x1, x2, x3, x4, s1, u1, u2 ≥ 0 с базисными переменными u1, u2,s1.
|
Целью решения вспомогательной задачи является получение допустимого базисного решения не содержащего искусственных переменных (u1, u2). Для этого сформируем вспомогательную целевую функцию :
G = |
|
u1 |
+ |
u2 |
Проведем ее минимизацию . Если после минимизации функции G ее оптимальное значение будет равно нулю и все искусственные переменные окажутся выведенными из базиса, то полученное базисное решение есть допустимое базисное решение исходной задачи. Если же после минимизации функции G ее оптимальное значение окажется отличным от нуля, значит исходная система ограничений противоречива (область допустимых решений пуста) и исходная задача решения не имеет. Для решения вспомогательной задачи симплекс-методом выразим функцию G через свободные переменные, для этого: - вычтем из функции G уравнение 1 - вычтем из функции G уравнение 2 Функция G примет вид :
G = |
- |
x1 |
- |
3 |
x2 |
- |
4 |
x3 |
- |
x4 |
+ |
10 |
|
Теперь мы можем сформировать начальную симплекс-таблицу. Шаг:3 Начальная симплекс-таблица
БП |
x1 |
x2 |
x3 |
x4 |
s1 |
u1 |
u2 |
Решение |
Отношение |
||||||||
u1 |
0 |
2 |
3 |
1 |
0 |
1 |
0 |
8 |
|
||||||||
u2 |
1 |
1 |
1 |
0 |
0 |
0 |
1 |
2 |
|
||||||||
s1 |
2 |
1 |
-1 |
1 |
1 |
0 |
0 |
4 |
-- |
||||||||
W |
3 |
3 |
5 |
0 |
0 |
0 |
0 |
0 |
-- |
||||||||
G |
-1 |
-3 |
-4 |
-1 |
0 |
0 |
0 |
-10 |
-- |
Итерация 1
БП |
x1 |
x2 |
x3 |
x4 |
s1 |
u1 |
Решение |
Отношение |
|||||
u1 |
-3 |
-1 |
0 |
1 |
0 |
1 |
2 |
|
|||||
x3 |
1 |
1 |
1 |
0 |
0 |
0 |
2 |
-- |
|||||
s1 |
3 |
2 |
0 |
1 |
1 |
0 |
6 |
|
|||||
W |
-2 |
-2 |
0 |
0 |
0 |
0 |
-10 |
-- |
|||||
G |
3 |
1 |
0 |
-1 |
0 |
0 |
-2 |
-- |
Итерация 1-a
БП |
x1 |
x2 |
x3 |
x4 |
s1 |
Решение |
Отношение |
x4 |
-3 |
-1 |
0 |
1 |
0 |
2 |
-- |
x3 |
1 |
1 |
1 |
0 |
0 |
2 |
-- |
s1 |
6 |
3 |
0 |
0 |
1 |
4 |
-- |
W |
-2 |
-2 |
0 |
0 |
0 |
-10 |
-- |
G |
0 |
0 |
0 |
0 |
0 |
0 |
-- |
Получено оптимальное решение вспомогательной задачи (найден минимум функции G т.к. в строке целевой функции нет отрицательных коэффициентов). Все искусственные переменные вышли из базиса и поэтому мы можем приступить к решению исходной задачи, приняв полученное базисное решение в качестве опорного. Сторка "G" нам больше не нужна, принятие решения о направляющем столбце, во всех последующих итерациях, будем принимать по строке "Q" Итерация 2
БП |
x1 |
x2 |
x3 |
x4 |
s1 |
Решение |
Отношение |
x4 |
-3 |
-1 |
0 |
1 |
0 |
2 |
-- |
x3 |
1 |
1 |
1 |
0 |
0 |
2 |
-- |
s1 |
6 |
3 |
0 |
0 |
1 |
4 |
-- |
Q |
-2 |
-2 |
0 |
0 |
0 |
-10 |
-- |
Достигнуто оптимальное решение, т.к. в строке целевой функции нет положительных коэффициентов. Ответ:
Оптимальное значение функции W(x)= |
10 |
достигается в точке с координатами:
x1= |
0 |
x2= |
0 |
x3= |
2 |
x4= |
2 |
s1= |
4 |
|
|
Наша симплекс-таблица представляет собой расширенную матрицу системы ограничений с некоторыми дополнительными столбцами и строками. Рассмотрим пример симплекс таблицы для следующей задачи: Найти значения переменных x1...x5, при которых функция:
Q = |
|
5 |
x1 |
+ |
7 |
x2 |
+ |
2 |
|
принимает максимальное значение, при условии следующих ограничений :
|
2 |
x1 |
+ |
4 |
x2 |
+ |
|
x3 |
|
|
|
|
|
|
= |
|
64 |
|
(1) |
|
|
x1 |
+ |
2 |
x2 |
|
|
|
+ |
|
x4 |
|
|
|
= |
|
70 |
|
(2) |
|
|
|
- |
|
x2 |
|
|
|
|
|
|
+ |
|
x5 |
= |
|
18 |
|
(3) |
x1, x2, x3, x4, x5 ≥ 0 Симплекс таблица имеет следующий вид:
БП |
x1 |
x2 |
x3 |
x4 |
x5 |
Решение |
Отношение |
|||||
x3 |
2 |
4 |
1 |
0 |
0 |
64 |
|
|||||
x4 |
1 |
2 |
0 |
1 |
0 |
70 |
|
|||||
x5 |
0 |
-1 |
0 |
0 |
1 |
18 |
-- |
|||||
Q |
5 |
7 |
0 |
0 |
0 |
-2 |
-- |
Самая верхняя строка - чисто информационная, в ней указывается назначение столбцов. Столбец "БП" также информационный, каждая клетка этого столбца содержит имя переменной, являющейся базисной в соответствующем уравнении системы ограничений. В нашем примере, в первом уравнении, базисной переменной является переменная X3, во втором X4, в третьем X5. Столбцы X1...X5 содержат коэффициенты при соответствующих переменных в уравнениях системы ограничений (каждому уравнению соответствует отдельная строка). В столбец "Решение" изначально записываются свободные члены соответствующих уравнений. Они же показывают значения базисных переменных для текущегого решения, отображаемого симплекс-таблицей, на некотором шаге (итерации) решения задачи. Коэффициенты целевой функции отражаются в симплекс-таблице в строке "Q", свободный член, как и в случае с уравнениями системы ограничений, изначально записывается в столбец "Решение". Он же одновременно является значением целевой функции, но записанный с противоположным знаком (это удобно для симплекс-метода). В нашем примере показанная симплекс-таблица соответствует некоторому решению при котором переменные X3, X4, X5 равны соответственно 64, 70, 18 (см. столбец "Решение"), а остальные перемнные равны нулю. Значение целевой функции "Q" при этом равно двум (что несложно проверить подставив значения переменных в выражение для целевой функции). В нашем примере свободный член равен -2 (минус два) т.к. в записи целевой функции он записан вместе с переменными по одну сторону от знака равенства, а свободные члены в уравнениях системы ограничений по другую. Поэтому перед записью в таблицу его необходимо перенести вправо от знака равенства. Строка "Q" в данном примере выделена желтым цветом, это значит, что по ней будет приниматься решение относительно выбора разрешающего столбца (иногда его называют направляющим). Разрешающий столбец соответствует переменной, которая будет введена в базис (в список базисных переменных) на следующей итерации решения задачи. Цель подобной замены базиса - улучшение значения целевой функции. Критерием выбора разрешающего столбца является максимальный положительный коэффициент в строке "Q", при решении задачи на максимум, или минимальный отрицательный, при решении задачи на минимум. Если после очередной итерации в строке не окажется положительных (при максимизации), или отрицательных (при минимизации) коэффициентов, то оптимальное решение достигнуто. В нашем примере разрешающий столбец выбран по коэффициенту 7 (максимальный положительный т.к. задача на максимум), он соответствует переменной X2, именно она будет введена в базис на следующей итерации. Числа стоящие в направляющем столбце окрашиваются красным цветом. Красным цветом также окрашивается и разрешающая (направляющая) строка, она соответствует переменной которая будет выведена из базиса (списка базисных переменных) на следующей итерации. Для ее определения рассчитывается и заполняется столбец "Отношение". Его элементы представляют собой отношения элементов столбца "Решение" к соответсвующим элементам направляющего столбца (кроме строки "Q"). Выбор разрешающей строки производится по минимальному значению из всех отношений. Важно то, что данные отношения рассчитываются только для положительных элементов направляющего столбца. Если на некоторой итерации в направляющем столбце положительных коэффициентов не окажется, то целевая функция исходной задачи неограничена, задача не имеет решения. В нашем примере направляющая строка выбрана по минимальному отношению 16, она соответствует базисной переменной X3, именно она будет выведена из базиса на следующей итерации (ее место займет X2).
Задание по эконометрике.
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Для оценки параметров α и β - используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
20a + 65 b = 40657166.78
65 a + 242.5 b = 81314523.47
Из первого уравнения выражаем а и подставим во второе уравнение
Получаем b = -1626280.59, a = 7318270.27
Уравнение регрессии:
y = -1626280.59 x + 7318270.27
