
- •1.Основные понятия теории вероятности.
- •2.Классическое определение вероятности.
- •3. Частота или статистическая вероятность.
- •4.Геометрическая вероятность. Задача о встрече.
- •5. Теоремы сложения вероятностей.
- •6. Теоремы умножения вероятностей.
- •Свойства условных вероятностей.
- •7. Формула полной вероятности.
- •8. Формула Бейеса.
- •9.Повторение испытаний. Частная теорема о повторении опыта.
- •10. Общая теорема о повторении опытов. Производящая функция.
- •11. Функция распределения случайной величины.
- •12. Плотность распределения.
- •13. Числовые характеристики случайных величин.
- •14.Неравенство Чебышева.
- •15. Теорема Чебышева.
- •16. Обобщенная теорема Чебышева и теорема Маркова.
- •17. Характеристические функции
- •18. Центральная предельная теорема.
- •19. Следствие из теоремы Ляпунова-теоремы Лапласа.
- •20. Свойства числовых характеристик(мат ожидание, дисперсия).
- •21.Нормальное распределение.
- •22. Правило «трех сигма».
- •23. Равномерное распределение
- •24. Закон Пуассона.
- •25. Функция одного случайного аргумента.
- •26. Функция двух случайных аргументов.
- •27. Закон распределения двумерной случайной величины.
- •28.Статистическое распределение выборки. Эмпирическая функция распределения. Полигон и гистограмма.
- •29. Числовые характеристики статистического распределения.
- •30. Критерии согласия(критерии Пирсона).
- •31. Функция распределения системы двух случайных величин
- •32. Плотность распределения системы двух случайных величин.
- •33. Условные законы распределения.
- •34. Зависимые и независимые случайные величины.
- •35. Метод наименьших квадратов.
35. Метод наименьших квадратов.
Метод наименьших квадратов (МНК) - метод оценки параметров модели на основании экспериментальных данных, содержащих случайные ошибки. В основе метода лежат следующие рассуждения: при замене точного (неизвестного) параметра модели приблизительным значением необходимо минимизировать разницу между экспериментальными данными и теоретическими (вычисленными при помощи предложенной модели). Это позволяет рассчитать параметры модели с помощью МНК с минимальной погрешностью.
Мерой разницы в методе наименьших квадратов служит сумма квадратов отклонений действительных (экспериментальных) значений от теоретических. Выбираются такие значения параметров модели, при которых сумма квадратов разностей будет наименьшей – отсюда название метода:
=
min
где Y – теоретическое значение измеряемой величины, y – экспериментальное.
При этом полученные с помощью МНК параметры модели являются наиболее вероятными.
Метод наименьших квадратов, а также его различные модификации (нелинейный МНК, взвешенный МНК и т.д.) широко используется в аналитической химии, в частности, при построении градуировочной модели. Как правило, предполагается линейная зависимость (параметры которой требуется установить) между аналитическим сигналом и содержанием определяемого вещества. В этом случае метод наименьших квадратов позволяет оптимизировать параметры градуировки (и получить наименьшую погрешность анализа), а сумма квадратов разностей теоретического и экспериментального значения аналитического сигнала является мерой погрешности градуировки и линейно связана с так называемой остаточной дисперсией (дисперсией адекватности модели)
К задачам 1-10.
В задачах 1-10 использованы различные формулы теории вероятности.
Теоремы сложения и умножения вероятностей.
Студент разыскивает нужную ему формулу в трех справочниках. Вероятность того, что формула содержится в первом, втором и в третьем справочнике соответственно равны 0,6; 0,7 и 0,8.найти вероятности того, что формула содержится:
а) только в первом справочнике;
б) только в одном справочнике;
в) не более чем в двух справочниках;
г) хотя бы в одном справочнике.
Решение.
а) обозначим события Аi- "нужная формула содержится в i-ом справочнике", В-"формула содержится только в первом справочнике".
Очевидно, , т.е. совместное осуществление трех событий состоит в том, что формула содержится в первом и не содержится во втором и в третьем справочнике. Учитывая, что события А1, А2 и А3 независимы, получим
б) пусть событие С-"формула содержится только в одном из трех справочников". Очевидно, событие С происходит , если формула содержится только в пером ли только во втором, или только в третьем справочнике.
в)
г) Е-"содержится хотя бы в одном справочнике". Проще найти вероятность события Е, если перейти к противоположному событию -"не содержится ни в одном справочнике".
Формулы полной вероятности и Байеса.
В торговую фирму поступили телевизоры от трех поставщиков:10% от первого, 40% от второго и 50% от третьего. Практика показала, что телевизоры , поступающие от первого , второго и третьего поставщиков, не потребуют ремонта в течении гарантийного срока , соответственно в 70%,90% и 80% случаев.
1) найти вероятность того, что поступивший в торговую фирму телевизор не потребует ремонта в течение гарантийного срока;
2) проданный телевизор не потребовал ремонта в течение гарантийного срока, от какого поставщика вероятнее всего поступил телевизор?.
Решение.
1) обозначим через А- " телевизор не потребует ремонта в течение гарантийного срока". Возможны следующие предположение (гипотезы) о поставщике поступившего в торговую фирму телевизора.
H1= "телевизор поступил от первого поставщика" ;
H2= "телевизор поступил от второго поставщика" ;
H3= "телевизор поступил от третьего поставщика" .
По условию Р(H1)=0.1; Р(H2)=0.4; Р(H3)=0.5
Условные вероятности того, что телевизор не потребует ремонта, если он поступил от поставщика: Р(А/H1)=0.7; Р(А/H2)=0.49; Р(А/H3)=0.8
По формуле полной вероятности : Р(А)= Р(H1) Р(А/H1)+ Р(H2) Р(А/H2)+ Р(H3) Р(А/H3)=
0,1*0,7+0,4*0,9+0,5*0,8=0,83.
2) найдем вероятности того, что телевизор не потребовал ремонта в течение гарантийного срока от первого, второго и третьего поставщиков.
По формуле Байеса:
Таким образом, наивероятнейшей будет гипотеза о том, что телевизор потупил от третьего поставщика.
Формула Бернулли.
В семье 5 детей. Найти вероятности того, что среди этих детей:
1) 4 мальчика;
2) не менее четырех мальчиков;
3) менее четырех мальчиков.
Вероятность рождения мальчика равна 0,51.
1). Вероятность рождения мальчика равна 0,51 , значит вероятность рождения девочки равна 0,49.
Используем формулу Бернулли
2)
3)
Формула Пуассона.
На факультете 730 студентов. Какова вероятность того, что
а) 1 сентября является днем рождения одновременно трех студентов факультета;
б) хотя бы у одного день рождения 1 сентября;
в) более трех человек имеют день рождения 1 сентября.
Решение.
а) Вероятность того, что день рождения студента будет 1 сентября p=1/365. Так как р - мало, а n- велико и то применима формула Пуассона.
б) Р{хотя бы один день рождения 1 сентября}= 1- P{ни одного дня рождения 1 сентября}= 1- = 1-0,1353=0,8647.
в) P{более трех дней рождения 1 сентября}= 1-P{не более трех дней рождения}= 1-( )=1-(0,1353+0,2707+0,2707+0,1805)=0,1428.
Локальная и интегральная теоремы Муавра-Лапласа.
Контрольную работу по теории вероятностей с первого раза успешно выполняют 50% студентов. Найти вероятность того, что из 100 студентов работу успешно выполнят а) 45 студентов; б) от 45 до 65 студентов.
Решение.
а) по условию р=0,5. Так как n велико (npq=100*0.5*0.5=25 9), то применим локальную теорему Лапласа.
б) .
К задачам 11-20.
Задана непрерывная случайная величина ? функцией распределения F(х). Требуется :
1) найти плотность распределения вероятностей f(x) ;
2) схематично построить графики функций f(x) и F(х);
3) найти математическое ожидание, дисперсию и среднеквадратическое отклонение случайной величины Х;
4) найти вероятность того, что Х примет значение из интервала ( ).
Решение.
1) плотность распределения случайной величины равна первой производной от функции распределения.
. Условие нормировки выполнено.
2)
3) Для нахождения математического ожидания используем формулу , где a,b начало и конец интервала, где определена плотность.
;
4)
.
Приложение. Для вычисления интегралов используем формулы.
К задачам 21-30.
Заданы математическое ожидание а=3 и среднее квадратичное отклонение =5 нормально распределенной случайной величины Х.
1. Написать плотность распределения вероятностей и схематично построить ее график.
2. Найти вероятность того, что х примет значение из интервала (2;10).
3. Найти вероятность того, что х примет значение превышающее 10.
4. Найти интервал симметричный относительно математическое ожидание, в котором с вероятностью =0,95 будут заключены значения величины х.
Решение.
1). Составим функцию плотности распределения случайной величины Х с параметрами а=3, =5 воспользовавшись формулой
. Построим схематически график функции . Обратим внимание на то, что нормальная кривая симметрична относительно прямой х=3 и имеет max в этой точке, равный , т.е. и две точки перегиба с ординатой
Построим график
2) Воспользуемся формулой:
Значения функций найдены по таблице приложений.
3)
4) Воспользуемся формулой . По условию вероятность попадания в интервал симметричный относительно математического ожидания . По таблице найдем t, при котором Ф(t)=0,475, t=2. значит . Таким образом, . Ответ х (-1;7).
К задачам 31-40.
Найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение =5, выборочная средняя и объем выборки n=25.
Решение.
Требуется найти доверительный интервал .
Все величины, кроме t, известны. Найдем t из соотношения Ф(t)=0,95/2=0,475. По таблице приложения находим t=1,96. Подставив , окончательно получим искомый доверительный интервал 12,04<a<15,96.
К задачам 41-50.
Отдел технического контроля проверил 200 партий одинаковых изделий и получил следующее эмпирическое распределение, частота ni - количество партий, содержащих xi нестандартных изделий .требуется при уровне значимости 0,05 проверить гипотезу о том, что число нестандартных изделий Х распределено по закону Пуассона.
xi 0 1 2 3 4
ni 116 56 22 4 2
Решение.
Найдем выборочную среднюю:
Примем в качестве оценки параметра распределения Пуассона выборочную среднюю =0,6. Следовательно, предполагаемый закон Пуассона имеет вид .
Положив i=0,1,2,3,4 найдем вероятности Piпоявления i нестандартных изделий в 200 партиях: , , , , .
Найдем теоретические частоты по формуле . Подставив в эту формулу значения вероятности, получим , , , , .
Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого составим расчетную таблицу. Объединим малочисленные частоты(4+2=6) и соответствующие им теоретические частоты (3,96+0,6=4,56).
1 2 3 4 5 6
i ni
ni-
(ni- )2
(ni- )2/
0 116 109.76 6.24 38.9376 0.3548
1 56 65.86 -9.86 97.2196 1.4762
2 22 19.76 2.24 5.0176 0.2539
3 6 4.56 1.44 2.0736 0.4547
200
Из расчетной таблицы находим наблюдаемое значение критерия Пирсона: 2,54.
По таблице критических точек распределения 2, по уровню значимости =0,05 и числу степеней свободы 2 находим критическую точку правосторонней критической области : 2кр(0,05;2)=6. так как 2набл< 2кр - нет оснований отвергнуть гипотезу о распределении случайной величины Х по закону Пуассона.
К задачам 51-60.
Найти выборочное уравнение прямой линии регрессии Y на Х по данным, приведенным в корреляционной таблице.
Y X ny
20 25 30 35 40
16 4 6 10
26 8 10 18
36 32 3 9 44
46 4 12 6 22
56 1 5 6
nx 4 14 46 16 20 N=100
Решение.
Составим корреляционную таблицу в условных вариантах, выбрав в качестве ложных нулей С1=30 и С2= 36 ( каждая из этих вариант расположена в середине соответствующего вариационного ряда).
v u nv
-2 -1 0 1 2
-2 4 6 10
-1 8 10 18
0 32 3 9 44
1 4 12 6 22
2 1 5 6
nu 4 14 46 16 20 N=100
Найдем
Найдем вспомогательные величины
Найдем
Составим расчетную таблицу.
Пояснения к составлению таблицы.
1). Произведение частоты nuv на варианту u записывают в правом верхнем углу клетки, содержащей значение частоты.
2). Складывают все числа, помещенные в правых верхних клеток одной строки, и их сумму помещают в клетку этой же строки "столбца U".
3). Наконец, умножают варианту v на U и полученное произведение записывают в соответствующую клетку " столбца vU".
4). Сложим все числа " столбца vU", получают сумму vU, которая равна искомой сумме . Например, для нашей таблицы искомая сумма =82.
Для контроля аналогичные вычисления производят по столбцам.
Найдем искомый выборочный коэффициент корреляции: . Найдем шаги h1 и h2 ( разности между любыми двумя соседними вариантами): h1=25-20=5; h2=26-16=10/
Подставив найденные величины , получим искомое уравнение прямой линии регрессии У на Х: