Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теорвер.doc
Скачиваний:
69
Добавлен:
22.05.2015
Размер:
1.48 Mб
Скачать

35. Метод наименьших квадратов.

Метод наименьших квадратов (МНК) - метод оценки параметров модели на основании экспериментальных данных, содержащих случайные ошибки. В основе метода лежат следующие рассуждения: при замене точного (неизвестного) параметра модели приблизительным значением необходимо минимизировать разницу между экспериментальными данными и теоретическими (вычисленными при помощи предложенной модели). Это позволяет рассчитать параметры модели с помощью МНК с минимальной погрешностью.

Мерой разницы в методе наименьших квадратов служит сумма квадратов отклонений действительных (экспериментальных) значений от теоретических. Выбираются такие значения параметров модели, при которых сумма квадратов разностей будет наименьшей – отсюда название метода:

= min

где Y – теоретическое значение измеряемой величины, y – экспериментальное.

При этом полученные с помощью МНК параметры модели являются наиболее вероятными.

Метод наименьших квадратов, а также его различные модификации (нелинейный МНК, взвешенный МНК и т.д.) широко используется в аналитической химии, в частности, при построении градуировочной модели. Как правило, предполагается линейная зависимость (параметры которой требуется установить) между аналитическим сигналом и содержанием определяемого вещества. В этом случае метод наименьших квадратов позволяет оптимизировать параметры градуировки (и получить наименьшую погрешность анализа), а сумма квадратов разностей теоретического и экспериментального значения аналитического сигнала является мерой погрешности градуировки и линейно связана с так называемой остаточной дисперсией (дисперсией адекватности модели)

К задачам 1-10.

В задачах 1-10 использованы различные формулы теории вероятности.

Теоремы сложения и умножения вероятностей.

Студент разыскивает нужную ему формулу в трех справочниках. Вероятность того, что формула содержится в первом, втором и в третьем справочнике соответственно равны 0,6; 0,7 и 0,8.найти вероятности того, что формула содержится:

а) только в первом справочнике;

б) только в одном справочнике;

в) не более чем в двух справочниках;

г) хотя бы в одном справочнике.

Решение.

а) обозначим события Аi- "нужная формула содержится в i-ом справочнике", В-"формула содержится только в первом справочнике".

Очевидно, , т.е. совместное осуществление трех событий состоит в том, что формула содержится в первом и не содержится во втором и в третьем справочнике. Учитывая, что события А1, А2 и А3 независимы, получим

б) пусть событие С-"формула содержится только в одном из трех справочников". Очевидно, событие С происходит , если формула содержится только в пером ли только во втором, или только в третьем справочнике.

в)

г) Е-"содержится хотя бы в одном справочнике". Проще найти вероятность события Е, если перейти к противоположному событию -"не содержится ни в одном справочнике".

Формулы полной вероятности и Байеса.

В торговую фирму поступили телевизоры от трех поставщиков:10% от первого, 40% от второго и 50% от третьего. Практика показала, что телевизоры , поступающие от первого , второго и третьего поставщиков, не потребуют ремонта в течении гарантийного срока , соответственно в 70%,90% и 80% случаев.

1) найти вероятность того, что поступивший в торговую фирму телевизор не потребует ремонта в течение гарантийного срока;

2) проданный телевизор не потребовал ремонта в течение гарантийного срока, от какого поставщика вероятнее всего поступил телевизор?.

Решение.

1) обозначим через А- " телевизор не потребует ремонта в течение гарантийного срока". Возможны следующие предположение (гипотезы) о поставщике поступившего в торговую фирму телевизора.

H1= "телевизор поступил от первого поставщика" ;

H2= "телевизор поступил от второго поставщика" ;

H3= "телевизор поступил от третьего поставщика" .

По условию Р(H1)=0.1; Р(H2)=0.4; Р(H3)=0.5

Условные вероятности того, что телевизор не потребует ремонта, если он поступил от поставщика: Р(А/H1)=0.7; Р(А/H2)=0.49; Р(А/H3)=0.8

По формуле полной вероятности : Р(А)= Р(H1) Р(А/H1)+ Р(H2) Р(А/H2)+ Р(H3) Р(А/H3)=

0,1*0,7+0,4*0,9+0,5*0,8=0,83.

2) найдем вероятности того, что телевизор не потребовал ремонта в течение гарантийного срока от первого, второго и третьего поставщиков.

По формуле Байеса:

Таким образом, наивероятнейшей будет гипотеза о том, что телевизор потупил от третьего поставщика.

Формула Бернулли.

В семье 5 детей. Найти вероятности того, что среди этих детей:

1) 4 мальчика;

2) не менее четырех мальчиков;

3) менее четырех мальчиков.

Вероятность рождения мальчика равна 0,51.

1). Вероятность рождения мальчика равна 0,51 , значит вероятность рождения девочки равна 0,49.

Используем формулу Бернулли

2)

3)

Формула Пуассона.

На факультете 730 студентов. Какова вероятность того, что

а) 1 сентября является днем рождения одновременно трех студентов факультета;

б) хотя бы у одного день рождения 1 сентября;

в) более трех человек имеют день рождения 1 сентября.

Решение.

а) Вероятность того, что день рождения студента будет 1 сентября p=1/365. Так как р - мало, а n- велико и то применима формула Пуассона.

б) Р{хотя бы один день рождения 1 сентября}= 1- P{ни одного дня рождения 1 сентября}= 1- = 1-0,1353=0,8647.

в) P{более трех дней рождения 1 сентября}= 1-P{не более трех дней рождения}= 1-( )=1-(0,1353+0,2707+0,2707+0,1805)=0,1428.

Локальная и интегральная теоремы Муавра-Лапласа.

Контрольную работу по теории вероятностей с первого раза успешно выполняют 50% студентов. Найти вероятность того, что из 100 студентов работу успешно выполнят а) 45 студентов; б) от 45 до 65 студентов.

Решение.

а) по условию р=0,5. Так как n велико (npq=100*0.5*0.5=25 9), то применим локальную теорему Лапласа.

б) .

К задачам 11-20.

Задана непрерывная случайная величина ? функцией распределения F(х). Требуется :

1) найти плотность распределения вероятностей f(x) ;

2) схематично построить графики функций f(x) и F(х);

3) найти математическое ожидание, дисперсию и среднеквадратическое отклонение случайной величины Х;

4) найти вероятность того, что Х примет значение из интервала ( ).

Решение.

1) плотность распределения случайной величины равна первой производной от функции распределения.

. Условие нормировки выполнено.

2)

3) Для нахождения математического ожидания используем формулу , где a,b начало и конец интервала, где определена плотность.

;

4)

.

Приложение. Для вычисления интегралов используем формулы.

К задачам 21-30.

Заданы математическое ожидание а=3 и среднее квадратичное отклонение =5 нормально распределенной случайной величины Х.

1. Написать плотность распределения вероятностей и схематично построить ее график.

2. Найти вероятность того, что х примет значение из интервала (2;10).

3. Найти вероятность того, что х примет значение превышающее 10.

4. Найти интервал симметричный относительно математическое ожидание, в котором с вероятностью =0,95 будут заключены значения величины х.

Решение.

1). Составим функцию плотности распределения случайной величины Х с параметрами а=3, =5 воспользовавшись формулой

. Построим схематически график функции . Обратим внимание на то, что нормальная кривая симметрична относительно прямой х=3 и имеет max в этой точке, равный , т.е. и две точки перегиба с ординатой

Построим график

2) Воспользуемся формулой:

Значения функций найдены по таблице приложений.

3)

4) Воспользуемся формулой . По условию вероятность попадания в интервал симметричный относительно математического ожидания . По таблице найдем t, при котором Ф(t)=0,475, t=2. значит . Таким образом, . Ответ х (-1;7).

К задачам 31-40.

Найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение =5, выборочная средняя и объем выборки n=25.

Решение.

Требуется найти доверительный интервал .

Все величины, кроме t, известны. Найдем t из соотношения Ф(t)=0,95/2=0,475. По таблице приложения находим t=1,96. Подставив , окончательно получим искомый доверительный интервал 12,04<a<15,96.

К задачам 41-50.

Отдел технического контроля проверил 200 партий одинаковых изделий и получил следующее эмпирическое распределение, частота ni - количество партий, содержащих xi нестандартных изделий .требуется при уровне значимости 0,05 проверить гипотезу о том, что число нестандартных изделий Х распределено по закону Пуассона.

xi 0 1 2 3 4

ni 116 56 22 4 2

Решение.

Найдем выборочную среднюю:

Примем в качестве оценки параметра распределения Пуассона выборочную среднюю =0,6. Следовательно, предполагаемый закон Пуассона имеет вид .

Положив i=0,1,2,3,4 найдем вероятности Piпоявления i нестандартных изделий в 200 партиях: , , , , .

Найдем теоретические частоты по формуле . Подставив в эту формулу значения вероятности, получим , , , , .

Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого составим расчетную таблицу. Объединим малочисленные частоты(4+2=6) и соответствующие им теоретические частоты (3,96+0,6=4,56).

1 2 3 4 5 6

i ni

ni-

(ni- )2

(ni- )2/

0 116 109.76 6.24 38.9376 0.3548

1 56 65.86 -9.86 97.2196 1.4762

2 22 19.76 2.24 5.0176 0.2539

3 6 4.56 1.44 2.0736 0.4547

200

Из расчетной таблицы находим наблюдаемое значение критерия Пирсона: 2,54.

По таблице критических точек распределения 2, по уровню значимости =0,05 и числу степеней свободы 2 находим критическую точку правосторонней критической области : 2кр(0,05;2)=6. так как 2набл< 2кр - нет оснований отвергнуть гипотезу о распределении случайной величины Х по закону Пуассона.

К задачам 51-60.

Найти выборочное уравнение прямой линии регрессии Y на Х по данным, приведенным в корреляционной таблице.

Y X ny

20 25 30 35 40

16 4 6 10

26 8 10 18

36 32 3 9 44

46 4 12 6 22

56 1 5 6

nx 4 14 46 16 20 N=100

Решение.

Составим корреляционную таблицу в условных вариантах, выбрав в качестве ложных нулей С1=30 и С2= 36 ( каждая из этих вариант расположена в середине соответствующего вариационного ряда).

v u nv

-2 -1 0 1 2

-2 4 6 10

-1 8 10 18

0 32 3 9 44

1 4 12 6 22

2 1 5 6

nu 4 14 46 16 20 N=100

Найдем

Найдем вспомогательные величины

Найдем

Составим расчетную таблицу.

Пояснения к составлению таблицы.

1). Произведение частоты nuv на варианту u записывают в правом верхнем углу клетки, содержащей значение частоты.

2). Складывают все числа, помещенные в правых верхних клеток одной строки, и их сумму помещают в клетку этой же строки "столбца U".

3). Наконец, умножают варианту v на U и полученное произведение записывают в соответствующую клетку " столбца vU".

4). Сложим все числа " столбца vU", получают сумму vU, которая равна искомой сумме . Например, для нашей таблицы искомая сумма =82.

Для контроля аналогичные вычисления производят по столбцам.

Найдем искомый выборочный коэффициент корреляции: . Найдем шаги h1 и h2 ( разности между любыми двумя соседними вариантами): h1=25-20=5; h2=26-16=10/

Подставив найденные величины , получим искомое уравнение прямой линии регрессии У на Х: