Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Семинар №3.docx
Скачиваний:
4
Добавлен:
13.11.2019
Размер:
647.61 Кб
Скачать

§2. Биномиальное распределение

Следующая задача касается независимых многократных действий, которые могут привести либо к “успеху”, либо к “неудаче” с постоянной вероятностью. Биномиальное распределение описывает один аспект этой задачи — оценку вероятности заданного числа успехов.

Предположим, что правильная монета (симметричный и однородный предмет) подбрасывается пять раз подряд. Пять бросков образую пять испытаний.

Независимые испытания, которые могут выражаться в одной из двух возможностей с постоянной вероятностью, называются испытаниями Бернулли или биномиальными испытаниями.

Приведем общую формулу для подсчета вероятности P(m) получения m удач в n биноминальных испытаниях:

, (6)

где p — вероятность “успеха” при одном испытании, q = 1 p — вероятность “неудачи”, m = 0,1,2,…,n.

Итак, биномиальные испытания — это испытания только с двумя возможными результатами: “да” или “нет”, “удача” или “неудача”, “герб” или “цифра” и т.д.

Задача №5. Построить биномиальное распределение для двух групп параметров: n = 8, p = q = ½; n = 15, p = 0,7; q =0,3.

Построим данное биномиальное распределение средствами MATLAB. На листинге №5 приведена искомая программа.

%Листинг №5

clear all

%Определяем массив числа удач

%x = 0:8;

x=0:15;

%Находим вероятности каждого числа удач

%y = binopdf(x,8,0.5);

y = binopdf(x,15,0.7);

%Рисуем график зависимости вероятности от числа удач

plot(x,y,'*')

Программу листинга необходимо запустить два раза для двух групп параметров. На рис.3 приведен итог в виде двух графиков (рис.3,а,б) биномиального распределения для двух групп параметров.

Рис.3,а. Биномиальное распределение при n  = 8, p = q = ½

Рис.3,б. Биномиальное распределение при n  = 15, p = 0,7; q =0,3

§3. Идея метода проверки статистических гипотез

Биномиальное распределение служит хорошим примером общего типа рассуждения, используемого при проверке различного рода статистических гипотез. Предположим, что статистик подбросил монету 10 раз и получил 9 “гербов”. Он подозревает, что монета не является правильной. Он представляет свое доказательство следующим образом.

  1. Формулируем гипотезу: временно допустим, что вероятность “гербов” для этой монеты равна 1/2.

  2. Если вероятность появления “гербов” равна 1/2, то какова вероятность наблюдения события, в котором выпало 9 “гербов”, или когда достигается предел возможного — 10 “гербов”? Итоговый ответ представлен следующей формулой: .

  3. Если эта монета правильная, то наблюдалось событие, которое чрезвычайно неправдоподобно (порядка 1 шанса из 100). Если эта монета имеет “склонность” к “орлам”, то событие, которое наблюдалось, оказалось бы более вероятным.

  4. Например, если вероятность “орлов” для этой конкретной монеты в действительности составляла 8/10, то вероятность получить 9 или 10 “орлов” в 10 испытаниях была бы: ; что значительно больше предыдущей вероятности, равной 0,01.

  5. В соответствии с полученными оценками оказывается, что очень неправдоподобно, чтобы эта монета была правильной. Поэтому исходная гипотеза отвергается и признается, что монета имеет “склонность” к “гербам”.

Логика экспериментатора в статистическом анализе часто следует приведенному выше образцу. Статистик выдвигает гипотезу о том, что определенные черты модели эксперимента характеризуются определенными величинами (например, вероятность появления “герба” равна 0,5). Он временно принимает ее для того, чтобы узнать, к чему она приведет. Затем экспериментатор выполняет наблюдения (например, подбрасывает монету 10 или 20 раз), после чего вычисляет вероятность полученного результата наблюдения при условии справедливости первоначально принятой гипотезы. Если эта вероятности очень мала (например, меньше 0,05; 0,01; или 0,001) справедливость гипотезы подвергается сомнению и выдвигается другая гипотеза (например, монета имеет смещенный центр тяжести). Этот процесс и называется “проверкой статистической гипотезы”.

Задача №6. Разыграть методом Монте-Карло процедуру выбрасывания монеты 10 раз и определить номер эксперимента, когда появится событие: “при 10 бросаниях монеты выпало 9 “гербов”.

Искомая программа приведена на листинге №6.

%Листинг №6

clear all

%Определяем номер эксперимента, в

%котором монета выбрасывается 10 раз

N=0;

%Определяем переменную числа гербов после 10

%вырасываний монеты

s=0;

%Включаем цикл, работающий до тех пор, пока не выпадет 9

%гербов в 10 бросаниях монеты

while s~=9

%Определяем случайный набор из 1 и 2

x=randi(2,1,10);

%Ставим в соответствие 1 гербу, 2 цифре

for i=1:10

if x(i)==1

y(i)='Г';

else

y(i)='Ц';

end

end

%Находим число гербов в серии из 10 бросаний

s=sum((x==1));

%Определяем номер эксперимента

N=N+1

%Выводим результат выбрасывания монеты 10 раз

disp(y)

end

Каждый запуск программы листинга №6 осуществляет искомое моделирование результатов 10 выбрасываний монеты до тех пор, пока в эксперименте не окажется 9 “гербов”.

В таблице №2 приведен результат. В таблице №2 параметр N описывает номер эксперимента, в котором при выбрасывании монеты 10 раз появляется 9 “гербов”. Полученная в отдельном эксперименте конфигурация приводится в последней строке таблицы №2.

В таблице №2 собраны результаты 6 запусков программы листинга №6. Из таблицы №2 хорошо видно, что номер эксперимента, в котором выпало 9 “гербов” при 10 бросаниях является случайной величиной, которая варьируется в весьма широком диапазоне.

Таблица №2. Результаты моделирования эксперимента по выбрасыванию монеты 10 раз вплоть до появления 9 “гербов”

N

185

77

85

7

65

336

Конфигурация

ГГГГГГГГГЦ

ГГГЦГГГГГГ

ГГГГЦГГГГГ

ГГГГЦГГГГГ

ЦГГГГГГГГГ

ГГЦГГГГГГГ

Рассмотрим еще один пример, который также можно отнести к теме проверки статистических гипотез. Вернемся к примеру №1 лекции №2, в котором оценивалась вероятность отказа тормозной системы в автомобиле на гарантийном сроке 3 года. В том примере мы оценили максимальное число нажатий педали тормоза в течение 3 лет в количестве 105. Вероятность отказа тормозной системы оценили числом 10–6.

Задача №7. Пусть учитываются K автомобилистов. Подсчитать долю s автомобилистов, у которых отказали тормоза. Считать, что автомобилист в течение гарантийного срока 3 года нажимает педаль тормоза N = 105 раз. Положить, что вероятность отказа тормозной системы p = 10–6.

Для решения данной задачи воспользуемся методом Монте-Карло. Искомая программа приведена на листинге №7.

%Листинг №7

clear all

%Определяем количество автомобилистов с

%данной тормозной системой

K=10^3;

%Определяем число нажатий педали в течение

%гарантийного срока автомобиля

N=10^5;

%Определяем вероятность отказа тормозной системы

p=1e-7; %1e-6

%Генерируем вектор-строку с количеством отказов

%тормозной системы в течение гарантийного числа нажатий

%педали тормоза

R=binornd(N,p,[1,K]);

%Определяем переменную числа отказов тормозной системы в

%тчение гарантийного срока

s=0;

%Включаем цикл подсчета доли автомобилистов, у которых

%отказала тормозная система

for i=1:K

if R(i)>0

s=s+1;

%Выводим номер автомобилиста и количество отказов

%тормозной системы у его автомобиля

disp([i R(i)])

end

end

%Выводим частоту отказа тормозов у К автомобилистов

p=s/K

Отметим, что число отказов тормозной системы вычислялось с помощью датчика случайных чисел, распределенных по биномиальному закону. Данный датчик binornd(N,p) возвращает число отказов в N испытаниях.

Оказалось, что, если вероятность отказа p = 10–6, то доля из K = 1000 автомобилистов, у которых отказали тормоза, варьируется после 10 запусков программы листинга №7 в пределах [0,087;0,111].

Понизим вероятность отказа тормозной системы в 10 раз, т.е. положим p = 10–7. В этом случае оказалось, что, если вероятность отказа p = 10–7, то доля из 1000 автомобилистов, у которых отказали тормоза, варьируется после 10 запусков программы листинга №7 в пределах [0,008;0,014], т.е. приблизительно в десять раз меньше, чем в предыдущем случае.