![](/user_photo/2706_HbeT2.jpg)
Стеграммы лекций 6-10 и 13
.pdfЗадача 7.2. В качестве нулевой гипотезы примем утверждение, что посещаемость студентами лекций – постоянная величина. Тогда необходимо решить задачу о проверке нулевой гипотезы на соответствие фактическим данным. Воспользуемся для этого критерием 2 , описанным в лекции №7.
№ |
Студентов |
Среднее |
k |
|
лекции |
||||
|
|
|
||
1 |
42 |
44,1667 |
0,1063 |
|
|
|
|
|
|
2 |
46 |
44,1667 |
0,0761 |
|
|
|
|
|
|
3 |
44 |
44,1667 |
0,0006 |
|
|
|
|
|
|
4 |
43 |
44,1667 |
0,0308 |
|
|
|
|
|
|
5 |
47 |
44,1667 |
0,1818 |
|
|
|
|
|
|
6 |
43 |
44,1667 |
0,0308 |
|
|
|
|
|
|
|
|
|
|
|
% |
0,9201 |
|
0,4264 |
Таким образом, суммарная величина статистики критерия равна 0, 4264 . Вероятность того, что 2 -распределенная случайная величина примет значение, больше либо равное , равна ХИ 2РАСП 0, 4264;5 0,9946 . Таким образом, с доверительной вероятностью p 1 0,9946 0, 0054 можно считать посещаемость студентами лекций постоянной величиной.
Задача 8.1. Всего имеется 10000 различных кодов, доступных для присвоения студентам. Если считать, что телефонные номера (как минимум, в последних своих четырех цифрах) распределяются равномерно и независимо, то вероятности студенту получить код каждого вида одинаковы и равны 110000 .
Найдем вероятность того, что у всех студентов коды будут различными. Для этого перенумеруем 48 студентов в произвольном порядке. Шанс первому студенту получить код, не совпадающий с уже полученными кодами, равен 1. У второго студента выбор меньше ровно на один код, поэтому вероятность ему получить код, не совпадающий с кодом первого студента, равна 1 110000 , третьему студенту: 1 2
10000 и т.д. Полная вероятность дастся произведением отдельных вероятностей, поскольку распределение мы считаем независимым:
|
|
1 |
|
|
2 |
|
|
48 1 |
|
10000! |
|
|
|||||
1 1 |
|
|
|
1 |
|
|
|
... 1 |
|
|
|
|
|
|
|
|
89% |
|
|
|
48 |
10000 |
|
||||||||||||
|
|
10000 |
|
|
10000 |
|
|
10000 |
|
10000 |
48 ! |
Следовательно, вероятность того, что у двух и более студентов четырехзначные коды совпадут, равна примерно 11%.
Задача 9.1. Функция правдоподобия для выборки x1,..., xN из N значений нормально распределенной случайной величины равна
![](/html/2706/30/html_Vd3riPhwDG.ePqy/htmlconvd-Em509p62x1.jpg)
|
|
|
|
|
|
x1 m 2 |
|
|
|
|
xN m 2 |
N |
|
||||
|
|
1 |
|
|
|
1 |
|
|
|
xi m 2 |
2D |
||||||
L |
|
|
e |
|
2 D ... |
|
|
|
e |
|
2 D |
2 D N 2 e i 1 |
, |
||||
|
|
|
|
|
|
|
|
|
|||||||||
2 D |
|
2 D |
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
N |
|
|
|
|
|
|
1 |
N |
|
|
|
|
|
|
|
|
ln L |
ln 2 D |
xi m 2 |
|
||||||||
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
2D i 1 |
|
Оценки максимального правдоподобия являются корнями уравнений системы:
ln L |
|
1 |
N |
||||
|
m |
|
|
|
|||
|
|||||||
|
|
D i 1 |
|||||
|
ln L |
|
|
N 1 |
|||
|
|
||||||
|
D |
|
|
|
|||
2 D |
|||||||
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
N |
|
|
xi m 0 |
|
|
|
|
|
xi |
|
||||
|
|
|
m |
|
i 1 |
|
|
||||
|
|
|
|
N |
|
||||||
|
|
|
|
|
|
|
|
|
|
||
|
1 |
|
N |
|
|
|
|
|
N |
|
|
|
|
|
2 |
|
|
|
2 |
||||
|
|
xi |
m |
0 |
|
xi m |
|||||
|
2 |
|
|
|
|
||||||
|
2D i 1 |
|
|
|
|
i 1 |
|
||||
|
|
|
|
D |
|
||||||
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
N |
|
Таким образом, оценка дисперсии получилась смещенной. При использовании несмещенной оценки дисперсии логарифм функции правдоподобия изменится на величину
|
|
ln Lmax |
ln L |
|
N |
|
|
|
1 |
|
|
1 |
|
||||||
|
|
|
|
|
ln |
1 |
|
|
|
|
|||||||||
|
|
2 |
|
2 |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
N |
|
|
|||||
|
|
|
1 |
|
1 |
|
1 |
|
|
|
|
|
|
|
1 |
|
|
||
Если |
N 1, то |
ln 1 |
|
|
|
|
|
|
|
и |
|
|
|
|
. Следовательно, функция |
||||
|
|
|
2 |
|
|
|
|
||||||||||||
|
|
|
N |
|
N |
|
2N |
|
|
|
|
|
|
|
4N |
|
|
||
правдоподобия изменится в e e1 4 N |
раз, или примерно на 1 4N . |
Задача 10.10. Среднее количество сухариков, которое положила буфетчица Антонина студентам в обед, равно 370/23 при ожидаемом среднем 15.
|
|
|
|
|
|
|
|
|
|
|
Среднеквадратичное |
отклонение среднего |
количества сухариков равно |
3 23 . Таким |
|||||||
образом, статистика |
t |
370 |
23 |
15 |
1, 74 |
и распределена нормально, |
поскольку по |
|||
|
|
|
|
|||||||
|
|
|
||||||||
|
3 |
23 |
|
|
|
|
|
|
условию задачи точно известны и математическое ожидание, и дисперсия количества сухариков в супе. Нормально распределенная случайная величина с нулевым математическим ожиданием и единичной дисперсией принимает значения, не превышающие 1,74 с вероятностью НОРМСТРАСП 1,74 0,9589 . Следовательно, с
доверительной вероятностью p 1 0,9589 0, 0411 добросердечная буфетчица Антонина в среднем кладет больше сухариков студентам в обед.
Контрольные вопросы
1.В чем заключается аксиоматика Колмогорова в теории вероятностей?
2.Условные вероятности. Априорные и апостериорные вероятности.
3.Как статистические погрешности зависят от объема наблюдений?
4.Непрерывные и дискретные случайные величины. Функция распределения.
5.Распределения Бернулли, биномиальное, Пуассона, нормальное, «хи-квадрат», Стьюдента и Фишера–Снедекора.
6.Что такое гипотеза? Какова общая схема проверки статистической гипотезы?
7.Ошибки 1-го и 2-го рода. Доверительная вероятность.
8.Определение достоверности различия частоты и вероятности.
9.Расчет доверительных границ к вероятности.
10.Критерий «хи-квадрат», его преимущества и недостатки. Условия применимости.
11.Что такое параметр случайной величины? Перечислите известные вам параметры.
12.Математическое ожидание и его свойства.
13.Дисперсия, среднеквадратичное отклонение и их свойства.
14.Классификация переменных. Для каких переменных можно рассчитывать параметры, а для каких нельзя?
15.Что такое точечная оценка? Приведите примеры точечных оценок.
16.Несмещенные, состоятельные и эффективные оценки. Робастность.
17.Несмещенные оценки математического ожидания и дисперсии.
18.Метод наибольшего правдоподобия, его преимущества и недостатки.
19.Критерий Колмогорова–Смирнова.
20.Сформулируйте центральную предельную теорему. Для чего она используется? Каковы способы проверки ее применимости?
21.Определение достоверности различия дисперсий.
22.Расчет доверительных границ к дисперсии.
23.Определение достоверности различия средних.
24.Критерий Стьюдента.
25.Расчет доверительных границ к математическому ожиданию.
26.Коэффициенты ковариации и детерминации. Коэффициент корреляции, его свойства и недостатки. Линеаризация данных.
27.Проверка достоверности отличия коэффициента корреляции от нуля.
28.Метод наименьших квадратов.
29.Проверка гипотезы о линейности данных.
Рекомендуемая литература
1.Герасимов А.Н. Медицинская статистика: Учебное пособие. – М.: ООО
«Медицинское информационное агентство», 2007. – 480 с.
2.Яворский В.А. Планирование научного эксперимента и обработка экспериментальных данных: Методические указания к лабораторным работам. – М.:
МФТИ, 2006. – 44 с.
3.Чистяков В.П. Курс теории вероятностей: учебник для вузов. – 7-е изд., испр. и доп.
– М.: Дрофа, 2007. – 253с.
4.Феллер В. Введение в теорию вероятностей и ее приложения, в 2 тт. Пер. с англ. / Предисл. А.Н. Колмогорова. Изд. 2-е. – М.: Книжный дом «ЛИБРОКОМ», 2010. – 528 с., 752 с.
5.Ивченко Г.И., Медведев Ю.И., Чистяков А.В. Задачи с решениями по математической статистике: учеб. пособие для вузов. – 2-е изд., испр. и доп. – М.:
Дрофа, 2007. – 318 с.
6.Лагутин М.Б. Наглядная математическая статистика: Учебное пособие. – М.: БИНОМ. Лаборатория знаний, 2007. – 472 с.