Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Стеграммы лекций 6-10 и 13

.pdf
Скачиваний:
12
Добавлен:
03.06.2015
Размер:
1.21 Mб
Скачать

Задача 7.2. В качестве нулевой гипотезы примем утверждение, что посещаемость студентами лекций – постоянная величина. Тогда необходимо решить задачу о проверке нулевой гипотезы на соответствие фактическим данным. Воспользуемся для этого критерием 2 , описанным в лекции №7.

Студентов

Среднее

k

лекции

 

 

 

1

42

44,1667

0,1063

 

 

 

 

2

46

44,1667

0,0761

 

 

 

 

3

44

44,1667

0,0006

 

 

 

 

4

43

44,1667

0,0308

 

 

 

 

5

47

44,1667

0,1818

 

 

 

 

6

43

44,1667

0,0308

 

 

 

 

 

 

 

 

%

0,9201

 

0,4264

Таким образом, суммарная величина статистики критерия равна 0, 4264 . Вероятность того, что 2 -распределенная случайная величина примет значение, больше либо равное , равна ХИ 2РАСП 0, 4264;5 0,9946 . Таким образом, с доверительной вероятностью p 1 0,9946 0, 0054 можно считать посещаемость студентами лекций постоянной величиной.

Задача 8.1. Всего имеется 10000 различных кодов, доступных для присвоения студентам. Если считать, что телефонные номера (как минимум, в последних своих четырех цифрах) распределяются равномерно и независимо, то вероятности студенту получить код каждого вида одинаковы и равны 110000 .

Найдем вероятность того, что у всех студентов коды будут различными. Для этого перенумеруем 48 студентов в произвольном порядке. Шанс первому студенту получить код, не совпадающий с уже полученными кодами, равен 1. У второго студента выбор меньше ровно на один код, поэтому вероятность ему получить код, не совпадающий с кодом первого студента, равна 1 110000 , третьему студенту: 1 210000 и т.д. Полная вероятность дастся произведением отдельных вероятностей, поскольку распределение мы считаем независимым:

 

 

1

 

 

2

 

 

48 1

 

10000!

 

 

1 1

 

 

 

1

 

 

 

... 1

 

 

 

 

 

 

 

 

89%

 

 

 

48

10000

 

 

 

10000

 

 

10000

 

 

10000

 

10000

48 !

Следовательно, вероятность того, что у двух и более студентов четырехзначные коды совпадут, равна примерно 11%.

Задача 9.1. Функция правдоподобия для выборки x1,..., xN из N значений нормально распределенной случайной величины равна

 

 

 

 

 

 

x1 m 2

 

 

 

 

xN m 2

N

 

 

 

1

 

 

 

1

 

 

 

xi m 2

2D

L

 

 

e

 

2 D ...

 

 

 

e

 

2 D

2 D N 2 e i 1

,

 

 

 

 

 

 

 

 

 

2 D

 

2 D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

1

N

 

 

 

 

 

 

 

ln L

ln 2 D

xi m 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

2D i 1

 

Оценки максимального правдоподобия являются корнями уравнений системы:

ln L

 

1

N

 

m

 

 

 

 

 

 

D i 1

 

ln L

 

 

N 1

 

 

 

D

 

 

 

2 D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

xi m 0

 

 

 

 

 

xi

 

 

 

 

m

 

i 1

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

1

 

N

 

 

 

 

 

N

 

 

 

 

2

 

 

 

2

 

 

xi

m

0

 

xi m

 

2

 

 

 

 

 

2D i 1

 

 

 

 

i 1

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

Таким образом, оценка дисперсии получилась смещенной. При использовании несмещенной оценки дисперсии логарифм функции правдоподобия изменится на величину

 

 

ln Lmax

ln L

 

N

 

 

 

1

 

 

1

 

 

 

 

 

 

ln

1

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

1

 

1

 

1

 

 

 

 

 

 

 

1

 

 

Если

N 1, то

ln 1

 

 

 

 

 

 

 

и

 

 

 

 

. Следовательно, функция

 

 

 

2

 

 

 

 

 

 

 

N

 

N

 

2N

 

 

 

 

 

 

 

4N

 

 

правдоподобия изменится в e e1 4 N

раз, или примерно на 1 4N .

Задача 10.10. Среднее количество сухариков, которое положила буфетчица Антонина студентам в обед, равно 370/23 при ожидаемом среднем 15.

 

 

 

 

 

 

 

 

 

 

 

Среднеквадратичное

отклонение среднего

количества сухариков равно

3 23 . Таким

образом, статистика

t

370

23

15

1, 74

и распределена нормально,

поскольку по

 

 

 

 

 

 

 

 

3

23

 

 

 

 

 

 

условию задачи точно известны и математическое ожидание, и дисперсия количества сухариков в супе. Нормально распределенная случайная величина с нулевым математическим ожиданием и единичной дисперсией принимает значения, не превышающие 1,74 с вероятностью НОРМСТРАСП 1,74 0,9589 . Следовательно, с

доверительной вероятностью p 1 0,9589 0, 0411 добросердечная буфетчица Антонина в среднем кладет больше сухариков студентам в обед.

Контрольные вопросы

1.В чем заключается аксиоматика Колмогорова в теории вероятностей?

2.Условные вероятности. Априорные и апостериорные вероятности.

3.Как статистические погрешности зависят от объема наблюдений?

4.Непрерывные и дискретные случайные величины. Функция распределения.

5.Распределения Бернулли, биномиальное, Пуассона, нормальное, «хи-квадрат», Стьюдента и Фишера–Снедекора.

6.Что такое гипотеза? Какова общая схема проверки статистической гипотезы?

7.Ошибки 1-го и 2-го рода. Доверительная вероятность.

8.Определение достоверности различия частоты и вероятности.

9.Расчет доверительных границ к вероятности.

10.Критерий «хи-квадрат», его преимущества и недостатки. Условия применимости.

11.Что такое параметр случайной величины? Перечислите известные вам параметры.

12.Математическое ожидание и его свойства.

13.Дисперсия, среднеквадратичное отклонение и их свойства.

14.Классификация переменных. Для каких переменных можно рассчитывать параметры, а для каких нельзя?

15.Что такое точечная оценка? Приведите примеры точечных оценок.

16.Несмещенные, состоятельные и эффективные оценки. Робастность.

17.Несмещенные оценки математического ожидания и дисперсии.

18.Метод наибольшего правдоподобия, его преимущества и недостатки.

19.Критерий Колмогорова–Смирнова.

20.Сформулируйте центральную предельную теорему. Для чего она используется? Каковы способы проверки ее применимости?

21.Определение достоверности различия дисперсий.

22.Расчет доверительных границ к дисперсии.

23.Определение достоверности различия средних.

24.Критерий Стьюдента.

25.Расчет доверительных границ к математическому ожиданию.

26.Коэффициенты ковариации и детерминации. Коэффициент корреляции, его свойства и недостатки. Линеаризация данных.

27.Проверка достоверности отличия коэффициента корреляции от нуля.

28.Метод наименьших квадратов.

29.Проверка гипотезы о линейности данных.

Рекомендуемая литература

1.Герасимов А.Н. Медицинская статистика: Учебное пособие. – М.: ООО

«Медицинское информационное агентство», 2007. – 480 с.

2.Яворский В.А. Планирование научного эксперимента и обработка экспериментальных данных: Методические указания к лабораторным работам. – М.:

МФТИ, 2006. – 44 с.

3.Чистяков В.П. Курс теории вероятностей: учебник для вузов. – 7-е изд., испр. и доп.

– М.: Дрофа, 2007. – 253с.

4.Феллер В. Введение в теорию вероятностей и ее приложения, в 2 тт. Пер. с англ. / Предисл. А.Н. Колмогорова. Изд. 2-е. – М.: Книжный дом «ЛИБРОКОМ», 2010. – 528 с., 752 с.

5.Ивченко Г.И., Медведев Ю.И., Чистяков А.В. Задачи с решениями по математической статистике: учеб. пособие для вузов. – 2-е изд., испр. и доп. – М.:

Дрофа, 2007. – 318 с.

6.Лагутин М.Б. Наглядная математическая статистика: Учебное пособие. – М.: БИНОМ. Лаборатория знаний, 2007. – 472 с.