- •Теория вероятностей для студентов нематематических специальностей
- •Игнатов Юрий Александрович
- •1.Теория вероятностей
- •1.1Понятие вероятности
- •1.2Пространство элементарных событий
- •Операции над событиями
- •Упражнения
- •1.3Элементы комбинаторики
- •Упражнения
- •1.4Классическое определение вероятности
- •Упражнения
- •1.5Теоремы сложения. Произведение независимых событий
- •Упражнения
- •1.6Условная вероятность
- •Упражнения
- •1.7Формула полной вероятности
- •Упражнения
- •1.8Повторные независимые испытания
- •Упражнения
- •1.9Случайные величины
- •Упражнения
- •1.10 Непрерывные случайные величины
- •Упражнения
- •1.11 Основные законы распределения случайных величин.
- •1.12 Закон больших чисел
- •Задания для контрольной работы
- •2.Математическая статистика.
- •2.1Выборочный метод
- •Упражнения
- •2.2Точечная оценка параметров
- •Упражнения
- •2.3Доверительные интервалы
- •Упражнения
- •2.4Проверка статистических гипотез.
- •Упражнения
- •2.5Корреляционная зависимость
- •Упражнения
- •Задания для контрольной работы
- •Индивидуальные задания для студентов
- •Справочный материал
- •Предметный указатель
- •Литература
- •Содержание
Упражнения
Признак Х распределен нормально с известным σ = 0,5. По выборке объема п = 20 получено значение = 7,62. Найти доверительный интервал для математического ожидания а с надежностью а) γ = 0,95; б) γ = 0,99; в) γ = 0,999.
Признак Х распределен нормально с неизвестным σ. По выборке объема п = 20 получено значение = 7,62 и s = 0,50. Найти доверительный интервал для математического ожидания а с надежностью а) γ = 0,95; б) γ = 0,99; в) γ = 0,999.
Найти доверительный интервал для математического ожидания с надежностью γ = 0,95 для роста студентов на основе упражнения 2.2.
2.4Проверка статистических гипотез.
Пусть два предприятия производят
однотипную продукцию и требуется
сравнить параметры этой продукции
(например, дальность полета снарядов,
прочность кирпича на разлом, повышенное
напряжение, при котором перегорает
электрическая лампочка, и т.п.). Пусть Х
и Y – значения
исследуемого признака для единиц
продукции первого и второго предприятия;
это независимые случайные величины,
распределенные по нормальному закону.
Допустим, требуется сравнить МХ и
MY. Производим выборки
одинакового объема п и определяем
по ним
и
.
Например, средняя дальность полета
снарядов при п = 100 испытаниях
оказалась
=
7,3 км и
=
7,5 км. Возникает вопрос: можно ли считать
расхождение в значениях случайным, или
оно является значительным?
Мы выдвигаем гипотезу, что это расхождение случайно, то есть МХ = MY. Эта гипотеза называется основной, или нулевой. Конкурирующая гипотеза заключается в том, что отвергается основная. В данном случае она может быть сформулирована в виде МХ < MY.
Задается уровень значимости α, означающий вероятность ошибки при оценке результата. Ошибка может быть двух видов: отвергается верная гипотеза (ошибка первого рода), или принимается неверная гипотеза (ошибка второго рода).
Для оценки гипотезы разрабатывается специальным образом некоторая контрольная величина Т, приспособленная к данному типу задач. Определяется критическое значение величины Т, зависящее обычно от уровня значимости α и объема выборки п. Рассчитывается значение Т для данной выборки. Если оно оказывается меньше критического, то гипотеза принимается, если больше – отвергается. Таким образом, чтобы снизить вероятность ошибки первого рода, надо увеличивать критическое значение, а чтобы снизить вероятность ошибки второго рода, критическое значение следует уменьшать. Поэтому если выборочное значение Т оказывается больше критического, то мы гипотезу отвергаем с вероятностью ошибки α. Если же выборочное значение Т окажется меньше критического, то мы можем утверждать только, что предложенная гипотеза не противоречит результатам наблюдений.
В рассматриваемом примере с дальностью полета снарядов будем считать дополнительно, что по результатам многолетних наблюдений известны средние квадратичные отклонения для этой величины: σХ = 0,4; σY = 0,5. Тогда в качестве критерия можно использовать значение
=
=
= 3,12.
Критическое значение находим по таблице функции Ф(х). Если задать уровень значимости 0,05, то критическое значение t0 находим из условия
Ф(t0)
=
=
0,475.
Получаем t0 = 1,96. Так как t > t0, то различие в результатах испытаний признается значительным, и гипотеза о равенстве средней дальности полета снарядов отвергается с вероятностью ошибки 0,05.
Для различного типа задач вырабатываются различные критерии. Кроме задачи о равенстве средних значений, рассматриваются задачи о равенстве средних квадратичных отклонений, о проверке того, что две выборки относятся к одной и той же генеральной совокупности, и т.д. При этом может учитываться наличие дополнительной информации о генеральной совокупности.
Рассмотрим задачу о законе распределения признака Х в генеральной совокупности. Выдвигается основная гипотеза о виде закона распределения, например, что закон является нормальным. Тогда конкурирующая гипотеза заключается в том, что закон имеет другой вид. По выборке рассчитываются параметры закона (для нормального закона это а и σ). По этим параметрам рассчитывается распределение значений признака Х для данного объема выборки, то есть частоты, с которыми эти значения должны появляться при данном объеме выборки (выравнивающие частоты). Эти частоты сравниваются с эмпирическими (полученными в результате эксперимента) и определяются расхождения между ними. По этим расхождениям специальным образом определяется значение χ2. По таблице χ2-распределения определяем критическое значение χ20. Эта таблица зависит от уровня значимости α и числа степеней свободы k = n – 3. Если χ2 > χ20, то гипотеза отвергается на уровне значимости α. Если χ2 < χ20, то утверждается, что гипотеза не противоречит результатам наблюдений.
Для гипотезы о нормальном законе вычисления производятся следующим образом. Делается выборка объема n. В результате эксперимента получаем вариационный ряд вида
-
Варианты xi
x1
x2
…
xm
Эмпирические частоты ni
n1
n2
…
nm
Считаем, что n = n1 + n2 +…+ nm и значения вариант идут с постоянным шагом h. Далее выполняем следующие шаги:
1) находим
и σв = s,
как описано в разделе 2.2;
2) вычисляем выравнивающие частоты по формулам
,
где
; (1)
3) вычисляем величину
;
4) по таблице χ2 -распределения находим значение χ20 для данного уровня значимости α и числа степеней свободы k = n – 3;
5) если χ2 > χ20, то гипотеза отвергается на уровне значимости α. Если χ2 < χ20, то гипотеза не противоречит результатам наблюдений.
Вычисления можно оформлять с помощью следующей таблицы.
-
i
xi
ni
xi ni
xi2 ni
ui
(ui)
ni –
1
…
m
n
Σ1
Σ2
χ2
Ввиду большого числа столбцов эту таблицу можно разбить на две. В первой вычисления производятся вплоть до столбца . Во вторую переносятся из первой столбцы ni и и производятся дальнейшие вычисления.
Проверить гипотезу о нормальном распределении для генеральной совокупности на уровне значимости α = 0,05 по следующему вариационному ряду, полученному экспериментальным путем.
xi |
10 |
12 |
14 |
16 |
18 |
20 |
ni |
5 |
9 |
16 |
22 |
18 |
10 |
Решение. Строим расчетную таблицу
-
i
xi
ni
xi ni
xi2 ni
ui
(ui)
1
2
3
4
5
6
10
12
14
16
18
20
5
9
16
22
18
10
50
108
224
352
324
200
500
1296
3136
5632
5832
4000
–2,04
–1,33
–0,61
0,11
0,82
1,54
0,0498
0,1647
0,3312
0,3965
0,2850
0,1219
3
9
19
23
16
10
80
1258
20396
Заполнив первые пять столбцов как при решении примера 2.1, последовательно находим: п = 80;
= 15,7;
=
7,77;
σв = s
=
=
2,79.
Следующие столбцы заполняются
с помощью формул (1) и таблицы значений
функции (х). Для
заполнения последнего столбца вычисляем
множитель
.
Далее строим вторую таблицу
-
i
ni
ni –
1
2
3
4
5
6
5
9
16
22
18
10
3
9
19
23
16
10
2
0
–3
–1
2
0
4
0
9
1
4
0
1,33
0
0,47
0,04
0,25
0
2,09
Получили χ2 = 2,09. По таблице χ2 - распределения для k = m – 3 = 6 – 3 = 3 и α = 0,05 находим критическое значение χ20 = 7,82. Так как χ2 < χ20, то гипотеза о нормальном распределении не противоречит результатам эксперимента.
Замечание. Для облегчения вычислений в первой таблице можно было использовать ложный нуль.
