
- •Глава 1. Выборочный метод.
- •§1. Основные задачи математической статистики.
- •§2. Генеральная совокупность и выборка.
- •§3. Повторные и бесповторные выборки. Репрезентативная выборка.
- •§4. Статистическое распределение выборки.
- •§5. Эмпирическая функция распределения.
- •§6. Полигон и гистограмма.
- •§7. Статистические оценки.
- •§8. Эмпирические моменты распределения случайных величин.
- •§9. Методы точечного оценивания параметров распределения.
- •§10. Критические границы.
- •§11. Основные законы распределения статистических оценок.
- •§12. Интервальные оценки параметров нормального распределения.
- •Глава 2. Проверка статистических гипотез.
- •§1. Основные понятия.
- •§2. Гипотеза о равенстве выборочной средней и гипотетического математического ожидания нормального распределения.
- •§3. Гипотеза о равенстве дисперсий двух нормальных распределений.
- •§4. Гипотеза о равенстве средних двух нормальных распределений.
- •§5. Гипотеза о вероятности появления некоторого события.
- •§6. Критерий согласия.
- •Глава 3. Многомерные случайные величины.
- •§1. Понятие о многомерных случайных величинах.
- •§2. Дискретная двумерная случайная величина.
- •§3. Непрерывная двумерная случайная величина.
- •§4. Числовые характеристики двумерной случайной величины. Ковариация случайных величин X и y. Коэффициент корреляции.
- •Глава 4. Корреляционно-регрессионный анализ.
- •§1. Корреляционная зависимость. Две основные задачи теории корреляций.
- •§2. Выборочное уравнение линейной регрессии.
- •Глава 5. Дисперсионный анализ.
- •§1. Понятие о дисперсионном анализе.
- •§2. Общая факторная и остаточная суммы квадратов отклонений.
- •§3. Общая факторная и остаточная дисперсии.
- •§4. Сравнение нескольких средних методом дисперсионного анализа.
Глава 2. Проверка статистических гипотез.
§1. Основные понятия.
Статистическая гипотеза – это некоторое предположение относительно генеральной совокупности, проверяемое по выборочным данным.
Примеры статистических гипотез:
Нормально распределённая случайная величина X имеет генеральную среднюю a, равную a0 – H0: a=a0.
Нормально распределённая случайная величина X имеет дисперсию σ2, равную σ2 – Н0: σ2=
.
Выборка x=(x1, x2, …, xn) извлечена из нормально распределённой генеральной совокупности.
Различают гипотезы параметрические и непараметрические.
Гипотеза называется параметрической, если в ней содержится утверждение о параметре распределения известного вида.
Гипотеза называется непараметрической, если она выдвигает утверждение о виде неизвестного закона распределения случайной величины.
Гипотеза, которую следует проверить, называется основной или нулевой гипотезой H0. Вместе с нулевой гипотезой рассматривают конкурирующую или альтернативную гипотезу H1. Эта гипотеза является отрицанием нулевой гипотезы.
Параметрическая гипотеза называется простой, если она содержит предположение равно об одном значении параметра.
H0: λ=5 – параметр показательного распределения λ
H0: X – нормально распределённая случайная величина
a=a0, σ известна
Параметрическая гипотеза называется сложной, если она состоит из конечного или бесконечного множества простых гипотез.
H0: X – нормально распределённая случайная величина
a=a0, σ неизвестна
Статистику, значение которой находят по выборке, и по этому значению выносят решение: принять или не принять основную гипотезу, называют статистическим критерием. При этом используют правило, которое устанавливает, при каких числовых значениях статистики нулевая гипотеза принимается, а при каких – нет.
Схема проверки гипотезы.
Всё множество возможных значений статистики делится на два непересекающихся подмножества:
Область S – область отклонения основной гипотезы
Область
- область принятия основной гипотезы
Область S называется критической. Если вычисленное по выборке значение статистики попадает в область S, то нулевая гипотеза H0 отклоняется. Если вычисленное по выборке значение статистики попадает в область , то нулевая гипотеза H0 принимается.
В итоге статистической проверки гипотезы могут иметь место ошибки двух родов:
Ошибка 1-го рода – будет отвергнута правильная гипотеза H0. Вероятность ошибки 1-го рода – α,
, где α – уровень значимости. Обычно в качестве α берётся 0,1; 0,05; 0,01; 0,005.
Ошибка 2-го рода состоит в том, что будет принята неправильная гипотеза H0. Вероятность этого события – β,
,
. Число (1-β) – мощность критерия. Геометрически мощности критерия – вероятность попадания в критическую область, когда гипотеза неверна.
Пример.
Завод выпускает лампочки нового типа и предполагаем, что средний срок службы таких ламп будет не менее 1500 часов. Для выборки из 80 ламп оказалось, что средний срок службы ламп равен 1475 часов. Среднее квадратическое отклонение σ известно и σ=100 часов. Проверить гипотезу, выдвинутую фирмой при уровне значимости α=0,1 и построить график функции 1-β=(1-β)(a). Считать, что X – срок службы – нормально распределённая случайная величина.
Решение.
Ho: a0=1500
H1: a0=a1<1500
(Случай a>1500 нас не интересует, т.к. какие-либо действия следует принимать, если срок службы лампочек <1500 ч).
При такой гипотезе H1 критическая область является левосторонней.
В
ероятность
ошибки I-го
рода – площадь по графиком нормального
распределения выборочной средней слева
от левосторонней критической границы.
Найдём эту границу
;
.
По таблице нормального распределения
U2α=1,28.
.
Найденное по выборке
значение статистики
,
нулевая гипотеза H0
отвергается. Говорят: средний срок
службы лампочек значимо меньше 1500 часов.
Построим график функции 1-β=(1-β)(a).
П
редположим,
что нулевая гипотеза неверна и a=1490.
(1-β) – вероятность попасть в критическую
область S,
т.е. получить
.
Следовательно, (1-β) – площадь под графиком
распределения выборочной средней при
a=1490
левее 1485,69. Эта площадь –
Возьмём другое значение
a=1480.
(площадь под графиком
левее 1485,69).
Е
сли
a=1430,
то
=0,5+Φ(4,98)=0,5+0,499=0,999.
График функции 1-β=(1-β)(a) имеет вид (a=1500, 1-β=α=0,1):
Мы построили график функции мощности в случае левосторонней критической границы.
Е
сли
критическая граница будет правосторонней,
то график функции будет симметричным
графику для левосторонней критической
границы относительно вертикали a0.
В случае двусторонних критических границ график выглядит следующим образом:
Свойства мощности критерия (1-β).
Мощность зависит от расстояния между a0 и действительным значением a, среднего квадратического отклонения генеральной совокупности, размера выборки и уровня значимости.
Чем больше расстояние между a0 и действительным значением a, тем больше вероятность заметить неверность нулевой гипотезы.
Чем меньше σ – среднее квадратичекое отклонение генеральной совокупности, тем больше мощность критерия.
Чем больше размер выборки, тем больше мощность критерия.
Чем меньше уровень значимости, тем меньше мощность критерия.