
- •Глава 3 элементы математической статистики
- •§ 3.1. Основные понятия математической статистики
- •§ 3. 2. Числовые характеристики статистического ряда
- •§ 3. 3. Интервальная оценка
- •§ 3.4. Интервальная оценка генерального среднего для нормального закона распределения
- •§ 3.5. Методы проверки статистических гипотез Статистические гипотезы
- •Нулевая и альтернативная гипотезы. Задача проверки гипотез. Уровень значимости Нулевая и альтернативная гипотезы
- •§ 3.6. Проверка гипотез о равенстве дисперсий, f – критерий Фишера
- •Постановка задачи
- •§ 3.7. Проверка гипотез относительно равенства средних, t- Критерий Стьюдента
- •Постановка задачи.
- •Применимость t-критерия Стьюдента
- •§ 3.8. Непараметрическое сравнение двух выборок: критерий Манна-Уитни
- •Постановка задачи
§ 3.4. Интервальная оценка генерального среднего для нормального закона распределения
Построение интервальной оценки генерального среднего М для генеральной совокупности с нормальным законом распределения основано на следующем свойстве. Для выборки объема n отношение
подчиняется распределению Стьюдента с числом степеней свободы = n – 1.
Здесь - выборочное среднее, а s – выборочное с.к.о.
Используя таблицы распределения Стьюдента или их компьютерный аналог можно найти граничное значение tгр такое, что c заданной доверительной вероятностью выполняется неравенство
tгр < t < tгр.
Этому неравенству соответствует неравенство для М:
,
где - полуширина доверительного интервала.
Таким образом, построение доверительного интервала для М производится в следующей последовательности.
Выбирают доверительную вероятность Рд обычно 0,95 или 0,99) и для нее по таблице распределения СТЬЮДЕНТА находят параметр tгр.
Рассчитывают полуширину доверительного интервала :
. (3.6)
Получают интервальную оценку генеральной средней с выбранной нами доверительной вероятностью:
. (3.7)
Кратко это записывается так:
(3.8)
Для нахождения интервальных оценок разработаны компьютерные процедуры.
Поясним, как пользоваться таблицей распределения Стьюдента. Эта таблица имеет два «входа»: левый столбец, называемый числом степеней свободы = n – 1, и верхняя строка – уровень значимости . На пересечении соответствующей строки и столбца находят коэффициент Стьюдента t.
Применим этот метод к нашей выборке. Фрагмент таблицы распределения Стьюдента представлен ниже.
Таблица 3.3
Фрагмент таблицы распределения Стьюдента.
|
Уровень значимости |
||||||
0,5 |
0,4 |
0,3 |
0,2 |
0,1 |
0,05 |
0,01 |
|
1 |
1,00 |
1,38 |
2,00 |
3,08 |
6,31 |
12,71 |
63,66 |
10 |
0,70 |
0,88 |
1,10 |
1,37 |
1,81 |
2,23 |
3,17 |
19 |
0,69 |
0,86 |
1,09 |
1,33 |
1,73 |
2,09 |
2,86 |
Простой статистический ряд для выборки из 20 человек (n = 20, =19) представлен в табл. 3.1. Для этого ряда расчеты по формулам (3.1 – 3.3) дают: = 37,05; s = 5,02.
Выберем = 0,05 (Рд = 0,95). На пересечении строки "19" и столбца "0,05" найдем t = 2,09.
Вычислим точность оценки по формуле (3.6) = 2,095,02/20 = 2,34.
Построим интервальную оценку: с вероятностью 95%: неизвестное генеральное среднее удовлетворяет неравенству:
37,05 —2,34 < М < 37,05 + 2,34, или М = 37,05 2,34 (м/с), Рд = 0,95.
§ 3.5. Методы проверки статистических гипотез Статистические гипотезы
Прежде чем сформулировать, что такое
статистическая гипотеза, рассмотрим
следующий пример. Для сравнения двух
методик лечения некоторого заболевания
были отобраны две группы пациентов по
20 человек, лечение которых проводилось
по этим методикам. Для каждого пациента
фиксировалось количество процедур,
после которого достигался положительный
эффект. По этим данным для каждой группы
находились выборочные средние(
),
выборочные дисперсии (s2)
и выборочные среднеквадратические
отклонения (s).
Результаты представлены в табл. 3.4.
Таблица 3.4
Число процедур |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
s2 |
s |
1-я группа
|
1 |
2 |
3 |
7 |
4 |
2 |
1 |
|
|
|
6,05 |
2,16 |
1,45 |
2-я группа
|
|
1 |
2 |
3 |
6 |
3 |
2 |
1 |
1 |
1 |
7,45 |
4,05 |
2,01 |
Количество процедур, необходимое для получения положительного эффекта – случайная величина, вся информация о которой на данный момент содержится в приведенной выборке. Из табл. 3.4 видно, что выборочное среднее в первой группе меньше чем во второй. Означает ли это, что и для генеральных средних имеет место такое же соотношение: М1 < М2? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает статистическая проверка гипотез.
Статистическая гипотеза – это предположение, относительно свойств генеральных совокупностей.
Мы будем рассматривать гипотезы о свойствах двух генеральных совокупностей.
Если генеральные совокупности имеют известные, одинаковые распределения оцениваемой величины, а предположения касаются величин некоторого параметра этого распределения. Такие гипотезы называются параметрическими. Например, выборки извлечены из генеральных совокупностей с нормальным законом распределения и одинаковой дисперсией. Требуется выяснить, одинаковы ли генеральные средние этих совокупностей.
Если о законах распределения генеральных совокупностей ничего не известно, то гипотезы о их свойствах называют непараметрическими. Например, одинаковы ли законы распределения генеральных совокупностей, из которых извлечены выборки.