![](/user_photo/_userpic.png)
книги / Теория вероятностей и математическая статистика. Прикладная статистика с использованием MS EXCEL
.pdf![](/html/65386/197/html_ecMEV_QoyZ.XDxB/htmlconvd-urJS1m101x1.jpg)
= 2 * МИН(ZTEСT(массив; m0 ; сигма), 1 – ZTEСT (мас-
сив; m0 ; сигма)).
Задаваемые аргументы:
массив – массив или интервал данных, с которыми сравнивается m0;
m0 – проверяемое значение;
сигма – известное стандартное отклонение генеральной совокупности. Если этот параметр опущен, то используется стандартное отклонение выборки.
Рис. 3.4. Меню функции ZТЕСТ
Если параметр сигма не опущен, функция ZТЕСТ вычисляется следующим образом:
ZTECT(массив; m ; сигма) =1− НОРМСТРАСП x − m0 ,
0 σ / n
а если параметр сигма опущен, то
ZTECT(массив; m0 ) = 1 |
− НОРМСТРАСП |
x − m0 |
|
, |
|
||||
|
s / n |
|
|
где σ = сигма; s = СТАНДОТКЛОН (массив) – выборочное среднеквадратичное отклонение; n = СЧЕТ (массив) – число наблюдений.
101
Пример 3.6. По паспортным данным автомобильного двигателя расход топлива на 100 км пробега составляет 10 л. В результате изменения конструкции двигателя ожидается, что расход топлива уменьшится. Для проверки проведены испытания 25 случайно отобранных эксплуатирующихся автомобилей с модернизированным двигателем, получены следующие результаты:
10,9 |
8,3 |
8,4 |
8,6 |
10,2 |
8,5 |
10,1 |
8,5 |
8,3 |
9,1 |
8,2 |
10,4 |
11,0 |
10,2 |
9,6 |
8,4 |
9,3 |
9,5 |
8,5 |
10,5 |
10,1 |
10,8 |
8,8 |
8,3 |
10,5 |
|
|
|
|
|
Предполагая, что выборка получена из нормально распределенной генеральной совокупности, проверить гипотезу о том, что изменение конструкции двигателя не повлияло
на расход |
топлива. |
Уровень значимости принять рав- |
ным 0,05. |
|
|
Решение. Согласно условию, нужно проверить нулевую |
||
гипотезуH0 : m = m0, |
m0 =10 л/100 км при альтернативной ги- |
потезе H1 : m < m0. Вычислим числовые характеристики выбор-
ки с помощью |
инструмента «Описательная |
статистика» |
(см. примеры 2.3, |
2.10): в ячейку А1 таблицы |
MS Excel |
(см. рис. 3.5) вводим название случайной величины «Расход»;
вдиапазон А2:А26 – полученные экспериментальные данные;
вменю «Сервис» → «Анализ данных» → «Описательная статистика» задаем соответствующую информацию и получаем результаты, представленные на рис. 3.5 в ячейках С2:D17.
Выборочное среднее расхода топлива по результатам испытаний составило x = 9,4 л/100 км. В ячейке С20 вычисля-
ем |
(см. рис. 3.4) |
значение функции ZТЕСТ(A2:A26;10) = |
|
= 0,998885468, которое равно вероятности события P{ x |
< m0 } = |
||
= |
P{Н1}, то есть |
соответствует альтернативной |
гипотезе |
H1 : m < m0. Вероятность противоположного события P{ x ≥ m0 } = = 1 – 0,998885468 = 0,001114532 < α = 0,05, следовательно, ос-
новная гипотеза отклоняется в пользу альтернативной, то есть
102
![](/html/65386/197/html_ecMEV_QoyZ.XDxB/htmlconvd-urJS1m103x1.jpg)
изменение конструкции двигателя повлияло на расход топлива в сторону его уменьшения. Естественно, что в рассмотренном случае ZТЕСТ(A2:A26;9.4) = 0,5.
Рис. 3.5. Результаты вычисления числовых характеристик и функции ZТЕСТ
103
![](/html/65386/197/html_ecMEV_QoyZ.XDxB/htmlconvd-urJS1m104x1.jpg)
Если в качестве альтернативной гипотезы принятьH2 : m ≠ m0, то имеем двустороннюю критическую область и вероятность выполнения основной гипотезы H0 : m = m0,
равную P{H0} = P{x =10} = 2 * МИН(ZTEСT(А2:А26; 10), 1 – ZTEСT(А2:А26; 10)) = 0,002229065 < α = 0,05. Следовате-
льно, основная гипотеза также отклоняется в пользу альтерна-
тивной. В этом случае возможным |
вариантом является |
не только интересующее нас событие x |
< m0, но и вариант воз- |
можного ухудшения экономичности двигателя x > m0.
Контрольная проверка по 2-му критерию табл. 3.2 также дает отклонение основной гипотезы при обеих вариантах альтернативных гипотез, т.к. имеем:
tα; n−1 = t0,05; 24 = –1,71; t1−α/ 2; n−1 |
= t0,975; 24 = 2,064; |
|||||||||
T |
= |
m |
−m |
= |
9,4 −10 |
≈ −3,058; |
||||
|
0 |
|
|
|
|
|||||
|
|
|
|
|
|
|||||
набл |
|
s / |
n |
|
|
0,9811/ |
25 |
|
||
|
|
|
|
|
||||||
Tнабл |
< −1,71; |
|
Tнабл |
|
> 2,064. |
|
||||
|
|
|
ТТЕСТ (массив1; массив2; хвосты; тип) – возвращает вероятность, соответствующую критерию Стьюдента. Функция ТТЕСТ используется, чтобы определить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее.
Задаваемые аргументы:
массив1 – первое множество данных; массив2 – второе множество данных;
хвосты – число учитываемых «хвостов» распределения. Если хвосты = 1, то функция ТТЕСТ использует одностороннюю критическую область. Если хвосты = 2, то функция ТТЕСТ использует двустороннюю критическую область;
тип – вид исполняемого t-теста:
104
![](/html/65386/197/html_ecMEV_QoyZ.XDxB/htmlconvd-urJS1m105x1.jpg)
Тип |
Выполняемый тест |
1Парный (массив1 и массив2 имеют одинаковое число точек данных)
2Двухвыборочный с одинаковыми дисперсиями (гомоскедастический)
3Двухвыборочный с различными дисперсиями (гетероскедастический)
Парный двухвыборочный t-тест Стьюдента используется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсий генеральных совокупностей, из которых выбраны данные. Парный тест используется, когда имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды – до и после эксперимента.
Например, формула = ТТЕСТ(A2:A10;B2:B10;2;1) возвращает вероятность, соответствующую парному критерию Стьюдента сдвухсторонней критической областью для двух выборок с объемами9, представленныхвдиапазонахA2:A10, B2:B10.
Двухвыборочные тесты с одинаковыми и различными дисперсиями в основном соответствуют определениям критериев 3, 4 табл. 3.2.
Все указанные типы для статистической функции ТТЕСТ имеют свои отличающиеся по представлению результатов аналоги среди инструментов меню «Сервис» → «Анализ данных».
Пример 3.7. Имеется два одинаково настроенных станкаавтомата (дисперсии размеров одинаковы). Из продукции каж-
дого станка |
извлечены |
малые |
выборки с объемами |
|||||
n1 =10, n2 =12 |
со следующими результатами измерения кон- |
|||||||
тролируемого размера, в мм: |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
x1i |
103,4 |
|
103,5 |
|
103,7 |
103,9 |
|
|
n1i |
2 |
|
3 |
|
4 |
1 |
|
|
x2i |
103,2 |
|
103,4 |
|
103,6 |
|
|
|
n2i |
2 |
|
2 |
|
8 |
|
|
|
|
|
|
|
|
|
105 |
![](/html/65386/197/html_ecMEV_QoyZ.XDxB/htmlconvd-urJS1m106x1.jpg)
Предполагая, что случайные величины Х1 и Х2 распределены по нормальному закону, проверить гипотезу о равенстве средних H0 : m1 = m2 при альтернативной гипотезе H1 : m1 ≠ m2 для уровня значимости α = 0,025.
Решение. В ячейку А1 таблицы MS Excel вводим название Х1; в ячейку В1 – Х2; в диапазон А2:А11 – значения x1i , по-
вторяя копированием каждое значение n1i раз; аналогично в В2:В13 – значения x2i .
Входим в меню «Сервис» → «Анализ данных» → «Двухвыборочный t-тест с одинаковыми дисперсиями» и задаем данные в его меню (рис. 3.6):
Рис. 3.6. Двухвыборочный t-тест с одинаковыми дисперсиями
Результат выполнения этого теста представлен на рис. 3.7,
где |
Объединенная дисперсия = |
(n |
1 |
−1)s2 |
+ (n |
2 |
−1)s2 |
|
|
|
|
1 |
|
2 |
|
||
106 |
|
|
|
|
|
|
|
|
![](/html/65386/197/html_ecMEV_QoyZ.XDxB/htmlconvd-urJS1m107x1.jpg)
(n1 + n2 ), несколько отличается от осредненной дисперсии σ2
для 4-го критерия табл. 3.2, df – число степеней свободы, t-статистика – наблюдаемое значения критерия Tнабл , P(T<=t)
одностороннее – вероятность события {Tнабл < kкрправ, α = t кри-
тическое одностороннее}, P(T<=t) двухстороннее – вероятность события {Tнабл < kкрправ, α = t критическое двухстороннее}.
Рис. 3.7. Результаты выполнения двухвыборочного t-теста с одинаковыми дисперсиями
Событие { |
|
T |
|
= 1,448 < kправ |
= t критическое двухсто- |
|
|
||||
|
|
набл |
|
кр, α |
|
роннее = 2,423} осуществляется с вероятностью 0,163, большей, чем уровень значимости α = 0,025, основная гипотеза H0 : m1 = m2 принимается, то есть средние значения выборок не различаются.
107
![](/html/65386/197/html_ecMEV_QoyZ.XDxB/htmlconvd-urJS1m108x1.jpg)
Эта гипотеза принимается и при альтернативной гипотезе H2 : m1 > m2, т.к. с вероятностью 0,0815 > 0,025 осуществляется
событие {Tнабл = 1,448 < kкрправ, α = t критическое одностороннее =
= 2,086}.
При использовании вызова функций ТТЕСТ (рис. 3.8) имеем изрезультатоврис. 3.7 толькосоответствующиевероятности:
ТТЕСТ(A2:A11;B2:B13;1;2) = 0,081499; ТТЕСТ(A2:A11;B2:B13;2;2) = 0,162999.
Поэтому использование статистических инструментов MS Excel для проверки гипотез чаще всего предпочтительнее по сравнению с использованием соответствующих статистических функций.
Рис. 3.8. Задание аргументов функции ТТЕСТ для двухвыборочного t-теста с одинаковыми дисперсиями
ФТЕСТ (массив1; массив2) – возвращает одностороннюю вероятность того, что дисперсии аргументов массив1 и массив2 различаются несущественно. Эта функция используется для того, чтобы определить, имеют ли две выборки различные дисперсии (различные уровни разнородности).
108
![](/html/65386/197/html_ecMEV_QoyZ.XDxB/htmlconvd-urJS1m109x1.jpg)
Задаваемые аргументы (выборочная дисперсия первого массива должна быть больше выборочной дисперсии второго массива,
s12 > s22 ):
массив1 – это первый массив, или интервал данных; массив2 – это второй массив, или интервал данных. Пример 3.8. Для выборок примера 3.7 проверить гипотезу
о равенстве дисперсий H0 : σ12 = σ22 при альтернативной гипотезе H1 : σ12 > σ22 для уровня значимости α = 0,05, предполагая,
что случайные величины Х1 и Х2 распределены по нормальному закону.
Решение 1. В ячейку D2 таблицы MS Excel при заданных значениях переменных Х1 и Х2 (см. рис. 3.8) вводим формулу ФТЕСТ (А2:А11; В2:В13) = 0,925989445.
Решение 2. Входим в меню «Сервис» → «Анализ данных» → → «Двухвыборочный F-тест для дисперсии» и задаем данные в его меню (аналогично рис. 3.5, но в качестве первой выборки нужно указывать выборку с максимальной дисперсией).
Результат выполнения этого теста представлен на рис. 3.9, где F – наблюдаемое значения критерия Fнабл, P(F<=f) одностороннее–
вероятностьсобытия{Fнабл < F}. Таккак Fнабл = 1,047 < kкрправ, α = F
Рис. 3.9. Результаты вычисления функции ФТЕСТ и двухвыборочного F-теста для дисперсии
109
критическое одностороннее = 2,896 (или α = 0,05 < P(F<=f)
одностороннее = 0,463) гипотеза H0 : σ12 = σ22 принимается с уровнем значимости α = 0,05.
Сравнение результатов вызова функции ФТЕСТ (А2:А11; В2:В13) и инструмента «Двухвыборочный F-тест для дисперсии» показывает, что полученное значение функции равно удвоенному значению P(F<=f) одностороннее и затруднительно для интерпретации – еще один аргумент в предпочтительности использования инструментов, а не функций (вероятна ошибка программного русифицированного продукта MS Excel в вычислении или в описании функции ФТЕСТ).
3.4. Проверка непараметрических статистических гипотез
При обработке результатов эксперимента над случайной величиной экспериментатор по выборке подбирает теоретиковероятностную модель (нормальную, показательную, биномиальную и т.д.).
Предположим, что по виду гистограммы или полигона частот или из каких-либо других соображений выдвинута гипотеза относительно общего вида функции распределения наблюдаемой случайной величины, то есть гипотеза вида H0 : F (x) = F0 (x) или H0 : F (x) Ω где Ω – класс функций распределения определенного вида (нормальных, показательных, биномиальных и т.д.).
Такую гипотезу называют нулевой непараметрической гипотезой. Гипотетическая функция распределения может быть определена полностью либо с точностью до параметров. В последнем случае по данным выборки может быть произведена точечная оценка неизвестных параметров. Но как бы хорошо ни была подобрана теоретическая кривая распределения,
110