Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5361.pdf
Скачиваний:
3
Добавлен:
13.11.2022
Размер:
1.29 Mб
Скачать

Рис. 17. Отчет о решении задачи сравнения двух дисперсий в Statgraphics

Как видим, проверка гипотезы здесь осуществляется двумя способами: путем вычисления доверительного интервала для отношения дисперсий, с целью выяснить, вошла ли в этот интервал 1 (в случае равенства дисперсий их отношение равно 1) и путем расчета р-величины для вычисленного значения статистики Фишера. Оба этих метода дают один и тот же вывод, а именно: дисперсии не совпадают на 10 %-м уровне значимости (доверительный интервал для отношения дисперсий не содержит 1 и р-величина меньше 0,1).

Контрольные вопросы и упражнения

1.В чем отличие в постановке задач определения интервальной оценки и проверке статистических гипотез?

2.В чем схожесть в постановке задач определения интервальной оценки и проверке статистических гипотез?

3.В чем смысл доверительной вероятности и уровня значимости при постановке задач определения интервальной оценки и проверке статистических гипотез?

4.В чем суть ошибок первого и второго рода при проверке статистических гипотез?

5.Когда выдвинутая гипотеза отклоняется?

6.Какова роль р-величины при проверке статистических гипотез в случае принятия решения на основе компьютерных расчетов?

7.В чем различие двусторонней проверки гипотезы от односторонней?

8.В чем различие при сравнении средних арифметических в случаях независимых и зависимых выборок?

9.Почему при сравнении средних арифметических необходимо различать случаи равных и не равных дисперсий?

10.Как можно использовать доверительный интервал при сравнении средних арифметических?

11.Почему при сравнении дисперсий рекомендуется статистику Фишера рассчитывать как отношение большей оценки дисперсии к меньшей?

Выполнить следующие задания

Пример 1. Проверьте из раздела Описательная статистика (Пример 1) равенство средних оценок для всех трех показателей, построив для них доверительные интервалы и сопоставив их.

Пример 2. Проверьте на 5 %-м уровне значимости по данным из раздела Описательная статистика (Пример 1), можно ли считать оценку степени удовлетворенности зарплатой равной 70 баллов.

Пример 3. Проверьте на 5 %-м уровне значимости по данным из раздела Описательная статистика (Пример 1), можно ли считать равными оценки степени удовлетворенности работой и зарплатой.

Пример 4. Проверьте на 5 %-м уровне значимости по данным из раздела Описательная статистика (Пример 1), можно ли считать равными число работающих на каждом из предприятий, если считать, что число опрошенных пропорционально числу работающих.

Пример 5. Проверьте на 5 %-м уровне значимости по данным из раздела Описательная статистика (Пример 1) гипотезу о равенстве оценок степени удовлетворенности работой и зарплатой на разных предприятиях.

Пример 6. Для проверки равенства качества работы двух производственных процессов по изготовлению теннисных мячей из каждой партии мячей, изготовленных на этих линиях, были случайным образом отобраны и проверены по 40 мячей. Ниже приведены расстояния, которые пролетели каждый из отобранных мячей на

испытательном стенде.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1-й станок

 

 

24,2

 

23,9

24,5

25

23,6 26,1 23,6 24,4 23,7

24,8

24,1

24,2

26,2

24,1

23,8

 

26,1

 

23,3

25

24,4

24,6

24,8

26,5

26,7

25,8

25

25,3

24,3

23,8

25,6

25,3

25,9

25,2

 

25,1

 

24,1

25,3

24,5

 

25,7

25,2

25,4

24

 

 

 

 

 

 

 

 

 

2-й станок

 

27,4

 

26,6

26

26,3

25,9

24,8

25,9 28,6

28,3

26,1

 

27,1

 

26,3

25,9

26,8

25,7

27,8

24,7

26

27,5

26,1

26,9

25,6

 

26,1

27,7

27,1

27,8

27,13

26,6

26,5

25,9

 

28

24,7

25

25,7

26,7

26

25,8

25,2

26

27,6.

 

 

 

 

 

 

 

 

Проверьте на 5 %-м уровне значимости гипотезу о равенстве качества мячей по

среднему расстоянию и по его дисперсии. Прокомментируйте полученные результаты. Задачу решить, используя ППП, двумя способами: непосредственно введя

приведенную информацию в процедуру сравнения средних для независимых выборок и рассчитывая t-статистику по уже известным выборочным статистикам, полученным из решения задачи по первому варианту.

Решить эту же задачу в случае зависимых выборок. Результаты сравнить.

Пример 7. Проверить на 5 %-м уровне значимости гипотезу о равенстве средних двух совокупностей, если из каждой из них были осуществлены независимые

случайные выборки с результатами: n1 =12, n2 =15, x1 = 72, x2 =78, s1 =8, s2 =10.

Пример 8. При выявлении предпочтений в продукции фирмы были опрошены 80 потенциальных покупателей, 36 из которых высказались в пользу продукции этой фирмы. Проверить при α = 0,05 гипотезу о том, что половина покупателей предпочитает продукцию именно этой фирмы.

Пример 9. Рассмотрим продолжение примера 8. Среди 50 потенциальных покупателей из другого района города 20 высказались в пользу товара этой фирмы. По - разному ли относятся к товарам этой фирмы в разных районах города? Проверку провести при α = 0,05.

Пример 10. Считается, что 70 % жителей города поддерживает некое мероприятие администрации города. Из 170 опрошенных горожан 112 поддерживают это мероприятие. Верно ли первоначальное предположение? Гипотезу проверить на 10 %-м уровне значимости.

Пример 11. Проверить гипотезу о нормальном законе распределения данных о сумме покупки из примера 6 темы “Дисперсионный анализ

ГЛАВА 4. Проверка гипотез по критерию 2 (критерий согласия)

Здесь речь пойдет о проверке значимости различия между предполагаемым и выборочным распределениям частот на основе критерия согласия 2. Известно, что в этом случае критерий 2 может использоваться для сравнения двух рядов частот (проверка гипотезы на соответствие) и для сравнения двух двумерных таблиц частот или таблиц сопряженности (проверка гипотезы на независимость). В последнем случае речь идет о зависимости или независимости двух переменных

(обычно нечисловых), лежащих в основе двумерной группировки.

В обоих случаях сравниваются два вида частот: наблюдаемые (f0) и ожидаемые

(теоретические) (fe), и сравниваются они,

чтобы определить их согласованность при

помощи статистики 2:

 

 

χ 2

(f0 fe )2

.

 

 

fe

В первом случае суммирование ведется по одному индексу (ряду частот), во втором - по двум (по строкам и столбцам таблицы сопряженности). Рассмотрим эти два случая отдельно.

4.1.Проверка гипотез на соответствие

Рассмотрим использование этого критерия в практике принятия решений на примере.

Пример. По данным прошлого периода рынок акций четырех фирм стабилизировался на уровне:

Фирма

А

В

С

D

Доля продаж

29 %

28 %

25 %

18 %

Спустя некоторое время опрос 300 потенциальных покупателей выявил следующие предпочтения: А – 95, В – 70, С – 89 и D – 46.

Значимо ли изменился рынок акций этих четырех фирм за указанное время? Иными словами, различаются ли частоты предпочтений в рассматриваемых двух случаях?

Рассчитаем ожидаемые частоты. Если бы рынок акций остался неизменным, то из 300 опрошенных предпочли бы акции фирмы А: 300. 0,29 = 87 опрошенных; фирмы В:

300 . 0,28 = 84; фирмы С: 300 . 0,25 = 75 и фирмы D: 300 . 0,18 = 54 респондента. Это -

ожидаемые частоты (fe). Наблюдаемые частоты (f0) даны в условии задачи. Вычислим значение статистики 2. Имеем:

χ

2

 

(f0

fe )2

 

(95

 

87)2

 

 

(70

84)2

 

 

(89

75)2

 

 

(46 54)2

 

 

 

 

fe

 

87

 

 

 

 

 

84

 

 

 

75

 

54

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 6,87. Табличное значение

2 при

= 0,05

и числе степеней свободы

=n – 1=4 – 1 = 3

равно:

2

 

= 7,81. Т. к.

2

=

6,87

<

 

2

 

то

гипотеза

о соответствии

0,05

 

 

0,05 = 7,81,

принимается на 5 - % уровне значимости, т.е. рынок акций за этот период значимо не изменился. Компьютерные расчеты по этой задаче дают следующий результат (рис.

18):

Рис. 18. Сравнение частот в ППП Statistica

Название этой процедуры переводится как: “наблюдаемые частоты против ожидаемых”. Здесь приведены сами частоты, их разности и вычисленные значения слагаемых в формуле для 2. Как видим, р-величина = 0,076, что больше 0,05 и, следовательно, гипотеза о соответствии не отклоняется, т. е. рынок акций существенно не изменился.

По сути дела, в рассмотренной задаче речь шла о проверке гипотезы о соответствии распределений фактических и теоретических частот. Если ожидаемые частоты определяются в предположении выполнения какого-либо закона распределения вероятностей, то реализация рассмотренного алгоритма приведет к проверке гипотезы о законе распределения. На рис. 19 приведен пример проверки гипотезы о нормальном законе распределения на основе ППП Statistica

Рис. 19. Проверка гипотезы о нормальном законе распределения на основе ППП

Statistica

На рис. 19 приведена гистограмма с наложенной на нее кривой нормального закона распределения, в левой части рис. 19 указаны границы интервалов и соответствующие им частоты (они указывают высоту столбика на гистограмме), а сверху таблицы отражено значение статистики 2 = 12,96 и соответствующее ему значение р-величины, равное 0,0115. Поскольку это значение меньше 0,05, то гипотеза о том, что данные

следуют нормальному закону распределения, отклоняется. На рис. 19 не приведены ожидаемые частоты (они закрыты графиком), но они соответствуют высоте точки на кривой распределения внутри каждого интервала ряда распределения и рассчитываются на основе функции нормального закона распределения.

Следует отметить, что в верхней части таблицы на рис. 19 указано также значение критерия согласия Колмогорова – Смирнова, равное 0,1515 и соответствующее ему значение р-величины < 0,01. Этот критерий основан на наибольшей разности между значениями теоретического и выборочного распределений и часто используется в статистических ППП при проверки гипотезы на нормальность. В соответствии и с этим критерием гипотеза о том, что данные подчинены нормальному закону распределения, отклоняется.

4.2.Проверка гипотезы о независимости

В данном случае речь пойдет об анализе таблиц сопряженности. Из всей совокупности методов, посвященных этому виду анализа, рассмотрим лишь проверку гипотезы о независимости двух переменных, лежащих в основе двумерной группировки, результатом которой является таблица частот или таблица сопряженности. Будем предполагать, что переменные измерены в номинальной шкале, а упорядочены ли их категории – не важно. Проверку на независимость здесь, как и было заявлено в заголовке, будем рассматривать только на основе критерия 2 , лишь вскользь упомянув о других. Рассмотрим эти положения на примере.

Пример. Пусть фирма изучает зависимость спроса на производимый ею продукт от места жительства потенциальных покупателей. Для этого было опрошено 600 жителей трех различных районов города, и им задавался вопрос: предпочитают ли они: а) продукт только этой фирмы, б) - все равно какой фирмы или в) продукт других фирм.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]