Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие программные стат комплексы.doc
Скачиваний:
36
Добавлен:
14.03.2016
Размер:
1.32 Mб
Скачать

Контрольные вопросы

1. Какие основные виды высказываемых гипотез можно выделить в ходе статистической обработки данных?

2. Возникновение каких двух видов ошибок возможно при проверке правильности выдвинутой статистической гипотезы?

3. Что называется критической областью критерия проверки статистической гипотезы?

4. Какой критерий используется с целью проверки гипотезы о нормальном распределении генеральной совокупности?

5. Какие статистические функции используются для проверки попадания 2-критерия в критическую область?

6. Какой режим работы используется для проверки гипотезы о различии между средними (математическим ожиданиями) двух нормальных распределений с известными дисперсиями?

Лабораторная работа № 4

однофакторный дисперсионный анализ

Цель работы – изучение однофакторного дисперсионного анализа с использованием программной надстройки «Пакет анализа» табличного процессора Microsoft Excel.

Краткие теоретические сведения

На практике при сравнении нескольких генеральных совокупностей X1, X2, …, Xp, распределенных нормально и имеющих одинаковую, хотя и неизвестную дисперсию (математические ожидания также неизвестны, но могут быть различными), на заданном уровне значимости по выборочным средним возникает необходимость проверки следующей нулевой гипотезы:

H0: M(X1)=M(X2)=…=M(Xp).

Другими словами, необходимо установить, значимо или незначимо различаются выборочные средние.

Для решения такой задачи используется дисперсионный анализ (ANOVA – Analysis of Variance), основанный на сравнении дисперсий.

Впервые дисперсионный анализ был предложен Р. Фишером для обработки результатов агрономических опытов по выявлению условий, при которых испытываемый сорт сельскохозяйственной культуры дает максимальный урожай.

Дисперсионный анализ применяют для того, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор F, который имеет p уровней F1, F2, …. Fp на изучаемую величину X. Например, если требуется выяснить, какой вид удобрения наиболее эффективен для получения наибольшего урожая, то фактор F – удобрение, а его уровни – виды удобрений.

Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием фактора, и «остаточной дисперсии», обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на X; в этом случае средние наблюдаемых значений на каждом уровне (групповые средние) различаются также значимо.

Но прежде чем проводить анализ данных, необходимо проверить гипотезу о равенстве генеральных дисперсий H0: D(X1)=D(X2)=…=D(Xp) по критерию Бартлетта, т.е. гипотезу об однородности дисперсий.

Средняя арифметическая исправленных дисперсий si2, взвешенная по числам степеней свободы (числом степеней свободы дисперсий si2 является число ki=ni-1, т.е. число, на единицу меньшее объема выборки, по которой вычислена дисперсия) равна

. (1)

Критерий Бартлетта – случайная величина, равная

, (2)

распределенная при условии справедливости нулевой гипотезы приближенно как 2 с l-1 (l – число выборок) степенями свободы, если все ki2, т.е. объем каждой из выборок должен быть не менее 4,

где ;.

Критическая область критерия – правосторонняя

Вкр2 (; l-1), область принятия гипотезы: Вкр2 (; l-1).