Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика. 5 лекция.doc
Скачиваний:
51
Добавлен:
15.04.2015
Размер:
131.58 Кб
Скачать

Лекция 5

Основы дисперсионного анализа

Основные вопросы лекции:

  1. Общая идея дисперсионного анализа.

  2. Однофакторный комплекс.

  3. Двухфакторный комплекс.

  4. Дисперсионный анализ с неравным числом наблюдений в ячейке.

Общая идея дисперсионного анализа.

Дисперсионный анализ позволяет ответить на вопрос о наличии существенного влияния некоторых факторов на изменчивость фактора, значения которого могут быть получены в результате опыта. При проверке статистических гипотез предполагается случайность вариации изучаемых факторов. Дисперсионный анализ даёт возможность установить, существенное ли влияние оказывает тот или иной из рассматриваемых факторов на изменчивость признака, а также определить количественно «удельный вес» каждого из источников изменчивости в их общей совокупности.

Но дисперсионный анализ позволяет дать положительный ответ лишь о наличии существенного влияния, в противном случае вопрос остаётся открытым и требует дополнительных исследований (чаще всего – увеличения числа опытов).

Если факторы, вызывающие изменчивость среднего значения признака, принадлежат одному источнику, то существует одна группировка, или однофакторный дисперсионный анализ, и далее двойная группировка – двухфакторный, трёхфакторный и т.д.

Сущность дисперсионного анализа состоит в выделении и оценке отдельных факторов, вызывающих изменчивость. С этой целью производят разложение общей дисперсии наблюдаемой частичной совокупности, вызванной всеми источниками изменчивости, в общей совокупности. Для проверки значимости этих составляющих оценок дисперсии их сравнивают с общей дисперсией в общей совокупности (по критерию Фишера). Например, в двухфакторном анализе получается разложение в виде:

,

Где - общая дисперсия изучаемого признака С;

- доля дисперсии, вызванная влиянием фактора А;

- доля дисперсии, вызванная влиянием фактора В;

- доля дисперсии, вызванная взаимодействием факторов А и В;

- доля дисперсии, вызванная неучтёнными случайными причинами (случайная дисперсия).

[Править] Дисперсионный анализ.

Дисперсионный анализ применяют для изучения влияния качественных признаков на количественную переменную. Например, пусть имеются kвыборок результатов измерений количественного показателя качества единиц продукции, выпущенных наkстанках, то есть набор чисел (x1(j),x2(j),...,xn(j)), гдеj— номер станка,j= 1,2,...,k, аn— объем выборки. В распространенной постановке дисперсионного анализа предполагают, что результаты измерений независимы и в каждой выборке имеют нормальное распределениеN(m(j),σ2) с одной и той же дисперсией. Хорошо разработаны и непараметрические постановки. Проверка однородности качества продукции, то есть отсутствия влияния номера станка на качество продукции, сводится к проверке гипотезы

.

В дисперсионном анализе разработаны методы проверки подобных гипотез. Теория дисперсионного анализа и расчетные формулы рассмотрены в специальной литературе.

Гипотезу H0проверяют против альтернативной гипотезыH1, согласно которой хотя бы одно из указанных равенств не выполнено. Проверка этой гипотезы основана на следующем «разложении дисперсий», указанном Р. А. Фишером:

, (7)

где s2— выборочная дисперсия в объединенной выборке, то есть

.

Далее, s2(j) — выборочная дисперсия вj-ой группе,

.

Таким образом, первое слагаемое в правой части формулы (7) отражает внутригрупповую дисперсию. Наконец, — межгрупповая дисперсия,

.

Область прикладной статистики, связанную с разложениями дисперсии типа формулы (7), называют дисперсионным анализом. В качестве примера задачи дисперсионного анализа рассмотрим проверку приведенной выше гипотезы H0в предположении, что результаты измерений независимы и в каждой выборке имеют нормальное распределениеN(m(j),σ2) с одной и той же дисперсией. При справедливостиH0первое слагаемое в правой части формулы (7), деленное на σ2, имеет распределение хи-квадрат сk(n− 1) степенями свободы, а второе слагаемое, деленное на σ2, также имеет распределение хи-квадрат, но с (k− 1) степенями свободы, причем первое и второе слагаемые независимы как случайные величины. Поэтому случайная величина

имеет распределение Фишера с (k− 1) степенями свободы числителя иk(n− 1) степенями свободы знаменателя. ГипотезаH0принимается, если, и отвергается в противном случае, гдеF1 − α— квантиль порядка 1 − α распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что приH1величинаFбезгранично увеличивается при росте объема выборокn. ЗначенияF1 − αберут из соответствующих таблиц [8].

Разработаны непараметрические методы решения классических задач дисперсионного анализа [19], в частности, проверки гипотезы H0.