20. Какова цель дисперсионного анализа? Запишите модель однофакторного дисперсионного анализа.

Дисперсионный анализ

Дисперсионный анализ применяют для изучения влияния качественных признаков на количественную переменную. Например, пусть имеются k выборок результатов измерений количественного показателя качества единиц продукции, выпущенных на k станках, т.е. набор чисел (x₁(j), x₂(j), … , x_n(j)), где j – номер станка, j = 1, 2, …, k, а n – объем выборки. В распространенной постановке дисперсионного анализа предполагают, что результаты измерений независимы и в каждой выборке имеют нормальное распределение N(m(j), σ²) с одной и той же дисперсией. Хорошо разработаны и непараметрические постановки [19].

Проверка однородности качества продукции, т.е. отсутствия влияния номера станка на качество продукции, сводится к проверке гипотезы

H₀: m(1) = m(2) = … = m(k).

В дисперсионном анализе разработаны методы проверки подобных гипотез. Теория дисперсионного анализа и расчетные формулы рассмотрены в специальной литературе [20].

Гипотезу Н₀ проверяют против альтернативной гипотезы Н₁, согласно которой хотя бы одно из указанных равенств не выполнено. Проверка этой гипотезы основана на следующем «разложении дисперсий», указанном Р.А.Фишером:

(7)

где s² – выборочная дисперсия в объединенной выборке, т.е.

Далее, s²(j) – выборочная дисперсия в j-ой группе,

Таким образом, первое слагаемое в правой части формулы (7) отражает внутригрупповую дисперсию. Наконец, - межгрупповая дисперсия,

Область прикладной статистики, связанную с разложениями дисперсии типа формулы (7), называют дисперсионным анализом. В качестве примера задачи дисперсионного анализа рассмотрим проверку приведенной выше гипотезы Н₀ в предположении, что результаты измерений независимы и в каждой выборке имеют нормальное распределение N(m(j), σ²) с одной и той же дисперсией. При справедливости Н₀ первое слагаемое в правой части формулы (7), деленное на σ², имеет распределение хи-квадрат с k(n-1) степенями свободы, а второе слагаемое, деленное на σ², также имеет распределение хи-квадрат, но с (k-1) степенями свободы, причем первое и второе слагаемые независимы как случайные величины. Поэтому случайная величина

имеет распределение Фишера с (k-1) степенями свободы числителя и k(n-1) степенями свободы знаменателя. Гипотеза Н₀ принимается, если F < F_1-α, и отвергается в противном случае, где F_1-α – квантиль порядка 1-α распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н₁ величина F безгранично увеличивается при росте объема выборок n. Значения F_1-α берут из соответствующих таблиц [8].

Разработаны непараметрические методы решения классических задач дисперсионного анализа, в частности, проверки гипотезы Н₀.

Однофакторная дисперсионная модель имеет вид:

x_ij = м + F_j+ е_ij, (1)

где х_ij - значение исследуемой переменой, полученной на i-м уровне фактора (i=1,2,...,т) c j-м порядковым номером (j=1,2,...,n);

F_i - эффект, обусловленный влиянием i-го уровня фактора;

е_ij- случайная компонента, или возмущение, вызванное влиянием неконтролируемых факторов, т.е. вариацией переменой внутри отдельного уровня.

Основные предпосылки дисперсионного анализа:

- математическое ожидание возмущения е_ij равно нулю для любых i, т.е.

M(е_ij) = 0, (2)

- возмущения е_ij взаимно независимы;

- дисперсия переменной x_ij (или возмущения е_ij) постоянна для любых i, j, т.е.

D(е_ij) = у², (3)

- переменная x_ij (или возмущение е_ij) имеет нормальный закон распределения N(0;у²).

Влияние уровней фактора может быть как фиксированным или систематическим (модель I), так и случайным (модель II).

Пусть, например, необходимо выяснить, имеются ли сущест-венные различия между партиями изделий по некоторому показа-телю качества, т.е. проверить влияние на качество одного фактора - партии изделий. Если включить в исследование все партии сырья, то влияние уровня такого фактора систематическое (модель I), а полученные выводы применимы только к тем отдельным парти-ям, которые привлекались при исследовании. Если же включить только отобранную случайно часть партий, то влияние фактора случайное (модель II). В многофакторных комплексах возможна смешанная модель III, в которой одни факторы имеют случайные уровни, а другие - фиксированные.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 159 10 11 12 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
30.04.2015103.94 Кб33Вопросы к ГОСу бакалавры зоотехния.doc
#
24.03.201528.16 Кб31Вопросы к зачету по стратегии устного перевода.doc
#
24.03.201568.61 Кб33Вопросы к экзамену виноградарство.doc
#
24.03.201526.62 Кб13ВОПРОСЫ К ЭКЗАМЕНУ по БФО.doc
#
24.03.201524.26 Кб56Вопросы к экзамену по земледелию.docx
#
13.09.20195.36 Mб9ВОПРОСЫ контр матстат.doc
#
24.03.201515.54 Кб18Вопросы ланд ИСПИ 1 курс 1 сем.docx
#
24.03.201537.38 Кб9вопросы магистры.doc
#
02.09.2019147.97 Кб5Вопросы Магистры.doc
#
24.03.201565.02 Кб16вопросы по агрометеорологии, ботанике.doc
#
24.03.201516.28 Кб13Вопросы по коллоквиумам (Переработка мяса).docx