Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Педагогический Университет им. М. Акмуллы

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Гмурман.doc

Скачиваний:

Добавлен:

01.03.2025

Размер:

4.92 Mб

Скачать

☆

<<< < Предыдущая 97 98 99 100 101 102 103 104 105 106 107 108109 / 139109 110 111 112 113 114 115 116 117 118 119 120 121 > Следующая >>>

§ 1. Сравнение нескольких средних. Понятие о дисперсионном анализе

Пусть генеральные совокупности X_lt Х₂, ..., Х_рраспределены нормально и имеют одинаковую, хотя и неизвестную, дисперсию; математические ожидания также неизвестны, но могут быть различными. Требуется при заданном уровне значимости по выборочным средним проверить нулевую гипотезу Н₀:М (Х_х) = М (Х₂) = ... = =М (Хр) о равенстве всех математических ожиданий. Другими словами, требуется установить, значимо или незначимо различаются выборочные средние. Казалось бы, для сравнения нескольких средних (р > 2) можно сравнить „их попарно. Однако с возрастанием числа средних возрастает и наибольшее различие между ними: среднее новой выборки может оказаться больше наибольшего или меньше наименьшего из средних, полученных до нового опыта. По этой причине для сравнения нескольких средних пользуются другим методом, который основан на сравнении дисперсий и поэтому назван дисперсионным анализом (в основном развит английским статистиком Р. Фишером).

На практике дисперсионный анализ применяют, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор F, который имеет р уровней F_lt F₂, ..., F_p на изучаемую величину X. Например, ^если требуется выяснить, какой вид удобрений наиболее ^эФфективен для получения наибольшего урожая, то фактор р—удобрение, а его уровни — виды удобрений.

Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием Фактора, и «остаточной дисперсии», обусловленной слу-^Чайными причинами. Если различие между этими дис-

349

персиями значимо, то фактор оказывает существенн влияние на X; в этом случае средние наблюдаемых чений на каждом уровне (групповые средние) ются также значимо.

Если уже установлено, что фактор существенно влияет на X, а требуется выяснить, какой из уровней оказьь вает наибольшее воздействие, то дополнительно про_Из* водят попарное сравнение средних.,

Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предположению; если дисперсионный анализ покажет, что и мате-матические ожидания одинаковы, то в этом смысле сово-купности однородны). Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы.

В более сложных случаях исследуют воздействие нескольких факторов на нескольких постоянных или случайных уровнях и выясняют влияние отдельных уровней и их комбинаций (многофакторный анализ).

Мы ограничимся простейшим случаем однофакторного анализа, когда на X воздействует только один фактор, который имеет р постоянных уровней.

§ 2. Общая факторная и остаточная суммы квадратов отклонений

Пусть на количественный нормально распределенный признак X воздействует фактор F, который имеет р постоянных уровней. Будем предполагать, что число

Таблица 30

Номер испытания	Уровни фактора F.
Номер испытания	F,	Ft	...
] 2 Я	Хц Hi XqX	Хц 22 Хер,*	...	^Х1р ^Хър Xqp
Групповая средняя	*гр	*Гр2		*Грр

350

наблюдений (испытаний) на каждом уровне одинаково и равно q.

Пусть наблюдалось n — pq значений х^ признака X, _где i — номер испытания (i = 1, 2, ..., q), j—номер уровня фактора (/=1, 2, ...,р). Результаты наблюдений приведены в табл. 30.

Введем, по определению,

S =2 2 (х- —xY

(общая сумма квадратов отклонений наблюдаемых значе-_нцй от общей средней х),

р _ _

/ = 1 ^ ^J

(факторная сумма квадратов отклонений групповых средних от общей средней, которая характеризует рассеяние «между группами»),

+ .S (,, _r^Y+ + 2 (i_prppy

(остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней, которая характеризует рассеяние «внутри групп»).

Практически остаточную сумму находят по равенству (см. § 3, следствие)

О о С

°ост '-'общ ^факт*

Элементарными преобразованиями можно получить формулы, более удобные для расчетов:

•W=I ( 2) R) \я 1 - \( S R/ ] I {ря) I. (**)

я ^гАеР_у.₌ 2 xfj—сумма квадратов значений признака на

Уровне F,\ R,= 2 x./—сумма значений признака на

351

Замечание. Для упрощения вычислений вычитают из каждо_гнаблюдаемого значения одно и то же число С, примерно равц_Ср общей средней. Если уменьшенные значения (/,у = лс,-у — С, то

S /=1

(***) (****)

4>aKT

где Qy = ^£j ylj — сумма квадратов уменьшенных значений признака i=l

на уровне Fj\ Tj= 2 У// — сумма уменьшенных значений признака

i=l на уровне Fj.

Для вывода формул (***) и (****) достаточно подставить дг,-у = J/,y -f С

ч я ч_

в соотношение (*) и #_у= 2 лг/у = 2 («/,y + Q = 2

«= 1 (= 1 «= 1

в соотношение (**).

Пояснения. 1. Убедимся, что S_$aKT характеризует воздействие фактора F. Допустим, что фактор оказывает существенное влияние на X. Тогда группа наблюдаемых значений признака на одном определенном уровне, вообще говоря, отличается от групп наблюдений на других уровнях. Следовательно, различаются и групповые средние, причем они тем больше рассеяны вокруг общей средней, чем большим окажется воздействие фактора. Отсюда следует, что для оценки воздействия фактора целесообразно составить сумму квадратов отклонений групповых средних от общей средней (отклонение возводят в квадрат, чтобы исключить погашение положительных и отрицательных отклонений). Умножив эту сумму на q, получим ^кт- Итак, 5_факт характеризует воздействие фактора.

2. Убедимся, что S_0CT отражает влияние случайных причин. Казалось бы, наблюдения одной группы не должны различаться. Однако, поскольку на X, кроме фактора F, воздействуют и случайные причины наблюдения одной и той же группы, вообще говоря, различны и, значит, рассеяны вокруг своей групповой средней. Отсюда следует, что для оценки влияния случайных причин целесообразно составить сумму квадратов отклонении наблюдаемых значений каждой группы от своей групповой средней, т. е. S_0CT. Итак, 5_0СТ характеризует воздействие случайных причин.

352

3. Убедимся, что 5_о6щ отражает влияние и фактора и случайных причин. Будем рассматривать все наблюдения как единую совокупность. Наблюдаемые значения признака различны вследствие воздействия фактора и случайных причин. Для оценки этого воздействия целесообразно составить сумму квадратов отклонений наблюдаемых значений от общей средней, т. е. 5_о6щ.

Итак, S_o6ul характеризует влияние фактора и случайных причин.

Приведем пример, который наглядно показывает, что факторная сумма отражает влияние фактора, а остаточная—влияние случайных причин.

Пример. Двумя приборами произведены по два измерения физической величины, истинный размер которой равен х. Рассматривая в качестве фактора систематическую ошибку С, а в качестве его уровней — систематические ошибки С_х и С₂ соответственно первого и второго прибора, показать, что 5ф_акт определяется систематическими, a S_OCT — случайными ошибками измерений.

Решение. Введем обозначения: а_ь а₂ — случайные ошибки первого и второго измерений первым прибором; p_lt Р₂ — случайные ошибки первого и второго измерений вторым прибором.

Тогда наблюдаемые значения результатов измерений соответственно равны (первый индекс при х указывает номер измерения, а второй — номер прибора):

Средние значения измерений первым и вторым приборами соответственно равны:

Общая средняя

*= (*г_Р г + *г_Р г)/2 = х + [(С_х +CJ/2) + [(а + Р)/2], факторная сумма

5факт = (*гр 1 — *)* + (*гр г — *)²-

Подставив величины, заключенные в скобках, после элементарных преобразований получим

Мы видим, что S,j,_aKT определяется главным образом, первым слагаемым (поскольку случайные ошибки измерений малы) и, следо-^аательно, действительно отражает влияние фактора С.

Остаточная сумма

"^ост = (*п — *гр l)² + (*21 — *гр l)² + (^xi% —*гр г)² + (*аа Подставив величины, заключенные в скобках, получим

12-181 353

Мы видим, что S_0CT определяется случайными ошибками измеп ний и, следовательно, действительно отражает влияние случайн причин. ^Ь|*

Замечание. То, что S_OCT порождается случайными причинам следует также из равенства (см. § 3, следствие) •

Действительно, S₀6ik является результатом воздействия фактов и случайных причин; вычитая 5ф_акт, мы исключаем влияние фактора Следовательно, «оставшаяся часть» отражает влияние случайньт* причин. ^х

<<< < Предыдущая 97 98 99 100 101 102 103 104 105 106 107 108109 / 139109 110 111 112 113 114 115 116 117 118 119 120 121 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
03.05.20191.04 Mб9ГЛАВА 6.doc
#
01.05.2025205.31 Кб0Глава 8,9.doc
#
07.05.20195.45 Mб24Глава I ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ.doc
#
07.05.2019943.62 Кб31Глава II ИНТЕРФЕРЕНЦИЯ СВЕТА.doc
#
07.03.2016730.38 Кб24Глагол_презентации, история англ.языка.pdf
#
01.03.20254.92 Mб11Гмурман.doc
#
26.09.20191.07 Mб67Голуб Г.Б. Метод проектов.doc
#
01.05.202572.22 Кб6голубцы.docx
#
02.09.2019140.81 Кб32ГОРИ.docx
#
25.04.201995.11 Кб26ГОс экономика предприятия.docx
#
25.08.2019211.97 Кб25ГОС_АрхЭВМ_гр55.doc