Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по ЭП.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
495.62 Кб
Скачать

2. Параметрические методы проверки гипотез

Параметрический метод — это метод статистического вывода, который применяется в отношении парамет­ров генеральной совокупности. Самым главным параметром для параметриче­ских методов является нормальное распределение переменных и, как следствие, правомерность применения таких статистик, как среднее значение и стандартное отклонение.

Дисперсионный анализ

Однофакторный дисперсионный анализ

Одиофакториый дисперсионный анализ (ANOVA) — определяет стати­стическую достоверность различия между выборками путем сравнения их сред­них значений.

Ближайшим и бо­лее простым аналогом ANOVA является Т-критерий, В отличие от Т-критерия дисперсионный анализ пред­назначен для сравнения не двух, а нескольких выборок. Слово «дисперсионный» в названии указывает на то, что в процессе анализа сопоставляются компоненты дисперсии изучаемой переменной. Общая изменчивость переменной раскла­дывается на две составляющие: межгрупповую (факторную), обусловленную различием групп (средних значений), и внутригрупповую (ошибки), обуслов­ленную случайными (неучтенными) причинами.

Слово «однофакторный» означает, что в ней можно задать единственную зависимую переменную (при этом она обязательно должна быть количественного типа) и единственную независимую переменную (всегда номинативную имеющую несколько градаций). Различные модели дисперсионного анализа, допускают наличие нескольких независимых переменных. Многомерный дисперсионный анализ, позволяет анализировать как множество независимых, так и множество зависимых переменных.

Мы например можем сравнить три класса по результатам одного теста.

«Однофакторность» анализа заключается в том, что де­ление на группы производилось по градациям одной независимой переменной клаcc).

Многофакторный дисперсионный анализ

Здесь речь пойдет о дисперсионном анализе (ANOVA) с двумя и более фак­торами. В нем участвует единственная зависимая переменная, которая, как и при однофакторном дисперсионном анализе, должна быть метрической (количественного типа). Главное от­личие многофакторного анализа от однофакторного заключается в том, что в нем участвуют не одна, а несколько независимых переменных, каждая из которых представлена в номинативной шкале (имеет несколько градаций, или уровней).

Пример дисперсионного анализа с двумя факторами. В качестве зависимой переменной мы возьмем переменную отметка, а роль независимых будут играть переменные пол и хобби. Мы попытаемся определить степень влияния переменных пол, хобби и их взаимодействия с переменной отметка.

Исследование позволит получить ответы на вопросы. 1. Существует ли главный эффект фактора пол, то есть существует ли значимые различие оценок для юношей и девушек, и какова степень этого различия?

2. Существует ли главный эффект фактора хобби, то есть существует ли значимое различие оценок между тремя группами, и какова степень этого различия

3. Существует ли взаимодействие переменных пол и хобби, то есть зависит ли влияние одной из этих переменных от градаций другой?

Таким образом, двухфакторный дисперсионный анализ позволяет проверить три гипотезы: две о главном эффекте и одну о взаимодействии факторов. Ответы на два первых вопроса можно было бы получить, применив дважды однофакторный дисперсионный анализ.

Специфика многофакторного анализа проявляется в содержании третьего вопроса, который касается взаимодействия факторов

Взаимодействие двух факторов означает, что влияние одного из них проявляет­ся по-разному на разных уровнях другого фактора.

При дисперсионном анализе с тремя и более факторами изучается влияние на переменную «отметка» трех факторов: пол, хобби и класс.

Применение трехфакториого дисперсионного анализа позволило бы получить ответы на следующие вопросы:

  1. Существует ли главный эффект фактора пол, то есть существует ли значимое различие оценок для юношей и девушек, и какова степень этого различия?

  2. Существует ли главный эффект фактора хобби, то есть существует ли значимые различия оценок между тремя группами, и какова степень этого различия?

  3. Существует ли главный эффект фактора класс, то есть существует ли значимые различие оценок между классами, и какова степень этого различия?

  4. Существует ли взаимодействие переменных пол и хобби, то есть зависит ли влияние одной из этих переменных от градаций другой?

  5. Существует ли взаимодействие переменных пол и класс, то есть зависит ли влияние одной из этих переменных от градаций другой?

  6. Существует ли взаимодействие переменных класс и хобби, то есть зависит ли влияние одной из этих переменных от градаций другой?

  7. Существует ли взаимодействие переменных пол, хобби и класс, то есть зави­сит ли взаимодействие двух из этих переменных от градаций третьей?

Таким образом, трехфакторный дисперсионный анализ предполагает проверку уже семи гипотез. Из них три гипотезы касаются взаимодействия первого поряд­ка (двух факторов) и одна — взаимодействия второго порядка (трех факторов).

При увеличении числа факторов быстро возрастает не только количество прове­ряемых гипотез, но и сложность интерпретации взаимодействий. Если, как мы увидим далее, интерпретация взаимодействия первого порядка (двух факторов) обычно не составляет труда, то взаимодействие второго порядка обязательно требует построения графиков средних значений, а интерпретация взаимодействия третьего порядка и выше вряд ли вообще возможна.

Многомерный дисперсионный анализ

Это методы обработки данных, которые содержат несколь­ко зависимых переменных: многомерный дисперсионный анализ (Multivariate Analysis Of Variances, MANOVA) и многомерный ковариационный анализ (Multi­variate Analysis Of Covariance, MANCOVA) относятся к наиболее сложным методам.

Как упоминалось в предыдущих темах, t-критерий для двух выборок позволяет выяснить, существуют ли различия между двумя средними значениями для выборок. Эту простейшую ситуацию (единственная независимая переменная двумя градациями и одна зависимая переменная метрического типа) можно последовательно усложнить двумя способами:

  1. Ввести в рассмотрение независимую переменную с более чем двумя градациями в такой ситуации применяется однофакторный дисперсионный анализ

  2. Ввести не одну, а несколько независимых переменных — для этого предназначен многофакторный дисперсионный анализ;

Во всех случаях зависимая переменная остается единственной. Тем не менее существуют задачи, в которых требуется учитывать не одну, а несколько зависимых переменных.

В многомерном дисперсионном анализе возможно проведение анализа с участием более чем одной зависимой переменной.

Представим себе, что нам необходимо сравнить мужчин и женщин (переменная пол) одновременно но по всем пяти показателям теста (переменные тест1, ..., тест5). В подобной ситуации одним из возможных подходов является пятикратное применение т-критерия или одиофакторного дисперсионного анализа (эти методы эквивалентны, поскольку t2 = F). Очевидным достоинством такого решения является простота и ясность, однако нельзя не заметить и двух недостатков: во-первых, при неоднократном применении статистического критерия (в данном случае пятикратном) увеличивается вероятность ошибки, то есть вероятность случайности общего результата исследования во-вторых, если между зависимыми переменными имеется некоторая корреляция (а в рассматриваемом случае она есть), то результат, полученный в отношении каждой из этих переменных в отдельности, не способен отразить этот важный фактор.

Особенностью всех типов многомерного анализа является то, что они обрабатывают все зависимые переменные одновременно.

В качестве примера можно привести результаты эксперимента эффективности запоминания слов в зависимости от частоты их встречаемости и от интонации, с которой они предъявлялись (зачитывались).

Ряды из 24 несвязанных по смыслу слов одинаковой длины зачитывались 20 испытуемым. Сразу после предъявления испытуемых просили воспроизвести эти слова. Подсчитывалось количество правильно воспроизведенных слов из начала ряда - первых 8 слов (переменная 1), из середины ряда (переменная 2) и из конца ряда — завершающих 8 слов (переменная 3).

Другая переменная соответствует делению испытуемых на две группы: первой (инт =1) все слова читались с одинаковой интонацией; второй (инт = 2) середина ряда интонационно выделялась.

Еще одной переменной соответствует деление испытуемых на кому предъявлялся ряд часто встречающихся слов (част = 1), и тех, кому предъявлялся ряд редко встречающихся слов (част = 2).

Таким образом, данные по­зволяют проверить гипотезы о влиянии двух независимых переменных (инт — интонация, част — частота) на три зависимые переменные (начало1, средн1, конец1).

Для многомерного анализа необходимо иметь как минимум две зависимые пере­менные (иначе аиализ не является многомерным) и как минимум одну независи­мую переменную. Теоретически количество зависимых и независимых перемен­ных не ограничено, однако на практике объем выборки диктует необходимость существенного ограничения их числа.