Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metodichka (data analysis) Part 1 / Metodichka (data analysis) Part 1.doc
Скачиваний:
236
Добавлен:
18.05.2015
Размер:
1.12 Mб
Скачать

Лабораторная работа 6.

Проверка гипотез.

Однофакторный Дисперсионный анализ

И его непараметрические аналоги.

Задание 7: однофакторный дисперсионный анализ

Эрнст Кречмер, немецкий психолог, разделил людей на четыре категории по типу конституции:

  • астеники – обладают цилиндрической формой туловища, имея хрупкое телосложение, высокий рост, плоскую грудную клетку, вытянутое лицо, узкие плечи, длинные нижние конечности, тонкие кости и мышцы:

  • пикники – с богатой жировой тканью, чрезмерной тучностью, маленького или среднего роста, расплывшимся туловищем, большим животом, круглой головой на короткой шее; относительно большие параметры тела при узких плечах придают телу бочкообразную форму; люди этого типа склонны к сутулости:

  • атлетики – имеют хорошую мускулатуру, крепкое телосложение, высокий или средний рост, широкий плечевой пояс и узкие бедра, отчего фронтальный вид тела образует трапецию; жировая прослойка не выражена; лицо имеет форму вытянутого яйца нижняя челюсть хорошо развита.

  • диспластики – строение бесформенное, неправильное, характеризуется различными деформациями телосложения.

Некоторые психологи, вслед за Э. Кречмером, пытались выяснить, связан ли тип конституции с другими характеристиками людей, например, темпераментом, склонностью к определенным болезням, и даже интеллектом. Существовало мнение, что астеники  самый интеллек-туальный тип конституции. Один исследователь решил проверить, связан ли тип конституции с интеллектом человека. Интеллект он определял по тестам Векслера и Равена. Таким образом, в нашем исследовании одна независимая переменная (тип конституции), которая имеет более двух уровней, и две зависимые переменные  результаты измерения интеллекта по тестам Равена и Векслера.

  1. Скопируйте файл Intelligence.sta в свою рабочую папку.

  2. В STATISTICA Module Switcher выберите модуль Basic Statistics и пока нажмите кнопку Cancel.

  3. Откройте файл Intelligence.sta, который находится в вашей рабочей папке. В первом столбце (переменная TYPE) указан тип конституции испытуемого (атлетик  atletic, астеник  astenic и пикник  piknic, диспластиков наш исследователь не нашел или по доброте душевной никого в них не зачислил), во втором столбце (переменная Veksler) приведены значения теста Векслера, в третьем (переменная RAVEN)  теста Равена.

Предположим, что мы хотим проверить гипотезу исследователя о связи типов конституции с интеллектом с помощью однофакторного дисперсионного анализа. Подсчет этого критерия производится в модуле Basic Statistics Breakdown & one-way ANOVA..

    1. Загрузим: Analysis Breakdown & one-way ANOVA … Открывается окно, в котором требуется задать переменные (кнопка Variables).

    2. Зададим переменные: переменная TYPE является независимой (группирующей) переменной, поэтому ее заносим в левое окно; зависимые переменные VEKSLER и RAVEN – поэтому их заносим в правое окно. Нажимаем кнопку ОК. И еще раз ОК.

    3. Выпадает большое окно:

Вверху, на белом фоне описана схема вашего эксперимента (две зависимые переменные и одна независимая, которая имеет три уровня, тут же перечисленные). Многие из кнопок нам уже знакомы. Рассмотрим незнакомые:

Кнопка Summary Table of Means: показывает средние значения зависимых переменных по группам испытуемых и по всей выборке. Их удобно копировать в другие программы, например, в Excel, чтобы строить красивые графики.

Кнопка Detailed two-way tables и кнопка OK показывают таблицы с описательной статистикой, указанной вами в разделе Statistics (причем кнопка Detailed two-way tables не показывает медиану и квартили).

Кнопки Levene и Brown-Forsythe (HOV) дают значения и уровни статистической значимости уже знакомых нам критериев для сравнения дисперсий в разных группах испытуемых. Если критерии не значимы, то дисперсии можно считать одинаковыми.

    1. Проверьте выполнение условия равенства дисперсий в ячейках дисперсионного комплекса. Значимый ли получился критерий Левена? А критерий Brown-Forsythe? Можно ли смело применять дисперсионный анализ?

Кнопка Analysis of Variance дает нам результаты дисперсионного анализа:

SS Effects  SSфакт  означает вариативность признака, обусловленную действием исследуемого фактора. Она также называется межгрупповой компонентой и может быть объяснена различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.

SS Error  Ssслуч  вариативность, обусловленная неучтенными факторами, она же внутригрупповая изменчивость, она же дисперсия ошибки, она же остаточная компонента. Обычно при проведении эксперимента она не может быть предсказана или объяснена

MS  "средний квадрат", или математическое ожидание суммы квадратов, усредненная величина соответствующего SS

df  степени свободы соответствующего SS

F  значение критерия Фишера

р  уровень статистической значимости. Проверка значимости в дисперсионном анализе основана на сравнении компоненты дисперсии, обусловленной межгрупповым разбросом (называемой средним квадратом эффекта или MSэффект) и компоненты дисперсии, обусловленной внутригрупповым разбросом (называемой средним квадратом ошибки или MSошибка). Если верна нулевая гипотеза (равенство средних в двух выборках), то можно ожидать сравнительно небольшое различие выборочных средних из-за чисто случайной изменчивости. Поэтому, при нулевой гипотезе, внутригрупповая дисперсия будет практически совпадать с общей дисперсией, подсчитанной без учета групповой принадлежности. Полученные внутригрупповые дисперсии можно сравнить с помощью F-критерия, проверяющего, действительно ли отношение дисперсий значимо больше 1.

    1. Нажмите кнопку Analysis of Variance. Посмотрите результаты. Показатели какого теста зависят от типа конституции? Найдите степени свободы, значение критерия, уровень статистической значимости и правильно запишите результаты анализа.

Кнопка Interaction Plots  очень полезная кнопка! Нажав на нее, вы увидите наглядное представление ваших данных.

    1. Нажмите ее и рассмотрите графики. По оси X отложен тип конституции, по оси Y  значения теста Векслера (синяя линия) и теста Равена (красная линия). Подтверждается ли гипотеза о том, что астеники – интеллектуальный тип конституции? Что можно сказать про атлетиков? Стоит ли у них списывать? Какие выводы можно сделать о соотношении значений двух тестов на интеллект  Векслера и Равена?

Кнопка Post-hoc comparisons of means показывает результаты применения апостериорных критериев. Сначала требуется выбрать переменные для анализа. Затем следует выбрать подходящий апостериорный критерий:

LSD test or planned comparison  least significant difference test  не принимает во внимание множественность сделанных сравнений, а возрастающий риск допустить ошибку I рода просто игнорируется.

Newman-Keuls & critical ranges и Duncan's multiple range test & critical ranges  эти два критерия принимают во внимание количество сделанных сравнений и вычисляют уровни статистической значимости соответственно.

Sheffe test и Turkey honest significance difference (HSD) test еще более консервативные критерии, которые корректируют вероятность сделать ошибку I рода, уменьшая пороговый уровень статистической значимости каждого сравнения. Критерий Тьюки более чувствителен к интра-индивидуальной схеме, а критерий Шефе  к сложным смешанным сравнениям.

    1. Так как зависимость интеллекта по тесту Равена от типа конституции оказалась значимой, то посчитаем для этого случая апостериорные критерии. Нажмите кнопку Post-hoc comparisons of means и выберите сначала LSD test or planned comparison. Между какими группами разница в интеллекте получилась значимой? Какие группы не отличаются по интеллекту?

    2. Пересчитайте все апостериорные критерии по очереди. Сравните результаты. Каким критерием лучше всего пользоваться?

Задание 8: критерий Краскалла-Уоллиса

Непараметрическим аналогом однофакторного дисперсионного анализа для несвязных выборок служит критерий Краскала-Уоллиса. Его можно посчитать в модуле Nonparametrics/Ditrib, Проведем вычисления для тех же данных.

    1. Загрузите этот модуль

    2. Закройте модуль Basic Statistics

    3. В модуле Nonparametrics/Ditrib. выберите Kruskal-Wallis ANOVA, median test. При нажатии на эту кнопку одновременно считаются два критерия  критерий Краскала-Уоллиса и критерий медианы. Интерпретация результатов критерия Краскала-Уоллиса аналогична интерпретации результатов однофакторного дисперсионного анализа. Отличие заключается лишь в том, что этот критерий основан на рангах, а не на средних значениях. Критерий медианы  грубая версия критерия Краскалла-Уоллиса, так как данные преобразуются в таблицу сопряженности. Программа просто считает число измерений, которые лежат выше и ниже медианы и вычисляет уже знакомый нам хи-квадрат Пирсона для получившейся таблицы размером 2xk. Критерий медианы бывает полезен, когда шкала содержит искусственные ограничения (например, наблюдается потолочный эффект и многие измерения оказываются "за шкалой").

    4. Выберите переменные (кнопка Variables). Группирующей переменной (grouping variable) будет, как и раньше, переменная TYPE, а зависимыми – переменные RAVEN и VEKSLER. В данном случае программа не показывает одновременно результаты по двум зависимым переменным, поэтому лучше сначала посчитать критерий Краскала-Уоллиса для одной из них, а потом для другой. Выберите в качестве зависимой переменной значения по тесту Равена. Нажмите ОК.

    5. Теперь надо задать коды для группирующей переменной. Нажмите кнопку Codes. В открывшемся окне кнопка View показывает, какие значения имеет независимая переменная, а кнопка All служит для выбора всех ее значений. Если же по каким-то причинам вы хотите использовать только некоторые значения, то придется набирать их вручную. В нашем случае значений у группирующей переменной только три и выбирать не из чего (критерий Краскала-Уоллиса становится аналогом критерия Манна-Уитни, если независимая переменная имеет всего два значения). Поэтому смело нажимаем кнопку All, потом ОК и еще раз ОК.

    6. На экране появляются две таблички. Это и есть результаты. Окно, которое находится сверху, представляет значения критерия медианы. Оттащите его вниз и рассмотрите результаты критерия Краскала-Уоллиса. Для каждого уровня независимой переменной приведены ее код, число значений и ранговая сумма. Значение самого критерия и его уровень статистической значимости приведены вверху таблицы. Найдите их. Можно ли утверждать, что интеллект зависит от типа конституции?

    7. Если вы являетесь энтузиастом мат. статистики, можете рассмотреть и результаты критерия медианы. Его значение (это хи-квадрат) и уровень статистической значимости приведены вверху таблички. Сама же табличка содержит количества испытуемых, чьи значения по тесту Равена оказались меньше или равными медиане (строчка "<= median observed") по группам (это получаются эмпирические частоты), потом теоретические частоты и разницу между ними. В строчке "> median observed" даны количества испытуемых, чьи значения по тесту Равена оказались больше медианы по группам, потом теоретические частоты и разницу между ними. Сравните результаты двух критериев.

    8. Аналог графического представления данных дисперсионного анализа вы можете получить, нажав на кнопку Box & whisker. Выберите переменную RAVEN, нажмите ОК, и еще раз ОК. Рассмотрите «ящики с усами». Проинтерпретируйте результаты.

    9. Теперь посчитай то же самое для переменной VEKSLER. Можно ли сделать вывод, что интеллект (по Векслеру) зависит от типа конституции?

Программа STATISTICA не считает апостериорные критерии для критерия Краскала-Уоллиса. Поэтому, хотя мы и можем сделать вывод о том, что интеллект зависит от типа конституции, если критерий значимый, но сказать, между какими двумя группами (или тремя, или всеми) разница есть, мы не можем.

    1. Вспомните, что можно сделать в этом случае. Попробуйте проверить, между какими группами есть разница в интеллекте по тесту Равена.

Задание 9: критерий Фридмана

Критерий Фридмана является непараметрическим аналогом однофакторного дисперсионного анализа для связных выборок. Предположим, мы интересуемся, как развивается социальный интеллект в подростковом возрасте. Тест для измерения социального интеллекта давался ученикам некоторой школы каждый год в шестом, седьмом, восьмом и девятом классах (12, 13, 14 и 15 лет). Требуется определить, как изменились показатели социального интеллекта с возрастом.

    1. Скопируйте файл Social Intelligence.sta в свою рабочую папку.

    2. Откройте этот файл в программе STATISTICA, прямо в том же самом модуле Nonparametrics/Disrib..

    3. Обратите внимание, как набраны данные в файле: каждый столбец содержит значения теста социального интеллекта в определенном классе. В ДАННОМ СЛУЧАЕ НЕТ ГРУППИРУЮЩЕЙ ПЕРЕМЕННОЙ! В левом столбце приведены не порядковые номера испытуемых, а их имена.

    4. Посчитаем критерий Фридмана: Analysis Friedman ANOVA & Kendall’s concordance … Выбираем переменные (кнопка Variables). Их у нас четыре: FORM_6, FORM_7, FORM_8 и FORM_9. Нажимаем два раза ОК и получаем результаты! Вверху таблички приведены значение критерия Фридмана и его уровень статистической значимости, а также коэффициент согласованности Кендалла. Коэффициент согласованности Кендалла выражает одновременную зависимость между k зависимыми выборками. Например, он часто используется для определения надежности экспертных оценок. Можно сказать, что коэффициент согласованности – это среднее всех коэффициентов корреляции Спирмена между переменными:

average Spearman R = (k * concordance -1)/(k-1)

Можете просто не обращать на него внимания. Ниже для каждого года обучения приведены средние ранги, ранговые суммы, средние значения и стандартные отклонения.

Значимый ли получился критерий? Что можно сказать о зависимости социального интеллекта от возраста подростка? Рассмотрим подробнее эту зависимость.

    1. Нажмите кнопку Continue и кнопку Box & whisker, потом ОК. Проанализируйте, как менялся социальный интеллект с годами. Росли ли средние значения? Стали ли дети более однородными по социальному интеллекту к 9 классу? Что происходило с минимальными и максимальными значениями?

Программа STATISTICA не считает апостериорные критерии для критерия Фридмана тоже! Поэтому, хотя мы и можем сделать вывод о том, что социальный интеллект изменяется с возрастом, если критерий значимый, но сказать, между какими двумя группами (или тремя, или всеми) разница есть, нельзя.

    1. Придумайте, что делать теперь, если мы хотим проверить, значимо ли изменился социальный интеллект подростков с 6-го до 7-го класса, с 7-го до 8-го и с 8-го до 9-го.

Напишите отчет в MS Word. Этот отчет должен представлять собой серьезный анализ и интерпретацию данных только для одного какого-либо задания данной лабораторной работы – 7-го, 8-го или 9-го. Опишите гипотезу исследования, получившиеся результаты, обязательно включите апостериорный анализ. Не забудьте указать значения критериев и уровни статистической значимости. Проиллюстрируйте ваш отчет графиками и таблицами. Графики попробуйте построить в программе Excel или MS Graph.