Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

m08-37

.pdf
Скачиваний:
13
Добавлен:
06.03.2016
Размер:
1.18 Mб
Скачать

Альтернативная гипотеза – это гипотеза о значимости различий. Она обозначается как H1. Альтернативная гипотеза – это то, что доказывается, поэтому иногда она называется экспериментальной гипотезой.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Различия гипотез можно представить следующим образом:

Направленная нулевая гипотеза: Х1 не превышает Х2. Направленная альтернативная гипотеза: Х1 превышает Х2. Ненаправленная нулевая гипотеза: Х1 не отличается от Х2. Ненаправленная альтернативная гипотеза: Х1 отличается от Х2.

При описании каждого критерия в руководстве даны формулировки гипотез, которые он позволяет проверить.

1.4. Статистические критерии

Согласно Г.В. Суходольскому, статистический критерий – это решающее правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с высокой вероятностью.

Статистический критерий – это математический метод расчета числа, позволяющего определить принятие или отклонение гипотезы исследования. Критерий имеет эмпирическое и критическое значение. Эмпирическое значение критерия – это число, полученное по правилу расчета критерия. Критическое значение критерия – это число, которое определено для данного критерия при заданных переменных (например, число человек в выборке), выделяющее зону значимости и незначимости для признака.

По соотношению эмпирического и критического значений критерия делается вывод о том, подтверждается или опровергается нулевая гипотеза. Например, если χЭМП > χкр, то Н0 отвергается.

Вбольшинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий Манна – Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила. Эти правила оговариваются в описании каждого из представленных в руководстве критериев.

Внекоторых случаях расчетная формула критерия включает в себя

количество наблюдений в исследуемой выборке, обозначаемое как n. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице, прилагаемой к каждому статистическому критерию, необходимо определить, какому уровню статистической значимости различий соответствует

11

данная эмпирическая величина. В большинстве случаев, однако, одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выбор-

ке (n).

Зная n, по специальным таблицам определяются критические значения критерия, и полученное эмпирическое значение сопоставляется с ними, после чего делается вывод о подтверждении или опровержении гипотезы.

Критерии делятся на параметрические и непараметрические. И те, и другие имеют определенные возможности и ограничения.

Параметрические критерии – это критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (t- критерий Стьюдента, F-критерий Фишера и др.)

Параметрические критерии позволяют прямо определить различия в средних значениях и дисперсиях в двух выборках. Эти критерии позволяют выявить тенденции изменения признака при переходе от условия к условию при условии нормального распределения признака – это осуществляется в процедуре однофакторного дисперсионного анализа. С помощью данных критериев можно оценить взаимодействие двух и более факторов и их влияние на изменения признака – это осуществляется в процедуре двухфакторного дисперсионного анализа. Недостатком параметрических критериев является сложность математических подсчетов и необходимость соблюдения определенных условий:

значения признака должны быть измерены по интервальной шкале;

распределение признака является нормальным;

в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.

Если эти условия соблюдены, то параметрические критерии оказываются более мощными, чем непараметрические.

Непараметрические критерии – это критерии, не включающие в формулу расчета параметров распределения и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.).

Непараметрические критерии дают возможность оценить средние тенденции признака в выборках и различия в диапазонах вариативности признака. Эти критерии могут определить тенденции изменения признака при переходе от условия к условию при любом распределении признака. Но данные критерии не позволяют осуществить факторный анализ. Непараметрические критерии не требуют соблюдения равенства дисперсий, нормальности распределения признака, математические расчеты таких критериев просты и не требуют много времени.

Проверка статистических гипотез всегда связана с риском неправильного суждения из-за каких-либо случайных особенностей распределе-

12

ния. Для определения степени вероятности ошибочного вывода относительно статистической гипотезы вводится уровень значимости. Уровень значимости – это понятие математической статистики, величина, оценивающая риск ошибки.

Ошибка, состоящая в том, что будет отклонена нулевая гипотеза, в то время как она верна, называется ошибкой I рода. Вероятность такой ошибки обозначается как α, а вероятность правильного решения тогда будет 1 – α. Чем меньше α, тем больше вероятность правильного решения.

В психолого-педагогических исследованиях за достаточный уровень значимости принимается уровень α = 0,05, что означает: если в генеральной совокупности верна нулевая гипотеза, то результат, полученный на выборке, может повториться в 5 % случаев повторных выборок. В психологии принято считать низшим уровнем статистической значимости 5%-й уровень, который обозначается как ρ < 0,05; достаточным – 1%-й уровень (ρ < 0,01) и высшим 0,1%-й уровень (ρ < 0,001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической значимости ρ < 0,05 и ρ < 0,01, иногда – ρ < 0,001.

До тех пор, однако, пока уровень статистической значимости не достигнет ρ = 0,05, мы не имеем права отклонить нулевую гипотезу. Существует определенное правило отклонения нулевой гипотезы. Если эмпирическое значение критерия равняется критическому значению, соответствующему ρ < 0,05 или превышает его, то Н0 отклоняется, но мы еще не можем определенно принять H1. Если эмпирическое значение критерия равняется критическому значению, соответствующему ρ < 0,01, или превышает его, то Н0 отклоняется и принимается Н1.

Исключения: критерий знаков G, критерий Вилкоксона Т и критерий U Манна – Уитни. Для них устанавливаются обратные соотношения.

Уровень статистической значимости – это критические значения критериев. Таблицы критических значений критериев подобраны таким образом, что направленным гипотезам соответствует односторонний (проверяет различия в одну сторону), а ненаправленным – двусторонний критерий (проверяет различия в обе стороны), и приведенные значения удовлетворяют тем требованиям, которые предъявляются к каждому из них. Исследователю необходимо лишь следить за тем, чтобы его гипотезы совпадали по смыслу и по форме с гипотезами, предлагаемыми в описании каждого из критериев.

Важной характеристикой критерия является его мощность. Мощность критерия – это его способность выявлять различия, если они есть, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой II рода. Вероятность такой

13

ошибки обозначается как β. Мощность критерия – это его способность не допустить ошибку II рода, поэтому мощность = 1 – β.

Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут быть решены с помощью разных критериев. При этом некоторые критерии позволяют выявить различия там, где другие оказываются неспособными это сделать, или выявляют более высокий уровень значимости различий, т. е. являются более мощными. Но мощность не является самым главным основанием для выбора критерия, так как менее мощные критерии могут быть более простыми, более информативными, применимыми на неравных выборках и обладать более широким диапазоном использования.

1.5.Классификация задач и методов их решения

Взависимости от задач психолого-педагогического исследования, могут быть использованы различные критерии.

Задачи

Условия

Методы

1. Выявление

а) 2 выборки испы-

Q критерий Розенбаума

различий в

туемых

U критерий Манна – Уитни

уровне иссле-

 

φ критерий (угловое преобразо-

дуемого призна-

 

вание Фишера)

ка

б) 3 и больше выбо-

S критерий Джонкира

 

рок испытуемых

Н критерий Крускала – Уоллиса

2. Оценка сдвига

а) 2 замера на одной

Т критерий Вилкоксона

значений иссле-

и той же выборке

G критерий знаков

дуемого призна-

испытуемых

φ критерий (угловое преобразо-

ка

 

вание Фишера)

 

 

t – критерий Стьюдента

 

б) 3 и более замеров

χ2 критерий Фридмана

 

на одной и той же

L критерий тенденций Пейджа

 

выборке испытуе-

t – критерий Стьюдента

 

мых

 

3. Выявление

а)при сопоставле-

χ2 критерий Пирсона

различий в рас-

нии эмпирического

λ критерий Колмогорова –

пределении при-

распределения с

Смирнова

знака

теоретическим

t – критерий Стьюдента

 

6) при сопоставле-

χ2 критерий Пирсона

 

нии двух эмпириче-

λ критерий Колмогорова –

 

ских распределений

Смирнова

 

 

φ критерий (угловое преобразо-

 

 

вание Фишера)

14

4. Выявление

а) двух признаков

φ коэффициент корреляции Пир-

степени согла-

 

сона

сованности из-

 

τ коэффициент корреляции Кен-

менений

 

далла

 

 

R бисериальный коэффициент

 

 

корреляции

 

 

η корреляционное отношение

 

 

Пирсона

 

 

rs коэффициент ранговой корре-

 

 

ляции Спирмена

 

 

r коэффициент корреляции Пир-

 

 

сона Линейная и криволинейная

 

 

регрессии

 

б) трех или больше-

rs коэффициент ранговой корре-

 

го числа признаков

ляции Спирмена

 

 

r коэффициент корреляции

 

 

Пирсона Множественная и ча-

 

 

стная корреляции Линейная,

 

 

криволинейная и множествен-

 

 

ная регрессия

 

 

Факторный и кластерный анали-

 

 

зы

5. Анализ изме-

а) под влияние од-

S критерий Джонкира

нении признака

ного фактора

L критерий тенденций Пейджа

под влиянием

 

Однофакторный дисперсионный

контролируемых

 

анализ

условий

б) под влиянием

Двухфакторный дисперсионный

 

двух факторов од-

анализ

 

новременно

 

Работать с этой таблицей рекомендуется следующим образом:

1)по первому столбцу таблицы выбирается задача, стоящая в иссле-

довании;

2)по второму столбцу таблицы определяются условия решения задачи, например, сколько выборок обследовано или на какое количество групп может быть разбита обследованная выборка;

3)выбирается соответствующий статистический метод. Можно выбрать несколько методов и сравнить их результаты.

15

2.Числовые характеристики распределения

2.1.Сущность распределения, его характеристики

Анализ данных, как правило, начинается с изучения того, как часто встречаются те или иные значения интересующего исследователя признака (переменной) в имеющемся множестве наблюдений. Для этого строятся таблицы и графики распределения частот.

Таблицы и графики распределения частот дают важную предварительную информацию о форме распределения признака: о том, какие значения встречаются реже, а какие чаще, насколько выражена изменчивость признака. Выделяют следующие типичные формы распределения. Равномерное распределение – когда все значения встречаются одинаково (или почти одинаково) часто. Симметричное распределение – одинаково часто встречаются крайние значения. Нормальное распределение – симметричное распределение, у которого крайние значения встречаются редко и частота постепенно повышается от крайних к серединным значениям призна-

ка. Асимметричное распределение левостороннее (с преобладанием час-

тот малых значений) и правостороннее (с преобладанием частот больших значений). К понятию формы распределения мы вернемся в п. 2.2 – в связи с использованием в психолого-педагогических исследованиях нормального распределения как особого эталона – стандарта.

Числовые характеристики распределения измеренного на выборке признака обычно относят к первичным описательным статистикам. Каждая такая характеристика отражает в одном числовом значении свойство распределения множества результатов измерения: с точки зрения расположения на числовой оси либо с точки зрения их изменчивости.

Первичные описательные статистики позволяют ответить на два вопроса: 1) какое значение наиболее характерно для выборки?; 2) велик ли разброс данных относительно этого характерного значения, т. е. какова «размытость» данных? Для решения первого вопроса вычисляются меры центральной тенденции (или локализации), второго – меры изменчивости (или рассеивания).

МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

Меры центральной тенденции – это величины, вокруг которых группируются остальные данные. Эти величины являются как бы обобщающими всю выборку показателями, что, во-первых, позволяет по ним судить о всей выборке, а во-вторых, дает возможность сравнивать разные выборки, разные серии между собой. К мерам центральной тенденции относятся: среднее арифметическое, медиана, мода, среднее геометрическое, среднее гармоническое. В психолого-педагогических исследованиях обычно используются первые три.

16

Среднее арифметическое (М) – это частное от деления всех значений (Хi) на их количество (N): М = ΣΧΝi .

Медиана (Md) – это значение, выше и ниже которого количество отличающихся значений одинаково, т. е. это центральное значение в последовательном ряду данных. Таким образом, первым шагом при определении медианы является упорядочивание (ранжирование) всех значений по возрастанию или убыванию. Далее медиана определяется следующим образом:

● если данные содержат нечетное число значений, то медиана есть

центральное значение:

 

3, 5, 7, 9, 11, 13, 15

Md = 9;

● если данные содержат четное число значений, то медиана есть

точка, лежащая посередине между двумя центральными значениями:

3, 5, 7, 9, 11, 13, 15, 17

Md = 10;

5, 5, 7, 8, 9, 11, 14, 15

Md = 8,5.

Из примеров ясно, что медиана не обязательно должна совпадать с имеющимся замером, это точка на шкале. Совпадение происходит в случае нечетного числа значений (ответов) на шкале, несовпадение – при четном их числе.

Мода (Мо) – это значение, наиболее часто встречающееся в выборке, т. е. значение с наибольшей частотой:

2, 6, 6, 8, 9, 9, 9, 10 Мо = 9.

Если все значения в группе встречаются одинаково часто (например: 1, 1, 5, 5, 8, 8), то считается, что моды нет. Если два соседних значения имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений (например: 1, 2, 2, 2, 4, 4, 4, 5, 5, 7; Мо = 3). Если то же самое относится к двум несмежным значениям, то существует две моды, а группа оценок является бимодальной (например: 0, 1, 1, 1, 2, 3, 4, 4, 4, 7; Мо = 1 и 4).

При выборе меры центральной тенденции следует учесть, что: 1) в малых группах мода может быть нестабильна:

1, 1, 1, 3, 5, 7, 7, 8 Мо =1.

Но стоит одной единице превратиться в ноль, а другой – в двойку, и

Мо = 7;

2)на медиану не влияют величины «больших» и «малых» значений;

3)на среднее влияет каждое значение.

Обычно среднее применяется при стремлении к наибольшей точности и если впоследствии нужно будет вычислять стандартное отклонение. Медиана – когда в серии есть «нетипичные» данные, резко влияющие на среднее (например: 1, 3, 5, 7, 9, 13, 26). Мода – когда не нужна высокая точность, но важна быстрота определения меры центральной тенденции.

17

МЕРЫ ИЗМЕНЧИВОСТИ (РАССЕИВАНИЯ, РАЗБРОСА)

Это статистические показатели, характеризующие различия между отдельными значениями выборки. Они позволяют судить о степени однородности полученного множества, о его компактности, а косвенно – и о надежности полученных данных и вытекающих из них результатов. Наиболее используемые в психологических и педагогических исследованиях показатели: размах, среднее отклонение, дисперсия, стандартное отклонение, полуквартильное отклонение.

Размах (Р) – это интервал между максимальным и минимальным значениями признака. Определяется легко и быстро, но чувствителен к случайностям, особенно при малом числе данных:

0, 2, 3, 5,

8

(P = 8 – 0 = 8)

– 0.2, 1.0, 1.4, 2.0

(Р = 2,0 – (– 0,2) = 2,2)

0, 2, 3, 5,

67

(Р = 67 – 0 = 67).

Среднее отклонение (МД) это среднеарифметическое разницы (по абсолютной величине) между каждым значением в выборке и ее средним:

Σd

МД = Ν ,

где d = |Х – М|; М – среднее выборки; X – конкретное значение; N – число значений.

Множество всех конкретных отклонений от среднего характеризует изменчивость данных, но если их не взять по абсолютной величине, то их сумма будет равна нулю. И вся информация пропадает. МД показывает степень скученности данных вокруг среднего. Кстати, иногда при определении этой характеристики выборки вместо среднего (М) берут иные меры центральной тенденции – моду или медиану.

Дисперсия (S²) (от лат. dispersus – рассыпанный). Другой путь измерения степени скученности данных – это избегание нулевой суммы конкретных разниц (d = Х – М) не через их абсолютные величины, а через их возведение в квадрат, и тогда получают дисперсию:

S² =

Σd

2

 

– для больших выборок (N > 30);

Ν

 

 

S² =

Σd

2

 

– для малых выборок (N < 30).

Ν −1

 

 

Стандартное отклонение (σ). Из-за возведения в квадрат отдельных отклонений d при вычислении дисперсии получается величина, далекая от самих отклонений. Чтобы этого избежать и получить характеристику, сопоставимую со средним отклонением, проделывают обратную математическую операцию – из дисперсии извлекают квадратный корень. Его положительное значение и принимается за меру изменчивости, именуемую среднеквадратическим или стандартным отклонением:

18

σ =

S

2

=

d 2

(для N > 30) или σ =

d 2

(для N < 30).

 

Ν

Ν −1

 

 

 

 

 

 

Среднее отклонение, дисперсия и стандартное отклонение применимы для интервальных и пропорциональных данных.

2.2. Нормальное распределение

Распределением признака называется закономерность встречаемости разных его значений. В психолого-педагогических исследованиях чаще всего ссылаются на нормальное распределение.

Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине, – достаточно часто. Нормальным такое распределение называется потому, что оно очень часто встречалось в естественнонаучных исследованиях и казалось «нормой» всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции. График нормального распределения представляет собой так называемую колоколообразную кривую.

Параметры распределения – это его числовые характеристики, указывающие, где «в среднем» располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее важными параметрами являются математическое ожидание (среднее арифметическое), дисперсия, показатели асимметрии и эксцесса. Таким образом, распределения могут различаться по средним, дисперсиям, асимметрии, эксцессу и по сочетаниям этих параметров. Рассмотрим несколько примеров.

На рис. 1 представлены два распределения признака. Распределение 1 характеризуется меньшим диапазоном вариативности и меньшей дисперсией, чем распределение 2. В распределении 1 чаще встречаются значения признака, близкие к средней, а в распределении 2 чаще встречаются более высокие и более низкие, чем средняя, значения признака.

Именно такое соотношение может наблюдаться в распределении фенотипических признаков у мужчин (кривая 2) и женщин (кривая 1). Фенотипическая дисперсия мужского пола должна быть больше, чем женского (В.А. Геодакян, 1974; 1993). Мужчины – это авангардная часть популяции, ответственная за поиск новых форм приспособления, поэтому у них чаще встречаются редкие крайние значения различных фенотипических признаков. В то же время женская часть популяции ответственна за сохранение уже накопленных изменений, поэтому у них чаще встречаются средние значения фенотипических признаков.

19

Рис. 1. Кривые распределения признака с меньшим диапазоном вариативности признака (1) и большим диапазоном распределения признака (2); x – значения признака; ƒ – относительная частота их встречаемости

В тех случаях, когда какие-либо причины способствуют преимущественному появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное.

На рис. 2 представлены два распределения, различающиеся по знаку асимметрии: распределение 1 характеризуется положительной асимметрией (левосторонней), а распределение 2 – отрицательной (правосторонней).

Рис. 2. Кривые распределения признака с положительной (левосторонней) асимметрией (1) иотрицательной (правосторонней) асимметрией (2), х – значения признака, ƒ – относительная частотаихвстречаемости

Данные кривые могут отражать распределение времени решения простой задачи (кривая 1) и трудной задачи (кривая 2). Простую задачу большинство испытуемых решают быстро, поэтому большая часть значений группируется слева. При этом сама простота задачи может привести к тому, что некоторые испытуемые будут думать над нею очень, очень долго, дольше даже, чем над сложной. Трудную задачу большинство испытуемых решают в тенденции дольше, чем простую, но в то же время почти всегда находятся люди, которые решают ее мгновенно.

Итак, в тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрицательной, – более высокие.

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]