Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Шелехова Л.В. Математические методы (в схемах)

.pdf
Скачиваний:
204
Добавлен:
30.05.2015
Размер:
3.74 Mб
Скачать

ГЛАВА 2. ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

2.1. ПОНЯТИЕ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ

Использование математических методов в психолого-педагогических исследованиях предполагает создание формального математического аппарата, пригодного для изучения педагогических явлений и процессов на специальном объекте – математической модели, являющейся промежуточным звеном между исследователем и предметом исследования.

Математическая модель это

приближённое описание какого-либо явления или процесса, выраженное с помощью математической символики

Под математической моделью в психолого-педагогическом исследовании чаще всего понимают уравнение или систему уравнений, которые отражают связи между наиболее существенными показателями изучаемого объекта и строятся на основе эмпирических (статистических) данных. Поэтому, изучая модель, можно получить новые данные о предмете исследования, которые в обычных условиях определить достаточно сложно, а в некоторых случаях и невозможно.

Важным понятием математического моделирования является понятие адекватности модели (соответствие модели моделируемому объекту или процессу), которое в определенной мере условное понятие, так как полного соответствия математической модели реальному объекту не может быть. Имеется в виду адекватность не вообще, а только по тем свойствам, которые считаются существенными.

АДЕКВАТНОСТЬ

это

оценка функциональной полноты, точно-

сти и достоверности модели с использова-

МОДЕЛИ

 

нием всей доступной информации

 

 

Верификация модели

определяется путем

разработки модели того же объекта с использованием другого

математического метода

 

проверки адекватности прогнозной модели и объекта в ретро-

спективном периоде (за прошедший период времени)

аналитического или логического выведения прогноза из ранее по-

лученных прогнозов

 

Валидация модели

 

определяется путем

 

 

сопоставления результатов, полученных с использование данной модели, с данными, полученными из других источников

30

Построение математической модели предполагает количественное описания предмета исследования, формулирование статистической гипотезы и ее проверки.

Статистическая гипотеза

это

 

которое

 

предположение об определенных эмпирических характеристиках распределения в данной совокупности

формулируется на основе выборки

появляется одновременно с ведущей идеей исследования и ею определяется

возникает на основании известных знаний, но выходит за их пределы

позволяет систематизировать предположения исследователя и представить их в чётком и лаконичном виде

экспериментально и практически проверяемо

ВИДЫ СТИТИСТИЧЕСКИХ ГИПОТЕЗ

 

однозначно характеризуется параметром

простая

распределения случайной величины

 

указывает некоторое множество распределений, которое обладает определенными свойствами (сложная гипотеза состоит из конеч-

сложная ного или бесконечного числа простых гипотез, при этом указывается некоторая область вероятных значений параметра)

нет никаких допущений о конкретном виде непараметрическая закона распределения

параметрическая

содержит допущения о конкретном виде за-

кона распределения

 

Выделяют основную (нулевую) и альтернативную статистические гипотезы.

Нулевая гипотеза это

предположение об отсутствии взаимосвязи или корреляции между исследуемыми переменными

31

это

Альтернативная гипотеза

предположение, принимаемое в случае отклонения нулевой гипотезы, которое содержит утверждение о наличии связи между изучаемыми переменными

Нулевая и альтернативная гипотезы образуют полную группу несовместных событий: если одна из них верна, то другая является ложной, и наоборот, поэтому отклонение одной из них влечет принятие другой.

 

 

статистические гипотезы

 

 

 

 

 

 

нулевая гипотеза

альтернативная

гипотеза

 

 

 

(экспериментальная гипотеза)

назначение

гипотеза об

отсутствии

гипотеза о значимости разли-

 

различий

 

чий

 

предполагаемый

это то, что мы хотим оп-

это то, что мы хотим доказать

результат

ровергнуть

 

 

 

обозначается

Но

 

Н1

 

математическая

Х1-Х2=0, где Х1, Х2 – со-

Х1-Х2≠0, где Х1, Х2 – сопостав-

модель

поставляемые

значения

ляемые значения признаков

 

признаков

 

 

 

 

 

 

 

 

Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.

 

Статистические гипотезы

 

нулевая гипотеза

альтернативная гипотеза

направленные

Х1 не превышает Х2

Х1 превышает Х2

гипотезы

 

 

ненаправленные

Х1 не отличается от Х2

Х1 отличается от Х2

гипотезы

 

 

 

 

 

Направленные гипотезы формулируются, если надо доказать, что:

1)в одной из групп индивидуальные значения испытуемых по какомулибо признаку выше, а в другой ниже;

2)в одной из групп под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем в другой группе.

Ненаправленные гипотезы формулируются, если надо доказать, что различаются формы распределения признака в двух различных группах испытуемых.

2.2.СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

это

Статистическая проверка гипотез

процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой, осуществляемая при помощи того или иного статистического критерия

32

это

Статистический критерий

инструмент определения уровня статистической значимости

 

 

это

 

 

включает в себя

Статистический

 

инструмент определения уров-

 

 

 

 

 

критерий

 

 

ня статистической значимости

 

 

 

 

 

 

 

 

Формулу расчета эмпирического значения критерия по выборочным статистикам

Правило (формулу) определения числа степеней свободы df

Теоретическое распределение для данного числа степеней свободы

Правило соотнесения эмпирического значения критерия с теоретическим распределением для заданного числа степеней свободы, которое позволяет определить значение р-уровеня

Центральными понятиями статистического критерия являются число степеней свободы, р-уровень значимости и правило принятия статистического вывода.

это

Число степеней свободы

количество возможных направлений изменчивости признака

Число степеней свободы, как правило, линейно зависит от объема выборки п, а также от числа признаков k или их градаций (например, df=n-k-1) – чем больше эти показатели, тем больше число степеней свободы. Однако надо отметить, что нет универсальной формулы для определения числа степеней свободы для всех возможных случаев, поэтому статистический критерий содержит формулу для расчета числа степеней свободы.

это

Статистическая значимость (р-уровень значимости)

вероятность получения результата выборочного исследования, при котором верна нулевая статистическая гипотеза для генеральной совокупности

Чем меньше р-уровень, тем больше оснований для того, чтобы отклонить Но в пользу H1 и подтвердить исходную экспериментальную гипотезу.

Таблицы критических значений содержат квантили теоретического распределения, соответствующие наиболее важным критическим значениям р- уровня (0,1; 0,05; 0,01 и т.д.) для различных чисел степеней свободы. Для вычисленного числа степеней свободы по соответствующей статистическому критерию таблице определяются соответствующие ближайшие критические значения и р-уровни.

33

ПРАВИЛО ПРИНЯТИЯ СТАТИСТИЧЕСКОГО ВЫВОДА

на основе полученных экспериментальных данных вычислить эмпирическое значение критерия Кэмп

по соответствующим критерию таблицам найти критические значения К1кр и К2кр, которые отвечают уровням значимости в 5% и 1%

записать критическое значение в виде:

 

 

К

1 кр

для

Р 0 ,05 ;

К кр

 

 

 

 

 

 

 

К

 

для

Р 0 ,01 .

 

 

 

 

2 кр

 

 

 

 

 

 

 

расположить эмпиричское значение критерия Кэмп и критические зна- чения К1кр и К2кр на оси значимости (ась абсцисс Ох декартовой системы координат, на которой выделено три зоны: левая (незначимости),

средняя (неопределенности), правая (значимости))

 

 

зона

 

зона

неопределенности

зона

 

 

незначимости

0,05

0,01

значимости

 

 

 

К1кр

К2кр

 

Исключения: G–критерий знаков (дляn 100), критерий Т–Вилкоксона и критерий U– Манна-Уитни. Для них устанавливаются обратные соотношения.

 

 

зона

 

зона

неопределенности

зона

 

 

значимости

0,05

0,01

незначимости

 

 

 

К1кр

К2кр

 

сформулировать принятие решения

если Кэмп находится в зоне незначимости, то принимается гипотеза Н0

об отсутствии различий

 

 

зона

 

зона

неопределенности

зона

незначимости

0,05

0,01

значимости

 

 

 

 

Кэм

К1кр

К2кр

 

если Кэмп находится в зоне неопределенности, то есть вероятность принятия ложного решения (необходимо увеличить выборку или вос- пользоваться другим критерием)

 

 

зона

 

 

зона

неопределенности

зона

 

 

 

незначимости

0,05

 

0,01

значимости

 

 

 

К1кр

Кэм

К2кр

 

если Кэмп находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий

 

 

зона

 

зона

неопределенности

зона

 

 

незначимости

0,05

0,01

значимости

 

 

 

К1кр

К2кр

 

Кэм

34

c d
Ложно положительное заключение При проверке гипотезы ложно положительное заключение состоит в том, что интересующую нас гипотезу объявляют истинной, когда на самом деле она ложна. Другими словами, когда допускается ошибка вто-
c

Рассмотрим возможные исходы принятия решения в зависимости от действительного положения дел:

 

верна Ho

верна H1

всего

принимается Ho

а

b

a+b

принимается H1

с

d

c+d

всего

a+c

b+d

n

 

 

 

 

ХАРАКТЕРИСТИКИ КРИТЕРИЯ

Ошибка

Исследование проводится, как правило, на выборке, а вывод делается в отношении генеральной совокупности, поэтому, принимая решение, всегда допускается вероятность его ошибочности. В результате статистической проверки гипотезы могут быть допущены ошибки двух родов:

а) Ошибка первого рода состоит в том, что будет отвергнута нулевая гипотеза, в

то время как она верна. Вероятность ошибки первого рода – с .

а с

б) Ошибка второго рода состоит в том, что будет принята нулевая гипотеза, в то

время как она неверна. Вероятность ошибки второго рода – b . b d

Мощность критерия (специфичность) Это вероятность того, что правильно отвергнута нулевая гипотеза.

Мощность зависит от: 1) уровня значимости; 2) альтернативной гипотезы. Мощность возрастает с ростом объема выборки и убывает с уменьшением уровня значимо-

сти. Мощность критерия – d . b d

 

Чувствительность критерия

Определяется по формуле:

 

a

.

 

 

 

 

 

 

 

 

 

 

а с

 

 

 

 

 

 

 

 

 

 

 

 

Ожидаемая частота

 

Ожидаемая частота –

a

. Это вероятность того, что пра-

вильна нулевая гипотеза.

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Относительный риск

 

Определяется по формуле :

a

:

 

c

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a c

 

c d

 

 

 

 

 

 

 

 

 

 

 

 

Ложно отрицательное заключение

При проверке гипотезы ложно отрица-

 

 

 

 

 

 

 

 

 

 

тельное заключение состоит в том, что интересующую нас гипотезу объявляют ложной, когда на самом деле она истинна. Другими словами, когда допускается ошибка первого

рода. Доля ложно отрицательных – .

рого рода. Доля ложно положительных – b . a b

35

Среди данных характеристик три являются независимыми, а остальные могут быть вычислены через них.

Практическая и познавательная ценность статистической проверки гипотезы определяется ее адекватностью изучаемым сторонам объекта, а также тем, насколько правильно выбран метод для его обоснования, т.е. насколько правильно построено психолого-педагогическое исследование.

2.3. КЛАССИФИКАЦИЯ ИССЛЕДОВАТЕЛЬСКИХ ЗАДАЧ,

РЕШАЕМЫХ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ

Психолого-педагогические задачи, решаемые с помощью методов математической статистики, условно можно разделить на следующие группы: 1) выявление различий в уровне исследуемого признака; 2) оценка сдвига значений исследуемого признака; 3) выявление различий в распределении признака; 4) выявление степени согласованности изменений.

ПРИ ВЫБОРЕ СТАТИСТИЧЕСКОГО КРИТЕРИЯ НЕОБХОДИМО УЧИТЫВАТЬ

тип переменных (признаков)

вид шкалы (номинативная, порядковая, интервальная и отношений), которую используют при измерении психолого-педагогических показателей

тип распределения данных, который получился в исследовании: а) нормальное распределение (в этом случае используют параметрические критерии); б) тип распределения данных не известен (не имеет значения) (применяют непараметрические критерии)

количество элементов в выборке (при небольших объемах выборки испы- туемых целесообразно использовать непараметрические критерии, которые дают большую достоверность выводам, независимо от того, получено ли в

исследовании нормальное распределение данных или нет)

тип исследовательской задачи (для непараметрических методов: выявление различий в уровне исследуемого признака; оценка сдвига значений исследуемого признака; выявление различий в распределении признака; выявле-

ние степени согласованности изменений)

формулировка основной (нулевой) и альтернативной статистических гипотез

ограничения, которые имеет каждый критерий

Учитывая вышесказанное, можно предложить следующую классификацию исследовательских задач и статистических критериев, предназначенных для их решения, учитывающую условия применимости критерия (тип шкалы, количество выборок и замеров) и соответствующие формулировки нулевой и альтернативной статистических гипотез.

36

Классификация исследовательских задач и непараметрических методов их решения

Задача

Условия

Гипотеза

Шкала

Критерий

 

 

 

 

 

 

1. Выявление различий в уровне исследуемого признака

 

 

оценка различий между несколь-

две незави-

H0: уровень признака в первой выборке не превыша-

порядковая,

критерий Розенбаума

кими выборками по уровню ка-

симые вы-

ет уровня признака во второй выборке.

интервальная

критерий Манна-

кого-либо признака, количест-

борки

H1: уровень признака в первой выборке превышает

 

Уитни

венно измеренного

 

уровень признака во второй выборке.

 

 

 

более двух

Н0: между выборками 1, 2, 3 и т.д. существуют лишь

порядковая,

критерий Крускала-

 

выборок

случайные различия по уровню исследуемого при-

интервальная

Уолиса

 

 

знака.

 

 

 

 

Н1: между выборками 1, 2, 3 и т.д. существуют не-

номинативная,

критерий Фишера

 

 

случайные различия по уровню исследуемого при-

порядковая,

 

 

 

знака.

интервальная

 

 

 

Н0: тенденция возрастания значений признака при

порядковая,

критерий тенденций

 

 

переходе от выборки к выборке является случайной.

интервальная

Джонкира

 

 

Н1: тенденция возрастания значений признака при

 

 

 

 

переходе от выборки к выборке не является случай-

 

 

 

 

ной.

 

 

2. Оценка сдвига значений исследуемого признака

(сдвиг - это разность между вторым и первым замерами одного признака на одной и той же выборке испытуемых)

а) временные, ситуационные,

два замера

Н0:отсутствие значимых различий в состоянии изу-

номинативная

критерий Макнамары

умозрительные, измерительные

одного

чаемого свойства при первичном и вторичном изме-

 

 

(одни и те же показатели, из-

признака

рениях его состояния у респондентов рассматривае-

порядковая,

двухсторонний кри-

меренные у одних и тех же ис-

на одной и

мой совокупности.

интервальная

терий знаков

пытуемых в разное время, в

той же вы-

Н1: состояния изучаемого свойства значимо различ-

 

 

ситуациях в разных представ-

борке

ны в одной и той же совокупности респондентов при

интервальная

двухсторонний кри-

ляемых условиях или разными

 

первичном измерении этого свойства и при вторич-

 

терий Вилкоксона

способами)

 

ном его измерении.

 

 

37

б) сдвиги под влиянием экспе-

два замера

Вариант 1

порядковая,

односторонний кри-

риментальных воздействий (одни

одного

Ho: результаты второго измерения изучаемого свой-

интервальная

терий знаков

и те же показатели, измерен-

признака

ства у одних и тех же объектов — уi имеют тенден-

 

 

ные у одних и тех же испытуе-

на одной и

цию быть меньше результатов первичного измерения

 

 

мых до и после воздействия:

той же вы-

xi .

 

 

интервальная

односторонний кри-

при отсутствии или при нали-

борке

H1: результаты второго измерения изучаемого свой-

чии контрольной группы)

 

ства у одних и тех же объектов — уi имеют тенден-

 

терий Вилкоксона

 

 

цию превышать результаты первичного измерения —

 

 

 

 

xi .

 

 

 

 

Вариант 2

 

 

 

 

Ho: результаты второго измерения изучаемого свой-

 

 

 

 

ства у одних и тех же объектов — уi имеют тенден-

 

 

 

 

цию быть больше результатов первичного измерения

 

 

 

 

xi .

 

 

 

 

H1: результаты второго измерения изучаемого свой-

 

 

 

 

ства у одних и тех же объектов — уi имеют тенден-

 

 

 

 

цию быть меньше результаты первичного измерения

 

 

 

 

xi .

 

 

в) структурные сдвиги (разные

более двух

H0: увеличение индивидуальных показателей при пе-

порядковая,

критерий тенденций

показатели одних и тех же испы-

замеров

реходе от первого условия ко второму, а затем к

интервальная

Пейджа

туемых,еслиониизмереныводнихи

одного

третьему и далее, случайно.

 

 

тех же единицах, по одной той же

признака

H1: увеличение индивидуальных показателей при пе-

 

 

шкале)

на одной и

реходе от первого условия ко второму, а затем к

 

 

 

той же вы-

третьему и далее, неслучайно.

 

 

 

борке

 

 

 

 

более двух

H0: изменение индивидуальных показателей при пе-

интервальная

критерий Фридмана

 

замеров

реходе от первого условия ко второму, а затем к

 

 

 

одного

третьему и далее, случайно.

номинатив-

критерий Фишера

 

признака

H1: изменение индивидуальных показателей при пе-

ная порядко-

 

 

на одной и

реходе от первого условия ко второму, а затем к

вая, интер-

 

 

той же вы-

третьему и далее, неслучайно.

вальная

 

 

борке

 

 

 

 

 

38

 

 

3. Выявление степени согласованности изменений значений признаков

а) определение степени тесно-

замеры

 

двух

Вариант 1

номинативная

 

коэффициенты ассоциации

ты связи между двумя призна-

признаков

на

H0: коэффициент линейной корреля-

 

 

 

 

Д.Юла и контингенции

ками,

показателем

которой

одной и той же

ции между переменными А и Б не

 

 

 

 

К.Пирсона Коэффициенты

является абсолютная

величи-

выборке

 

отличается от нуля.

 

 

 

 

взаимной сопряженности

на линейного коэффициента

 

 

 

H1: коэффициент линейной корреля-

 

 

 

 

К.Пирсона и А.Чупрова

корреляции

 

 

 

 

ции между переменными А и Б дос-

порядковая

 

коэффициенты

ранговой кор-

 

 

 

 

 

 

товерно отличается от нуля.

 

 

 

 

реляции Спирмена, Кенделла

 

 

 

 

 

 

Вариант 2

 

 

 

 

 

 

 

 

 

 

 

 

H0: коэффициент линейной корреля-

для

одной

пере-

коэффициенты

ранговой кор-

 

 

 

 

 

 

ции между иерархиями А и Б не от-

менной

– номина-

реляции Гудмана, рангово-

 

 

 

 

 

 

личается от нуля.

тивная;

для другой

биссериальной корреляции

 

 

 

 

 

 

H1: коэффициент линейной корреля-

– порядковая

 

 

 

 

 

 

 

 

 

ции между иерархиями А и Б досто-

интервальная

 

Коэффициент линейной корре-

 

 

 

 

 

 

верно отличается от нуля.

 

 

 

 

ляции К.Пирсона

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для

одной

пере-

Коэффициент точечной биссе-

 

 

 

 

 

 

 

менной

– номина-

риальной

 

 

 

 

 

 

 

 

тивная;

для другой

 

 

 

 

 

 

 

 

 

– интервальная

 

 

б) определение степени тесно-

замеры

 

двух

H0: коэффициент криволинейной

порядковая,

 

парный криволинейный корре-

ты связи между двумя призна-

признаков

на

корреляции между переменными А и

интервальная

 

ляционный анализ

ками,

показателем

которой

одной и той же

Б не отличается от нуля.

 

 

 

 

 

 

является абсолютная

величи-

выборке

 

H1: коэффициент криволинейной

 

 

 

 

 

 

на криволинейного

коэффи-

 

 

 

корреляции между переменными А и

 

 

 

 

 

 

циента корреляции

 

 

 

 

Б достоверно отличается от нуля.

 

 

 

 

 

 

в) определение степени тесно-

замеры

трех и

H0: коэффициент корреляции между

номинативная

 

множественный корреляцион-

ты связи между тремя и более

более

призна-

признаками не отличается от нуля.

порядковая,

 

ный анализ

 

признаками, показателем ко-

ков на одной и

H1: коэффициент корреляции между

интервальная

 

 

 

торой

является абсолютная

той же выборке

признаками достоверно отличается

отношений

 

 

 

величина коэффициента кор-

 

 

 

от нуля.

порядковая

 

коэффициент

множественной

реляции

 

 

 

 

 

 

 

 

 

конкордации

качественных

 

 

 

 

 

 

 

 

 

 

 

признаков

 

 

 

 

 

 

 

39