- •1. Методы организации и проведения психолого-педагогического
- •1.1. Основные этапы исследования
- •Общая логика психолого-педагогического исследования
- •1.1.2. Структура курсовой работы
- •1.1.3 Литература по теме
- •1.1.4 Задания по теме
- •1.2. Диагностика в психолого-педагогическом исследовании
- •1.2.1. Сущность понятия "психолого-педагогическая диагностика"
- •1.2.2. Условия осуществления диагностики
- •1.2.3. Литература по теме
- •1.2.4. Задания по теме
- •1.3. Наблюдение как метод исследования
- •1.3.1. Виды наблюдения и их классификация
- •1.3.2. Методика организации наблюдения
- •1.3.3. Литература по теме
- •1.3.4. Задания по теме
- •1.4. Методы опроса
- •1.4.1. Значение методов опроса в педагогическом исследовании
- •1.4.2. Классификация вопросов
- •1.4.3. Литература по теме
- •1.4.4. Задание по теме
- •1.5. Методы рейтинга и самооценки
- •1.5.1. Сущность рейтинговых методик
- •1.6. Тесты и проективные методики
- •1.6.2. Сущность проективных методик
- •1.6.3. Литература по теме
- •1.6.4.Задание по теме
- •2. Статистическая обработка и представление результатов
- •2.1. Выборочный метод исследования
- •Измерение в психолого-педагогическом исследовании
- •2.3. Схема психолого-педагогического исследования
- •2.4. Основные типы статистических задач в психолого-педагогическом исследовании
- •2.5. Этапы выполнения и описания статистического исследования
- •2.6. Оценка результатов проверки статистических гипотез
- •2.7. Решение и описание типичных статистических задач психолого-педагогического исследования
- •2.7.1. Первичный статистический анализ данных
- •2.7.2. Сравнение выборок
- •2.7.2.1. Применение u - критерия Манна-Уинтни для оценки значимости разности между двумя независимыми выборками
- •2.7.2.2. Применение g - критерия знаков для оценки значимости разности между двумя
- •2.7.3. Исследование взаимозависимости признаков (корреляционный анализ)
- •Глава I. Психолого-педагогические основы творческой трудовой деятельности
- •Глава II. Состояние проблемы в практике начальной школы 36
2.7.2. Сравнение выборок
При организации стандартного психолого-педагогического исследования неизбежно встает задача сравнения двух групп людей по одному психическому или педагогическому признаку. Это необходимо делать после первого и второго диагностических срезов. Кроме того, зачастую для нас представляет интерес выявление различий в психике различных групп людей - мальчиков и девочек, младших школьников и подростков и т.п. Как же осуществить решение данной задачи?
Сравнение результатов двух измерений не представляет никакой сложности. Мы всегда можем сравнить два числа и выяснить, какое из них больше и какое – меньше (правда, это возможно, если измерения выполнены не по номинальной шкале). Однако в случае сравнения двух групп чисел задача существенно усложняется.
В этом пособии мы не рассматриваем сравнение выборок при измерении по параметрическим шкалам, потому что они редко применяются в психолого-педагогических исследованиях. Эти методы широко известны (t-критерий Стьюдента и F-критерий Фишера) и описаны во всех статистических пособиях. Для их применения достаточно провести первичное описание выборок и подставить значения среднего арифметического, дисперсии и объема выборок в формулу расчета и интерпретировать полученное число. Нашей задачей будет описание применения непараметрических методов сравнения независимых и зависимых выборок.
Вернитесь к таблице выбора методик статистического анализа данных. В соответствии с ней для решения задачи сравнения независимых выборок используется U-критерий Манна-Уитни, а зависимых – G-критерий знаков. Подробно опишем их применение.
2.7.2.1. Применение u - критерия Манна-Уинтни для оценки значимости разности между двумя независимыми выборками
Рассмотрим применение критерия на конкретном примере. Пусть в двух различных группах были произведены изменения уровня развития некоего психического признака (пусть это будет уровень развития инициативности) с использованием шкалы порядка (число замеров в разных группах может не совпадать) и получены следующие значения: 2,4,4,5,2,3,4,2,5,4 – для мальчиков младшего школьного возраста; 2,3,2,4,2,5,2,3,4,2,4 – для девочек младшего школьного возраста. Как мы видим, объемы выборок не совпадают: N1=10, а N2=11. До решения нашей задачи необходимо провести первичный анализ выборок. По его результатам составим сводную частотную таблицу.
Таблица 9
Частота встречаемости мальчиков и девочек младшего школьного возраста с различным уровнем развития инициативности
Уровень развития признака, балл |
1 |
2 |
3 |
4 |
5 |
N |
Частота встречаемости, мальчики |
0 |
3 |
1 |
4 |
2 |
10 |
Частота встречаемости, девочки |
0 |
5 |
2 |
3 |
1 |
11 |
Из таблицы видно, что выборки отличаются количеством детей по всем уровням развития признака, кроме первого. Но насколько существенны эти отличия между выборками и сохранятся ли они в генеральной совокупности – на эти вопросы и предстоит нам ответить.
В дальнейшем при описании способов действий мы будем выделять курсивом те части текста, которые следует использовать в описании, и прямым шрифтом те, которые служат для понимания выполняемых действий.
Перед выполнением сравнения выборок вернитесь еще раз к описанию этапов выполнения и описания статистического исследования (параграф 2.5.), и повторите его.
Перейдем к решению и его описанию. Первый этап – постановка предметной задачи. Обозначим его римской цифрой.
I. Существует ли различие между мальчиками и девочками восьми лет в уровне развития инициативности?
Как мы видим, формулировка вполне психологическая. Необходимо перейти ко второму этапу – переформулировать проблему на математический язык. Такая формулировка стандартна для любого сравнения выборок.
II. Существует ли достоверное различие между изучаемыми выборками по исследуемому признаку?
В данной формулировке нет никакой предметности – мальчики, девочки, инициативность здесь отсутствуют. Есть только обезличенные выборки и неименованный признак.
Перейдем к третьему пункту. В начале как статистического, так и экспериментального исследования мы строим предположения, выдвигаем гипотезу, к каким результатам мы можем прийти. И если в эксперименте гипотезы могут быть разнообразными, то в статистическом исследовании их всего две – нулевая (Но) и альтернативная (Н1). Нулевая гипотеза предполагает отсутствие достоверных различий, в то время как альтернативная – их наличие. В конце третьего этапа статистического исследования мы должны обоснованно выбрать либо Но, либо Н1. Определим гипотезы.
III.1. Но – достоверного различия между выборками не обнаружено.
Н1 – существует достоверное различие между выборками.
Перейдем ко второй стадии третьего этапа. Выберем конкретный статистический метод для решения данной задачи и реализуем его. Для этого определим два фактора: тип данных и тип задачи. Используя таблицу из параграфа 2.4.2., мы выбираем метод. Разобьем этот длительный и сложный этап на 5 этапов, обозначив их арабскими цифрами.
III. 2. Экспериментальные данные получены по ранговой шкале, перед нами стоит задача сравнения выборок, причем выборки независимы. Следовательно, необходимо использовать статистический метод U-критерий Манна-Уитни.
Перед тем как рассчитать эмпирическое значение критерия кратко опишем идеологию этого статистического метода. Для сравнения двух групп мы должны их сопоставить, объединив в одну сводную выборку. После этого новую выборку следует перенумеровать (ранжировать). Ранг показывает соотносительное место каждого конкретного человека в ряду других. Сумма этих рангов для людей, входящих в каждую выборку, является показателем, определяющим смещение этой выборки относительно другой. Проделаем и опишем эти процедуры.
Рассмотрим сводную частотную таблицу. В соответствии с ней из 21-го ребенка составляющих сводную выборку, 8 детей характеризуются вторым уровнем, 3 - третьим, 7 - четвертым и 3 – пятым уровнем развития инициативности. Детей с первым уровнем развития инициативности не отмечено. Внесем это в таблицу
III.3. Таблица 10
Ранжирование сводной выборки
Номер по порядку |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
Значение |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
3 |
3 |
3 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
5 |
5 |
5 |
Код группы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ранг |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Из восьми детей, характеризующихся вторым уровнем развития инициативности, три относятся к первой группе – это мальчики, и пять – ко второй группе – это девочки. Внесем это в таблицу. Причем порядок внесения не важен, но делать это надо единообразно. Начнем с первой группы, с мальчиков.
Таблица 11
Номер по порядку |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
Значение |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
3 |
3 |
3 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
5 |
5 |
5 |
Код группы |
м |
м |
м |
д |
д |
д |
д |
д |
м |
Д |
д |
м |
м |
м |
м |
д |
д |
д |
м |
м |
Д |
Ранг |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Перейдем к основной операции – ранжированию. Нам необходимо присвоить каждому из 21-го детей новый номер, показывающий его место относительно других детей. Казалось бы, это можно сделать просто, ведь они уже и так стоят в ряду и номер по порядку (верхняя срока) и есть искомый номер. Но для восьми детей, имеющих один уровень развития инициативности (второй), номера рангов не должны отличаться, ведь для нас (по крайней мере, по изучаемому признаку) они одинаковы. Что же нам записать в строке “ранг” для мальчика, стоящего под “номером по порядку” 1? То же, что и для любого другого ребенка, имеющего тот же уровень инициативности (остальные семь детей под номерами от 2 до 8). И это “то же” является средним арифметическим из чисел от 1 до 8, т.е. 4,5. Эту же процедуру повторим для детей с другими уровнями развития инициативности.
Таблица 12
Номер по порядку |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
Значение |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
3 |
3 |
3 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
5 |
5 |
5 |
Код группы |
м |
м |
м |
д |
д |
д |
д |
д |
м |
д |
д |
м |
м |
м |
м |
д |
д |
д |
м |
м |
д |
Ранг |
4,5 |
4,5 |
4,5 |
4,5 |
4,5 |
4,5 |
4,5 |
4,5 |
10 |
10 |
10 |
15 |
15 |
15 |
15 |
15 |
15 |
15 |
20 |
20 |
20 |
Подсчитаем ранговые суммы. Для этого суммируем отдельно все ранги мальчиков и все ранги девочек.
Rм= 3*4,5+1*10+4*15+2*20 = 13,5+10+60+40 = 123,5;
Rд= 5*4,5+2*10+3*15+1*20=22,5+20+45+20 = 107,5.
Таким образом, мы составили сводную таблицу и подсчитали ранги. Поскольку операция сложная, то мы могли допустить ошибки, и поэтому необходимо сделать проверку.
Если мы вернемся к сводной таблице ранжирования и внимательно ее рассмотрим, то мы увидим, что сумма всех чисел верхней строки (последовательная сумма чисел (Σ) от 1 до 21) и нижней строки (сумма всех рангов - R) равны. Второй показатель представляет собой сумму Rм и Rд. А первый рассчитывается по специальной формуле
N * (N+1)
Σ = -------------
2
Рассчитаем их.
Проверка.
R = Rм+Rд = 123,5+107,5 = 231
Σ =( 21*22)/2 = 21*11 = 231
231 = 231 следовательно, R = Σ, следовательно, ранжирование и подсчет ранговых сумм проведены верно.
Следующим этапом является расчет Uэмп. Для этого существует формула.
Nx * (Nx + 1)
U эмп. = (N1*N2) + --------------------- - Rx
2
В этой формуле нам уже известны N1 и N2, это объемы выборок мальчиков и девочек. Неизвестны Nx и Rx. Rx – эта наибольшая из ранговых сумм. В нашем случае это Rм =123,5. А Nx – это объем выборки имеющей наибольшее значение R. Для нас это – 10. Проведем подсчеты.
10 * 11
U эмп. = (10*11) + ---------- - 123,5 = 110 + 55 – 123,5 = 42,5
2
Необходимо найти критическое значение статистического критерия. Необходимая таблица расположена в приложении 18. Для пользования ею необходимо иметь понятие об уровнях достоверности. Мы уже упоминали (параграф 2.4.2.2), что в статистическом исследовании мы получаем вероятностные выводы. И вывод о различиях мы исследуем на двух уровнях – 95% и 99%. Соответственно, таблица значений Uкрит. на каждой странице разделена на верхнюю часть (для уровня достоверности 95% и ошибки достоверности ρ≤0.05) и нижнюю (уровень достоверности 99% и ошибки достоверности ρ≤0.01). Для нахождения этих двух значений необходимо знать значения N1 и N2. Найдем значения Uкрит. для нашего случая, пропишем правила сравнения и проведем их.
31 для ρ ≤ 0,05
III.4. Uкрит. =
22 для ρ ≤ 0,01
Предстоит заключительная процедура – обоснованный выбор статистической гипотезы. Для этого необходимо провести сравнение между рассчитанным нами эмпирическим значением (Uэмп.) и взятым из специальной статистической таблицы – критическим (Uкрит.). Результат такого сравнения оценивается в соответствии с правилом позволяющим выбрать одну из двух ранее (III.1) выдвинутых статистических гипотез. Приведем правило для используемого нами критерия.
III.5.
-
Если Uэмп. > Uкрит., то принимаем Н0 и отвергаем Н1
Если Uэмп. ≤ Uкрит., то принимаем Н1 и отвергаем Н0
Так как
42,5 > 31 , то принимаем Н0 и отвергаем Н1
42,5 > 22, то принимаем Н0 и отвергаем Н1
Следовательно, в результате проведенного статистического исследования мы принимаем Н0 на обоих уровнях значимости..
На этом III этап исследования закончен. Достоверных различий мы не обнаружили. Перейдем к четвертому этапу. Опишем полученный результат на математическом языке. Напоминаем, что он является ответом на формулировку II этапа.
IV. Достоверного различия между изучаемыми выборками по исследуемому признаку мы не обнаружили.
Переформулируем полученный вывод на предметный психолого-педагогический язык. Напоминаем, что он является ответом на сформулированную на первом этапе проблему.
V. Достоверного различия между мальчиками и девочками восьми лет по уровню развития инициативности выявить не удалось.
Мы завершили сравнение двух групп. Однако вы можете столкнуться в ваших расчетах с некоторыми проблемами. Возникают они на III этапе, в результате сравнения Uэмп. и Uкрит. Осложняет ситуацию оценивания необходимость проводить одновременно два сравнения, с двумя значениями Uкрит., для уровней достоверности (95%, 99%). Мы рассмотрели только один исход сравнения, когда Uэмп. > Uкрит на обоих уровнях сравнения. Возможны ещё два исхода сравнения.
Первый из них – Uэмп. ≤ Uкрит. (ρ≤0.05) и Uэмп. > Uкрит. (ρ≤0.01). При нем (смотри правила сравнения в рамке, они расположены выше) мы считаем доказанной альтернативную гипотезу (Н1) на уровне достоверности 95% и должны придерживаться нулевой гипотезы (Н0) на уровне достоверности 99%. На первый взгляд это является достаточно странным, так как одновременно мы принимаем противоположные гипотезы и что достоверные различия есть (Н1), и что они не обнаружены (Н0). На самом деле никаких противоречий здесь нет, нужно помнить о двух различных уровнях достоверности. Мы можем говорить о различиях между мальчиками и девочками из генеральной совокупности по инициативности не менее чем в 95 случаях из 100. Но гарантировать более высокий уровень достоверности (99 случаев из 100) мы не можем. Описывать это нужно следующим образом. Предположим, что в результате расчетов мы получили Uэмп. = 30. Концовка пункта 5 третьего этапа запишется таким образом.
30 < 31 , то принимаем Н1 и отвергаем Н0 (ρ ≤ 0,05);
30 > 22, то принимаем Н0 и отвергаем Н1 (ρ ≤ 0,01).
Следовательно, в результате проведенного статистического исследования мы принимаем Н1 на 95% уровне достоверности и Н0 на 99% уровне достоверности.
IV. Достоверное различие между изучаемыми выборками по исследуемому признаку существует (ρ ≤ 0,05).
V. Существует достоверное различие между мальчиками и девочками восьми лет по уровню развития инициативности.
Третий исход сравнения выглядит следующим образом: Uэмп. ≤ Uкрит. (ρ≤0.05) и Uэмп. ≤ Uкрит. (ρ≤0.01). То есть альтернативная гипотеза подтверждается на обоих уровнях достоверности 95% и 99%. Это означает, что мы можем говорить о различиях между мальчиками и девочками в генеральной совокупности по уровню развития инициативности не менее чем в 99 случаях из 100. При Uэмп. = 20 описание концовки пункта 5 будет выглядеть следующим образом:
20 < 31 , то принимаем Н1 и отвергаем Н0 (ρ ≤ 0,05);
20 < 22, то принимаем Н1 и отвергаем Н0 (ρ ≤ 0,01).
Следовательно, в результате проведенного статистического исследования мы принимаем Н1 на 95% и 99% уровне достоверности..
IV. Достоверное различие между изучаемыми выборками по исследуемому признаку существует (ρ ≤ 0,01).
V. Существует высокодостоверное различие между мальчиками и девочками восьми лет по уровню развития инициативности.
Сравните между собой описание IV и V этапов в этих двух случаях. Обратите внимание, что в описании IV этапа мы не употребляем различительных слов, а указываем в скобках уровень ошибки (ρ). На V этапе различия заключаются в употреблении слов: достоверные и высокодостоверные.
В заключение мы предлагаем вашему вниманию таблицу, позволяющую точнее описывать результаты исследования на IV и V этапах в зависимости от результатов принятия статистической гипотезы (конец III этапа).
Таблица 13
Этапы описания исследования |
||
III |
IV |
V |
Н0 Н0 |
Достоверного отличия не обнаружено |
Достоверного отличия между … и … по … не обнаружено |
Н1 Н0 |
Существует достоверное различие (ρ≤0.05) между выборками |
Существует достоверное различие между … и … по … |
Н1 Н1 |
Существует достоверное различие (ρ≤0.01) между выборками |
Существует высокодостоверное различие между … и … по … |
