Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка по дипломам.doc
Скачиваний:
80
Добавлен:
09.02.2015
Размер:
683.01 Кб
Скачать

Таблица 1

Пример приведения результатов факторного анализа

Переменные

Фактор 1

Фактор 2

Фактор 3

А

-0,309

0,891

-0,326

6

-0,661

-0,452

0,355

С

0,813

-0,480

0,037

D

0,077

0,348

0,924

Е

0,774

0,081

-0,413

F

-0,733

-0,378

-0,480

Объяснимая

2,338

1,502

1,489

дисперсия

гументация содержания, фактически угадываемого в том или ином факторе - самая сложная и противоречивая задача. Например, если с большими положительными весами в один из выделившихся факто­ров вошли такие переменные, как высокий рост, грубый голос, боль­шая мышечная масса, склонность к риску, широкие плечи, агрессив­ное поведение, то вероятнее всего подобная комбинация антропологом будет трактоваться как фактор мужского пола, эндок­ринолог увидит влияние какого-то гормона, а психолог попытается найти некие аналоги в типологии личности. Особо широко в психоло­гии приемы факторного анализа представлены при попытках произ­вести упорядочение (объединение в шкалы) многочисленных пунк­тов в объемных личностных опросниках.

Большинство программ факторного анализа построено таким об­разом, что первый выделившийся фактор обладает самым большим влиянием на разброс показателей в группе (объяснимая дисперсия), а значение остальных факторов последовательно убывает.

Существует несколько основных форм факторного анализа, даю­щих в итоге различные результаты. Выбор необходимого варианта дик­туется конкретными задачами дипломного исследования.

❖ Кластерный анализ

Если вам необходимо разбить множество ваших переменных (объектов) на заданное или неизвестное число классов, то целесооб­разно использовать кластерный анализ(cluster - гроздь, пучок, скоп­ление, группа элементов, характеризуемых каким-либо общим свой­ством). Это не слишком часто используемая в дипломных работах форма математической обработки эмпирических материалов, пред­ставляющая интерес в тех случаях, когда переменных достаточно мно-

90

70

Рис. 3. Пример одного из вариантов графического представления результа­тов кластерного анализа шести переменных.

го и хочется наглядно увидеть их упорядоченность - в каких иерархи­ческих отношениях находятся переменные более высокого уровня обоб­щенности к более конкретным, частным (рис. 3).

Весьма любопытные результаты, тяготеющие к сфере психолингвис­тики, с помощью кластерного анализа можно получить при применении его к пунктам психологических тестов, вопросам опросников и анкет.

Существует точка зрения, что в отличие от многих других статисти­ческих процедур, методы кластерного анализа используются в боль­шинстве случаев тогда, когда еще не имеется каких-либо гипотез отно­сительно классов, т. е. когда вы все еще находитесь в описательной стадии исследования.

Пользоваться результатами кластерного анализа нужно осторож­но, поскольку он может навязывать экспериментатору гипотезу об отношениях переменных, построенную на внешних, формальных критериях и не учитывать их качественную специфику. Для того, чтобы избежать подобной ошибки, предпочтительно применять несколько разных алгоритмов расчета (их много, техники группи­ровки отличаются) и выбрать из результатов тот, который лучше всего объясняется с позиции здравого смысла. Следует понимать, что кластерный анализ определяет «наиболее возможно значимое решение».

❖ Дискримииантный анализ

Еще один из методов статистической обработки, который может оказаться полезным в дипломной работе, называется дискриминант- ним анализом.Суть его состоит в том, что он позволяет делить облада­ющие какими-то признаками объекты или состояния, относя их к како- му-либо классу или оценивать близость конкретного состояния к одному из классов. Сама исследовательская процедура дискриминан- тного анализа состоит из нескольких шагов:

  • определяются группы, которые в дальнейшем нужно разли­чать (например, больных истерическим неврозом от больных не­врозом навязчивых состояний) - это так называемая обучающая выборка;

  • эти группы, каждый член которых уже имеет точный (верифи­цированный) диагноз, исследуются по максимальному числу при­знаков (текущая симптоматика, личностная предрасположенность, специфика семейного воспитания, характер психотравмирующих ситуаций и т. п.);

  • по каждому из исследованных признаков вся обучающая выбор­ка (и тех и других больных) дискриминируется и отслеживается - на­сколько точно данный признак разделил группу по диагнозам по срав­нению с фактическим положением дел;

  • из всех просмотренных признаков отбираются наиболее инфор­мативные (те, которые наиболее точно делят обучающую выборку) и в дальнейшем они начинают использоваться для улучшения точности диагноза у тех, кому он еще не поставлен;

44

- попутно, при необходимости, можно отследить, насколько близ­ко или далеко находится каждый из обследованных индивидов к тому или другому состоянию.

В итоге дискриминантного анализа для каждой переменной вы получите стандартизованный коэффициент (Т - лямбда Уилк- са), интерпретируемый следующим образом: чем он больше, тем меньше вклад соответствующей переменной в различение сово­купностей.

Другими словами, основная идея дискриминантного анализа зак­лючается в том, чтобы определить, отличаются ли совокупности по среднему какой-либо переменной (или их комбинации), и затем ис­пользовать эту переменную, чтобы предсказать для новых членов их принадлежность к той или иной группе (это задача прогноза). Более простой пример: показатель роста может служить дискриминирую­щим признаком для отнесения неизвестного нам человека к мужскому или женскому полу, поскольку уже точно известно, что средний рост мужчины выше среднего роста женщины.

Один подобный признак, как можно догадаться из представленно­го примера, не гарантирует надежности прогноза, но совокупность характеристик может сделать его достаточно уверенным.

Ниже приводится иллюстрация графического представления диск­риминантного анализа (рис. 4).

Root 1 vs. Root2

Рис. 4. Графический пример разделения носителей признака на три группы, полученный в результате дискриминантного анализа.

❖ Непараметрические методы

Еще раз хотелось бы подчеркнуть, что все рассмотренные проце­дуры статистического анализа могут быть корректно использованы только в том случае, если ваши экспериментальные данные подчиня­ются т. н. нормальному закону распределения или хотя бы приближа­ются к нему. Это значит, что в имеющемся у вас распределении край­ние значения признака - и наименьшие и наибольшие - появляются редко, а чем ближе значение признака к средней арифметической, тем чаще оно встречается (см. рис. 1).

Если такого соответствия нет, что, как правило, объясняется либо малыми размерами выборки (менее 20—30), либо измерениями в по­рядковых шкалах (типа «высокий», «средний», «низкий»), либо тем, что переменные объективно распределены «ненормально», то для обработки эмпирических материалов диплома нужно использовать так называемые непараметрические критерии, хотя они и имеют мень­шую мощность и обладают меньшей гибкостью (для их расчета не рас­сматриваются и не учитываются значения среднего и стандартного отклонения). Но у них есть и ряд преимуществ. Они малочувствитель­ны к неточным измерениям и эти методы могут применяться для обра­ботки данных, имеющих полуколичественную природу (ранги, баллы и т. д.). Кроме того, с их помощью можно получить ответы на такие вопросы, которые неразрешимы с использованием методов, основан­ных на нормальном распределении. Следовательно, они иногда оказы­ваются уместны и для обработки нормально распределенных резуль­татов исследования.

Не вдаваясь в подробности, укажем лишь на названия непарамет­рических процедур, позволяющих получить показатели, аналогичные нормально распределенным.

Для выяснения достоверности различий между двумя независи­мыми выборками (например, при сравнении мальчиков и девочек) непараметрическими альтернативами t-критерия являются серийный критерий В альд а-Вольфовичa, U критерий Манна-Уитнии двухвы- бор очный критерий типа Колмогорова-Смирнова.

Если в дипломе выясняются различия между зависимыми выбор­ками (например, показателями одной группы до коррекционной рабо­ты и после нее), то нужно использовать Т-критерий Уилкоксонадля разностей пар, который может быть применен также и к ранжирован­ным данным. По сравнению сt-критерием Стъюдента, он требует зна­чительно меньшего объема вычислений и почти также строго прове­ряет нормально распределенные выборки. Его эффективность для больших и малых выборок составляет около 95%.

Если две рассматриваемые переменные имеют альтернативное распределение (включают только две градации, как например, показа­тели теста в группе ниже или выше некой избранной величины до и после тренировок, либо количество справившихся с контрольной по математике среди мальчиков и девочек), то подходящими непарамет­рическими критериями достоверности различий будут %2(хи-квадрат­ен не рекомендован к применению, если число опытов в каждом из сравниваемых распределений меньше 10) и точный критерий Фише­радля четырехпольной таблицы. Внимание: не путайте алгоритм рас­чета упомянутого непараметрического критерия %2 симеющим много общего алгоритмом расчета критерия согласия х2Пирсона, полезного при сравнении эмпирического и теоретического распределений, как правило используемого для установления соответствия реально полу­ченного распределения нормальному закону.

Для выяснения связей между признаками (корреляции) можно рассчитать уже упоминавшийся тетрахорический показатель(г),ранговые коэффициенты корреляции Спирмена(R или р) и may (т)Кендалла.Последние два могут быть использованы для определения тесноты связей как между количественными, так и между качествен­ными признаками при условии, если их значения упорядочить или проранжировать по степени убывания или возрастания признака.

❖ Компьютерная обработка и графические иллюстрации

Пускай вас не смущает некоторая перегруженность статистичес­ких процедур, рекомендуемых для использования в дипломной работе. В большинстве случаев вам не обязательно (хотя и желательно) быть знакомыми с их математическим аппаратом. К сегодняшнему дню для нужд науки разработаны многочисленные компьютерные програм­мы, позволяющие даже не сведущему в математике человеку доволь­но легко рассчитывать большинство желаемых показателей. Самыми известными и популярными из них являются пакеты Statistica (таблич­ные и графические примеры с ее использованием приведены выше) иSPSS. Обе программы снабжены справочным материалом в формеHelp-ов и специальным информационным сопровождением с обзо­ром основных расчетных алгоритмов. При выведении показателей раз­личия, в корреляционных матрицах и в других таблицах автоматически выделяются цветом и жирностью числовые значения, представляющие для исследователя особый интерес (по достоверности, важности, при­оритетности и т. д.).

Эти же пакеты позволяют существенно улучшить внешний вид дипломной работы за счет внесения в нее большей наглядности. Это достигается заменой некоторых трудно читаемых таблиц и цифровых данных на графики, гистограммы, и другие формы иллюстраций, хо­рошо вписывающихся в смысловую канву предъявленных результатов (но ничего лишнего!).

Выбор формы графика не должен быть случаен. Например, изме­нения во времени лучше воспринимаются в линейном представлении, сопоставление показателей двух групп - в столбчатом, пропорции - в круговых гистограммах, а рассеяние - в точечном (рис. 5—8).