Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Каган. познав проц.doc
Скачиваний:
0
Добавлен:
16.09.2019
Размер:
64.51 Кб
Скачать

ИЗУЧЕНИЕ ФАКТОРОВ ОПТИМИЗАЦИИ ПОЗНАВАТЕЛЬНОЙ

ДЕЯТЕЛЬНОСТИ СТУДЕНТОВ С ПОМОЩЬЮ МЕТОДОВ

КЛАСТЕРНОГО И ДИСКРИМИНАНТНОГО АНАЛИЗОВ

Е.С. Каган, И.С. Морозова

Кемеровский государственный университет

Посредством применения методов многомерной статистической обработки осуществлялось изучение факторов, оптимизирующих познавательную деятельность личности. Представленный подход характеризуется нетрадиционным использованием результатов кластерного анализа для проведения дискриминантного анализа.

Ключевые слова: познавательная деятельность, кластерный анализ, дискриминантный анализ, диагностические признаки.

Изучение факторов, оптимизирующих познавательную деятельность студентов, не только обогащает наши представления о специфике учебной деятельности, но и существенно конкретизирует общие закономерности формирования индивидуального сознания. В связи с этим задача выявления наиболее существенных показателей, влияющих на успешность познавательной деятельности студентов, является актуальной.

В нашем исследовании мы придерживались положения о том, что познавательная деятельность личности является полимотивированной. В мотивационной сфере субъекта всегда в разных соотношениях представлены познавательные потребности, а также потребности и мотивы, входящие в группу "мотивации достижения". Исследование познавательной деятельности личности включает в себя изучение характерологических особенностей личности, ее смысловых установок, учитывая вместе с тем, что ими опосредуются и индивидуальные особенности личности.

Эти представления были положены в основу экспериментального исследования психологических механизмов оптимизации познавательной деятельности личности. В экспериментальном исследовании принимали участие студенты (300 человек), имеющие разный уровень продуктивности познавательной деятельности (низкий, ниже среднего, средний, выше среднего, высокий). По каждому испытуемому имелась информация о показателях, характеризующих психологические свойства личности (104 показателя).

Таким образом, вся совокупность объектов по уровню продуктивности была разбита на пять групп, представляющих собой скопление точек в 104-м мерном пространстве. Чем более объекты внутри каждого класса похожи друг на друга и отличаются от объектов других классов, тем меньше пересечений соответствующих классам "территорий". Однако анализ выделенных нами групп показал, что группы представляют собой нечеткие размытые множества, различия между которыми плохо идентифицируются. Поэтому для выявления наиболее существенных показателей, влияющих на успешность познавательной деятельности, была отобрана информация о студентах, относящаяся к диаметрально противоположным группам (начальная классификация), в которых бы наблюдались более существенные различия (группы с высокой и низкой продуктивностью – всего 90 студентов). Необходимо было определить решающие правила, позволяющие разделить данные выборки.

Сформулированная таким образом задача решается в рамках дискриминантного анализа (ДА) [2]. В общем случае на вход алгоритма распознавания подается матрица данных, содержащая информацию о m объектах, у которых измерены n показателей. Каждый из объектов содержит еще одну характеристику, измеренную в номинальной шкале: принадлежность к некоторому выделенному классу z. Процесс распознавания включает в себя два основных этапа: этап обучения и этап принятия решения. На первом этапе алгоритм ДА должен обнаружить закономерную связь между значениями показателей и значением целевой функции z. Эта закономерность выражается в виде решающего правила, с помощью которого на этапе контроля по характеристикам любого объекта можно принимать решение об его принадлежности к одному из выделенных классов.

Обработка экспериментальных данных осуществлялась с помощью пакета Statistica. Первоначальное разбиение объектов в модуле дискриминантного анализа не представлялось возможным, т.к. размерность признакового пространства превышала количество объектов. Поэтому все параметры были разделены на три информационные группы. Первая группа – группа личностных показателей (34 показателя), вторая – группа социально-психологических показателей (43 показателя) и третья группа – группа показателей, характеризующих мотивационную сферу студентов (27 показателей).

Дискриминантный анализ проводился для каждой группы признаков. На первом этапе формировались обучающие выборки. Из первоначальных выборок необходимо было исключить объекты, некорректно отнесенные к данному классу, т.е. объекты, которые по своим значениям показателей не соответствуют большинству объектов, образующих однородную группу. Для решения этой задачи строилась классификационная матрица, содержащая информацию о процентном отношении корректно и некорректно отнесенных объектов. Если расстояние Махаланобиса от объекта до центра его группы значительно выше, чем до центров других групп, а апостериорная вероятность попадания в свою группу ниже критического значения, то отнесение i-ого объекта в j-ую группу считается ошибочным.

Для каждого из вновь сформированных классов в пространстве признаков можно определить положение центроида – точки, координатами которой являются средние значения дискриминантных переменных. Центроид – это место типичных наблюдений для данного класса, его можно использовать как для описания различий между классами, так и для отнесения "неизвестных" объектов к одному из классов.

Поэтому после того как было получено разбиение объектов на классы, анализировалось расстояние между центрами классов. Это расстояние при эмпирическом разбиении объектов (первичная классификация) было меньше, чем при разбиении, полученном с помощью ДА.

ДА содержит процедуры, позволяющие включать наиболее информативные показатели и исключать менее информативные, т.е. решать задачу снижения размерности. Однако применение ДА к данной задаче не позволило снизить размерность признакового пространства, хотя анализ центроидов показал, что некоторые средние значения показателей, принадлежащих разным классам, различаются статистически незначимо. Поэтому было сделано предположение, заключающееся в том, что среди показателей содержится ряд неинформативных, что привело к решению задачи снижения размерности признакового пространства.

Для решения данной задачи использовался аппарат кластерного анализа и алгоритм, который в литературе [1] носит название поиска диагностических признаков.

Диагностические признаки должны обладать следующими свойствами: быть слабо коррелированными между собой и сильно коррелированными с признаками, входящими в ту группу, из которой они получены.

Каждая группа признаков обрабатывалась в модуле кластерного анализа. С помощью иерархического метода кластерного анализа (метод связи – полная связь, метрика – (1- коэффициент корреляции Пирсона) выделялись группы сходных признаков. Анализируя межкластерные расстояния, в каждом кластере выделялся признак, наиболее связанный с другими (максиминный критерий). Этот показатель и являлся в дальнейшем диагностическим для рассматриваемого кластера.

В результате применения кластерного анализа в группе личностных признаков из 34 было оставлено 8 показателей; в социально-психологической: из 43 – 10, в мотивационной: из 27 – 5 показателей. Также была выделена группа диагностических показателей для всей совокупности 104 признаков, в которую вошли 23 показателя.

На следующем этапе была решена 2-ая задача ДА – задача классификации наблюдений по группам. На основе выделенных обучающих выборок была проведена классификация новых 50 студентов (25 с низкой, 25 с высокой продуктивностью).

При классификации объектов было использовано два подхода:

  1. Классификация проводилась по обучающим выборкам для каждой группы признаков и использовала в качестве признакового пространства все показатели этой группы.

  2. Классификация проводилась по обучающим выборкам для каждой группы признаков и использовала в качестве признакового пространства только диагностические признаки этой группы.

Полученные результаты ДА проиллюстрируем на примере группы личностных показателей. В табл.1 приведены результаты сопоставительного анализа расстояний между центроидами классов, полученных различными способами (эмпирическое разбиение, дискриминантный анализ по всей группе личностных признаков и по группе выделенных диагностических признаков). Расстояние между центрами классов, построенных по всем личностным признакам, значительно ниже аналогичного расстояния, полученного для выборок, построенных только по диагностическим признакам.

Результаты классификации новых объектов по обучающим выборкам представлены в табл. 2 и 3.

Таблица 1