- •Тема 11. Многомерные методы обработки данных
- •Материалы лекции.
- •I. Классификация методов по назначению:
- •II. Классификация методов по исходным предположениям о структуре данных:
- •III. Классификация методов по виду исходных данных:
- •Множественный регрессионный анализ
- •Матрица корреляций пяти показателей интеллекта
- •Факторные нагрузки после варимакс-вращения
- •Факторные нагрузки
- •1. Эксплораторный-разведочный.
- •2. Конфирматорный.
- •1. Выбор исходных данных.
- •2. Предварительное решение проблемы числа факторов.
- •3. Факторизация матрицы интеркорреляций.
- •4. Вращение и предварительная интерпретация факторов (ротация факторов).
- •5. Принятие решения о качестве факторной структуры.
- •6. Вычисление факторных коэффициентов и оценок.
- •Компьютерные пакеты прикладных статистических программ
I. Классификация методов по назначению:
Методы предсказания (экстраполяции): множественный регрессионный и дискриминантный анализ. Множественный регрессионный анализ предсказывает значения метрической «зависимой» переменной по множеству известных значений «независимых» переменных, измеренных у множества объектов (испытуемых). Дискриминантный анализ предсказывает принадлежность объектов (испытуемых) к одному из известных классов (номинативной шкале) по измеренным метрическим (дискриминантным) переменным.
Методы классификации: варианты кластерного анализа и дискриминантный анализ. Кластерный анализ («классификация без обучения») по измеренным характеристикам у множества объектов (испытуемых) либо по данным об их попарном сходстве (различии) разбивает это множество объектов на группы, в каждой из которых содержатся объекты, более похожие друг на друга, чем на объекты из других групп. Дискриминантный анализ («классификация с обучением», «распознавание образов») позволяет классифицировать объекты по известным классам, исходя из измеренных у них признаков, пользуясь решающими правилами, выработанными предварительно на выборке идентичных объектов, у которых были измерены те же признаки.
Структурные методы: факторный анализ и многомерное шкалирование. Факторный анализ направлен на выявление структуры переменных как совокупности факторов, каждый из которых — это скрытая, обобщающая при чина взаимосвязи группы переменных. Многомерное шкалирование выявляет шкалы как критерии, по которым поляризуются объекты при их субъективном попарном сравнении.
II. Классификация методов по исходным предположениям о структуре данных:
Методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов: факторный анализ, множественный регрессионный анализ, отчасти — дискриминантный анализ.
Методы, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними. На дистантной модели основаны кластерный анализ и многомерное шкалирование, частично — дискриминантный анализ. Многомерное шкалирование и дискриминантный анализ добавляют предположение о том, что исходные различия между объектами можно представить как расстояния между ними в пространстве небольшого числа шкал (функций).
III. Классификация методов по виду исходных данных:
Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов. Это множественный регрессионный анализ, дискриминантный анализ и факторный анализ.
Методы, исходными данными для которых могут быть попарные сходства (различия) между объектами: это кластерный анализ и многомерное шкалирование. Многомерное шкалирование, кроме того, может анализировать данные о попарном сходстве между совокупностью объектов, оцененном группой экспертов. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами.
Представленные классификации свидетельствуют о необходимости знаний многомерных методов, их возможностей и ограничений уже на стадии общего замысла исследования. Например, ориентируясь только на факторно-аналитическую модель, исследователь ограничен в выборе процедуры диагностики: она должна состоять в измерении признаков у множества объектов. При этом исследователь ограничен и в направлении поиска: он изучает либо взаимосвязи между признаками, либо межгрупповые различия по измеряемым признакам. Общая осведомленность о других многомерных методах позволит исследователю использовать более широкий круг психодиагностических процедур, решать более широкий спектр не только научных, но и практических задач.
Применение многомерных методов требует, разумеется, не только самого компьютера, но и соответствующего программного обеспечения. Широко известны и распространены универсальные статистические программы SТАТISТIСА и SPSS, содержащие практически весь спектр статистических методов — от простейших до самых современных. Наследов А. Д. пишет о том, что он разделяет мнение, что программа SТАТISТIСА обладает прекрасной графикой и гибкостью в обработке данных. Однако программа SPSS имеет свои преимущества: она не только проще в освоении и применении, но и включает в себя ряд методов, отсутствующих в SТАТISТIСА, например, варианты многомерного шкалирования.