
Вопросы психологии.1994.№4.
108
ПРИМЕНЕНИЕ СТАТИСТИЧЕСКОГО МЕТОДА МОДЕЛИРОВАНИЯ С ПОМОЩЬЮ ЛИНЕЙНЫХ СТРУКТУРНЫХ УРАВНЕНИЙ В ПСИХОЛОГИИ: ЗА И ПРОТИВ.
Е. Г. Григоренко
Что определяет судьбу нового метода в науке? По крайней мере несколько обстоятельств влияют на принятие научной общественностью нового способа анализа данных [18]. Первое связано с тем, благоприятствует ли теоретический и методологический дух времени методической инновации, то есть вызывает ли теоретическое обоснование нового метода интерес в профессиональных кругах, соответствуют ли инструментальные стратегии, на которых базируется» метод, принятым научным стандартам и т. д. Второе обстоятельство определяется концептуальной и функциональной доступностью нового метода анализа. Насколько понятен и легок в употреблении предлагаемый
109
метод, какого рода знания требуются для его использования, какого рода техническое оборудование необходимо, и, наконец, сможет ли средний студент, обучающийся соответствующей профессии, применять этот метод? Ответы на эти вопросы зависят от теоретической и технической сложности предлагаемого метода, а также от определяемых им затрат компьютерного времени и профессионального труда. И, наконец, третий фактор, вероятно, наиболее важный, связан с тем, насколько перспективен данный метод для развития науки. Перспективность метода — понятие многогранное. Сюда входит как проза научной работы, например, уточнение и проверка достоверности ранее сформулированных гипотез, проверка надежности и валидности тестов, так и ее поэтика, например, тестирование новых теорий. Каждый из трех вышеназванных факторов, определяющих принятие нового метода анализа в науке, напрямую детерминирует будущее моделирование с помощью линейных структурных уравнений в психологии. В настоящей публикации описываются основные понятия, связанные со структурным моделированием.
Структурное моделирование
Статистический метод моделирования с помощью линейных структурных уравнений (МЛСУ), описывающих латентные переменные, а также его разновидность — конфирматорный факторный анализ (КФА) были разработаны на основе техники статистического анализа множественных переменных, используемых биологами, экономистами, психологами и социологами. МЛСУ предполагает формулирование набора гипотез о влиянии одних переменных, например, причинных и контрольных, на другие переменные. Соответствие подобного набора гипотез (теоретической модели) и реальных данных, собранных при работе с конкретной выборкой (эмпирической модели), формализуется с помощью статистического алгоритма, оценивающего степень согласования или меру соответствия. Таким образом, МЛСУ позволяет тестировать причинные гипотезы на основе корреляционных данных. Вследствие широкого применения неэкспериментальных схем исследования в науках о человеке, МЛСУ и КФА часто используются в психологии, социологии и экономике. К удивлению, вышеназванные статистические методы не столь популярны в биологии, несмотря на то, что в рамках именно этой науки идеи МЛСУ впервые были сформулированы С. Райтом [38]. История возникновения и этапы детальной разработки МЛСУ описаны П. Бентлером[5], а работы К. Боллена[13]и П. Бентлера[7]содержат современное техническое описание МЛСУ, поэтому эти вопросы не будут обсуждаться в предлагаемой вниманию читателей статье. Задачей данного текста является ознакомление читателей с основными понятиями и типами моделей, используемыми в рамках МЛСУ, а также обсуждение «за» и «против» применения этого сложного статистического инструмента.
Несмотря на то, что статистические методы анализа множественных переменных были описаны и, соответственно, доступны для использования с начала века, в течение долгого времени эти методы применялись скорее для решения исследовательских задач открытого типа (не направленных на тестирование заранее сформулированных причинно-следственных гипотез), чем для проверки причинно-следственных предположений. В течение последних 10—15 лет, однако, ситуация изменилась, и МЛСУ стал рассматриваться как метод наиболее адекватный для тестирования причинно-следственных предположений по сравнению с приемами, исторически используемыми для решения подобных задач. Чем же МЛСУ столь привлекателен для исследователей? Согласно Дж. Мартину [30], основное преимущество структурного моделирования по сравнению с использованием ряда более традиционных моделей (например,[19]) заключается
110
в том, что МЛСУ позволяет исследователю включить в модель гипотезы, касающиеся ошибок измерения и их влияний на отношения между переменными, тестируемыми с помощью множественных регрессий.
МЛСУ и КФА особенно привлекательны при осуществлении статистического анализа данных в ситуациях, когда исследователь взаимодействует с большим количеством переменных, интеркорреляции которых известны, и в его задачи входит суммирование этих переменных, определение степеней родства между ними, оценка качества измерительных инструментов, контроль ошибки измерения как для каждой из измеряемых (актуальных) переменных, так и для латентных, неизмеряемых переменных, и, наконец, нахождение соответствия между измеряемыми и латентными структурами. Правомерно будет сказать, что в ситуациях, когда набор переменных неточно измеряет латентную структуру или конструкт, являющийся предметом интереса исследователя, т. е. практически в любом случае, когда больше чем одна наблюдаемая переменная используется для представления латентной структуры, МЛСУ с латентными переменными следует применять как наиболее адекватный метод статистического анализа. Учитывая то обстоятельство, что в психологии большинство латентных структур измеряется посредством не одной, а нескольких актуальных переменных, т. е. не может быть представлено без ошибки измерения, возможность и необходимость применения МЛСУ в психологии становится очевидной.
Полезность применения МЛСУ была продемонстрирована в различных областях психологии. Примеры использования этого статистического метода могут быть найдены в большинстве западных психологических журналов [6],[18],[26].
Несмотря на то, что в кулуарных разговорах МЛСУ часто называют методом «моделирования причинно-следственных отношений», хотелось бы подчеркнуть, что причинно-следственные закономерности формулируются и вносятся в модель исследователем в момент ее создания, т. е. эти каузальные отношения существуют только в представлении автора модели и предопределяются теорией, последователем которой является исследователь. Наличие причинно-следственных отношений между переменными не может быть доказано путем моделирования структур ковариационных матриц [3],[16]. МЛСУ позволяет оценивать степень соответствия теоретических причинно-следственных гипотез эмпирическим данным. Если степень соответствия такова, что различия между двумя моделями (теоретической и эмпирической) а) статистически отличимы от нуля (статистически значимы), то причинно-следственные гипотезы могут быть отвергнуты; б) статистически неотличимы от нуля (незначимы), то причинно-следственные гипотезы не могут быть как отвергнуты, так и «доказаны» в рамках МЛСУ. На практике, построенные теоретические модели нередко оказываются неадекватными эмпирическим данным; использование МЛСУ в различных областях психологии часто приводит, однако, к находкам, которые, в свою очередь, помогают усовершенствовать теорию в направлении улучшения ее соответствия реальным данным.
Предваряя анализ основных понятий МЛСУ, хотелось бы отметить, что, как и любой другой статистический подход, моделирование с помощью структурных линейных уравнений не избежало как критики со стороны, так и внутренних противоречий. Спонтанно выделилось несколько основных проблемных моментов, вокруг которых разыгрываются горячие споры критиков и защитников МЛСУ. Одно из направлений критики связано с вопросами статистических характеристик МЛСУ и ситуаций, в которых использование МЛСУ было бы ошибочно [20]. Д. Фридмен обеспокоен беспечностью, с которой регрессионные модели, включая МЛСУ, используются в психологии, и подчеркивает необходимость
111
внимательного отношения к основным статистическим допущениям, лежащим в основе этих моделей. Исследователь, использующий МЛСУ, должен отдавать себе отчет в том, что достоверность гипотез может быть протестирована с помощью этого метода, но ни в коем случае не может быть доказана. Тем не менее, если причинно-следственная теория соответствует эмпирическим данным, то теория может считаться подтвержденной в том смысле, что она не опровергнута эмпирией. Как подчеркивает Д. Френсис, «МЛСУ разрешает устанавливать причинно- следственные влияния путем предположения существования сети причин и следствий среди переменных, и детерминировать степень, с которой переменные должны быть связаны друг с другом, если такая сеть существует в действительности» [21; 625].
Структура обзора, предложенного вниманию читателя, такова: вначале следует краткое описание статистических основ МЛСУ и основных понятий, употребляемых в рамках структурного моделирования; затем — анализ последовательности шагов в осуществлении моделирования и «несбалансированное»1[1]иллюстрирование основных типов моделей; и, наконец, обсуждение «за» и «против», связанных с использованием этого метода.
СТАТИСТИЧЕСКИЕ ОСНОВЫ МОДЕЛИРОВАНИЯ С ПОМОЩЬЮ СТРУКТУРНЫХ УРАВНЕНИЙ
Моделирование с помощью структурных уравнений представляет собой метод, родственный методу систем регрессионных уравнений, используемому при формулировании, детализации и тестировании теории или гипотезы. Эти уравнения соотносятся зависимые переменные и набор детерминирующих переменных, которые, в свою очередь, могут выступать в роли зависимых переменных в других уравнениях. Подобные линейные уравнения в совокупности с уравнениями, детализирующими компоненты дисперсии и ковариации независимых переменных, составляют структурную модель. Составление и запись уравнений, детализирующих компоненты дисперсии и ковариации независимых переменных, осуществляется с помощью матричной алгебры.
В матричной алгебре
и контексте ковариационного структурного
анализа буквой åобозначается популяционная матрица
ковариацией и буквой
— вектор основных параметров, включающих
регрессионные коэффициенты, дисперсии
и ковариации независимых переменных.
В контексте более общих структурных
моделей средние зависимых переменных
также являются функцией основных
параметров, и к вышеназванному списку
добавляются средние латентных переменных,
а такжеa- коэффициенты
(сдвиг регрессионных прямых по ординате)
регрессионных уравнений, описывающих
взаимосвязи зависимых и независимых
переменных. При условии, что вектор
неизвестных параметров (
)
принимает параметрические значения,
популяционные вектор среднихmи матрица ковариацииåмогут быть записаны какm=m(
)
иå=å(
).
Это и есть структурная гипотеза, которую
надлежит проверить. На практике, вектор
эмпирических (полученных на основе
анализа реальной выборки испытуемых)
средних Х и ковариационная матрица S
используются при оценке неизвестных
параметров вектораq.
Если
=m(
)
и
сходны с
и S, то модель, включающая анализируемые
линейные структурные уравнения,
достоверно описывает эмпирические
данные. Если же матрицы, построенные на
основе
112
модели и подсчитанные
на основе эмпирического исследования
несходны, модель должна быть отвергнута.
Заметим еще раз, что во многих моделях
средние не структурированы как m(q)
=
и
только структура ковариационной матрицыSпредставляет интерес
для исследователя. Класс этих более
частных моделей называется ковариационными
структурными моделями. Подклассом
такого рода моделей, включающим латентные
факторы, является, например, конфирматорный
факторный анализ.
Статистической основой МЛСУ является асимптотическая статистическая теория, подразумевающая, что оценка и тестирование моделей осуществляется при наличии относительно больших по численности выборок испытуемых. Поскольку использование МЛСУ требует больших затрат компьютерного времени, пользователи при тестировании моделей предпочитают использовать стандартные статистические пакеты типа LISREL [25], EQS[7]и Мх. Чаще всего предпочтение отдается EQS в связи с «дружелюбной натурой» этого пакета — от пользователя вовсе не требуется знание матричной алгебры в момент перевода теоретической модели на язык компьютера. LISREL и Мх предъявляют к пользователям существенно более строгие требования: первым шагом на пути использования этих пакетов должно стать ознакомление с азами матричной алгебры2[2]. Все эти пакеты, несмотря на различия в деталях, основаны на одних и тех же общих математических и статистических подходах, применяемых к анализу систем линейных структурных уравнений. Математическая модель относится к классу ковариационных структурных моделей, включающих как множественную регрессию, анализ путей, одновременный анализ уравнений, конфирматорный факторный анализ, так и анализ структурных отношений между латентными переменными. Согласно модели Бентлера—Викса[12], параметры любой линейной структурной модели представляют собой регрессионные коэффициенты, дисперсии и ковариации независимых переменных. Статистическая теория позволяет оценивание этих параметров с использованием мультифакторной нормальной теории, а также более общих эллиптической и арбитрального распределения теорий, основываясь на обобщенном методе наименьших квадратов или теории минимальногоc-квадрат.
Как было упомянуто
выше, дисперсии и ковариации, полученные
на основе эмпирических данных, сравниваются
с гипотетической моделью. Степень, с
которой гипотетическая модель S()
воспроизводит эмпирически найденные
отношения между переменными, отражающиеся
в матрице S, определяет меру соответствия
модели. Обычно мера соответствия
определяется с помощью распределенияc-квадрат с количеством
степеней свободы (df), подсчитывающимися
на основе разницы между количеством
элементов в матрице S (или S и X) и количеством
свободных параметров, оценивающихся в
.
Если значениеc-квадрат,
соответствующее определенному количеству
степеней свободы, меньше табличного,
то модель воспроизводит эмпирические
данные удовлетворительно, т. е.S(
)
близка к S. Если же значениеc-квадрат
больше табличного, и все допущения,
сделанные в ходе моделирования, соблюдены
(например, допущение о независимости
измерений), то нулевая гипотезаS=S(
)
отвергается. Обычно значениеc-квадрат
рассматривается как результирующая
функция в точке ее минимума, умножен на
величину выборки. В результате,
теоретически, при работе с большими
выборками, нулевая гипотезаS=S(
)
может оказаться отвергнута только в
результате высокой мощности анализа.
На практике, посколькуc-квадрат
чувствителен к размеру выборки, модели
с большим количеством испытуемых не
соответствуют эмпирическим данным до
желаемой
113
степени даже при
тривиальных различиях между S и
[2],[12],[29].
Поэтому среди исследователей принято
подсчитывать некоторые дополнительные
индексы меры соответствия теоретической
и эмпирической моделей. К. Боллен в своей
книге[13]упоминает несколько таких индексов, в
число которых входит критерий Акайке[1],
корень остатков квадратов средних, и
т. д. В EQS автоматически подсчитываются
нормированная мера соответствия,
ненормированная мера соответствия и
индекс сравнения[8].
Все эти индексы предоставляют
дополнительную информацию относительно
степени соответствия двух моделей,
поскольку они отражают способность
теоретической модели «объяснить»
эмпирические ковариации.
Не менее важна в
структурном моделировании и проверка
специальных гипотез о тех или иных
параметрах
,
входящих в модель. Тестирование подобного
рода гипотез осуществляется с помощью
хорошо известных r и z-тестов. Например,
тест гипотезы о том, что в
популяции равняется 0, может быть
осуществлен посредством использования
мономерных нормальных z-тестов нулевых
гипотез, применяемых для больших выборок.
Z-коэффициент представляет собой дробь,
в числителе которой находится оценка
одного из параметров структурных
коэффициентов
,
а в знаменателе — оценка стандартной
ошибки, с которой этот параметр оценен.
Этот тест и подобные многомерные тесты
встроены практически во все стандартные
пакеты МЛСУ.