Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистический пакет SPSS / Ростовцев П. Анализ социологических данных с применением статистического пакета SPSS, учебное пособие.DOC
Скачиваний:
203
Добавлен:
21.01.2014
Размер:
3.94 Mб
Скачать

О статистике Вальда

Как отмечено в документации SPSS, недостаток статистики Вальда в том, что при малом числе наблюдений она может давать заниженные оценки наблюдаемой значимости коэффициентов. Для получения более точной информации о значимости переменных можно воспользоваться пошаговой регрессией, метод FORWARD LR (LR - likelihood ratio - отношение правдоподобия), тогда будет для каждой переменной выдана значимость включения/исключения, полученная на основе отношения функций правдоподобия модели. Поскольку основная выдача построена на основе статистики Вальда, первые выводы удобнее делать на ее основе, а потом уже уточнять результаты, если это необходимо.

Сохранение переменных

Программа позволяется сохранить множество переменных, среди которых наиболее полезной является, вероятно, предсказанная вероятность.

7. Исследование структуры данных

Конечно, собирая данные, исследователь руководствуется определенными гипотезами, информация относятся к избранным предмету и теме исследования, но нередко она представляет собой сырой материал, в котором нужно изучить структуру показателей, характеризующих объекты, а также выявить однородные группы объектов. Полезно представить эту информацию в геометрическом пространстве, лаконично отразить ее особенности в классификации объектов и переменных. Такая работа создает предпосылки к созданию типологий объектов и формулированию "социального пространства", в котором обозначены расстояния между объектами наблюдения, позволяет наглядно представить свойства объектов.

7.1. Факторный анализ

Идея метода состоит в сжатии матрицы признаков в матрицу с меньшим числом переменных, сохраняющую почти ту же самую информацию, что и исходная матрица. В основе моделей факторного анализа лежит гипотеза, что наблюдаемые переменные являются косвенными проявлениями небольшого числа скрытых (латентных) факторов. Хотя такую идею можно приписать многим методам анализа данных, обычно под моделью факторного анализа понимают представление исходных переменных в виде линейной комбинации факторов.

Х1Х2.....ХnF1...Fm

┌──┬──┬──┬──┬──┐ ┌──┬──┬──┐

│ │ │ │ │ │ │ │ │ │

│ │ │ │ │ │ │ │ │ │ 

└──┴──┴──┴──┴──┘ └──┴──┴──┘

Рисунок 7.1 . Сжатие признакового пространства

с применением факторного анализа

ФакторыFпостроены так, чтобы наилучшим способом (с минимальной погрешностью) представитьХ. В этой модели "скрытые" переменныеFkназываются общими факторами, а переменныеUiспецифическими факторами ("специфический" -это лишь один из переводов применяемого в англоязычной литературе слова Unique, в отечественной литературе в качестве определенияUiвстречаются также слова "характерный", "уникальный"). Значения aikназываются факторными нагрузками.

Обычно (хотя и не всегда) предполагается, что Xiстандартизованы (=1,Xi=0), а факторыF1,F2,…,Fmнезависимы и не связаны со специфическими факторамиUi(хотя существуют модели, выполненные в других предположениях). Предполагается также, что факторыFiстандартизованы.

В этих условиях факторные нагрузки aikсовпадают с коэффициентами корреляции между общими факторами и переменнымиXi. ДисперсияXiраскладывается на сумму квадратов факторных нагрузок и дисперсию специфического фактора:

, где

Величина называется общностью,- специфичностью. Другими словами, общность представляет собой часть дисперсии переменных, объясненную факторами, специфичность - часть не объясненной факторами дисперсии.

В соответствии с постановкой задачи, необходимо искать такие факторы, при которых суммарная общность максимальна, а специфичность - минимальна.