Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR / Rost SPSS.doc
Скачиваний:
61
Добавлен:
15.05.2015
Размер:
8.1 Mб
Скачать

6.2.9. О статистике Вальда

Как отмечено в документации SPSS, недостаток статистики Вальда состоит в том, что при малом числе наблюдений она может давать заниженные оценки наблюдаемой значимости коэффициентов. Для получения более точной информации о значимости переменных можно воспользоваться пошаговой регрессией, метод forward lr(lr likelyhood ratio – отношение правдоподобия). Тогда для каждой переменной будет выдана значимость включения/исключения, полученная на основе отношения функций правдоподобия модели. Первые выводы удобнее делать на основе статистики Вальда, а потом уже уточнять результаты, если это необходимо.

6.2.10. Сохранение переменных

Программа позволяет сохранить множество переменных, среди которых наиболее полезной является, по-видимому, предсказанная вероятность.

Глава 7. Исследование структуры данных

Хотя исследователь и руководствуется определенными гипотезами в процессе сбора данных, информация нередко представляет собой сырой материал, в котором нужно изучить структуру показателей, характеризующих объекты, а также выявить однородные группы объектов. Полезно представить эту информацию в геометрическом пространстве, лаконично отразить ее особенности в классификации объектов и переменных. Такая работа создает предпосылки для построения типологий объектов и определения «социального пространства», в котором обозначены расстояния между объектами наблюдения.

7.1. Факторный анализ

Идея метода состоит в сжатии матрицы признаков в матрицу с меньшим числом переменных, сохраняющую почти ту же самую информацию, что и исходная матрица. В основе моделей факторного анализа лежит гипотеза, что наблюдаемые переменные являются косвенными проявлениями небольшого числа скрытых (латентных) факторов. Под моделью факторного анализа понимают представление исходных переменных в виде линейной комбинации факторов.

Х1 Х2 ..... Хn F1 ... Fm

┌──┬──┬──┬──┬──┐ ┌──┬──┬──┐

│ │ │ │ │ │ │ │ │ │

│ │ │ │ │ │ │ │ │ │ 

└──┴──┴──┴──┴──┘ └──┴──┴──┘

Рис. 7.1. Сжатие признакового пространства

с применением факторного анализа

Факторы Fпостроены так, чтобы наилучшим способом (с минимальной погрешностью) представитьХ. В этой модели «скрытые» переменныеFkназываются общими факторами, а переменныеU– специфическими факторами («специфический» – это лишь одно из значений используемого в англоязычной литературе словаunique, в отечественной литературе в качестве определенияUiвстречаются также слова «характерный», «уникальный»). Значенияaikназываются факторными нагрузками.

Обычно (хотя и не всегда) предполагается, что Xiстандартизованы (= 1,Xi = 0), а факторыF1, F2, …, Fmнезависимы и не связаны со специфическими факторамиUi(существуют модели, выполненные в других предположениях). Предполагается также, что факторыFiстандартизованы.

В этих условиях факторные нагрузки aikсовпадают с коэффициентами корреляции между общими факторами и переменнымиXi. ДисперсияXiраскладывается на сумму квадратов факторных нагрузок и дисперсию специфического фактора:

, где.

Величина называется общностью,– специфичностью. Другими словами, общность представляет собой часть дисперсии переменных, объясненную факторами, специфичность – часть не объясненной факторами дисперсии.

В соответствии с постановкой задачи необходимо искать такие факторы, при которых суммарная общность максимальна, а специфичность – минимальна.