14 Марта
Митина «разработка и адаптация методик»
анализ процедур общих моделй.
Мы включаем модель фактор, который мы не контролируем, но знаем, что он также может оказывать влияние. Мы его не оцениваем, а просто включаем. проводим оценку аффективности тренера: тренер - мужчины и женщины. Показываем влияние тренинга на какие-то фактор. Но тем неменее фатор пола можем включить в качсевте случаяной переменной.
Нестинг - случайные фактор - вложенный в основной фактором, который мы имеем ввиду, но не оцениваем.
Анализ по ковариатам - не фактор, а некая зависимая перменная, на подобие, которая связана с нашей зависимой переменной. Напрмер с Агрессивностью может быть связана тревожность. Мы смотрим, от каких факторов зависит агрессивность человека, а в качесвте ковариата берем еще факторы. Включем в регерессионную модель фатор6 который действует объяснительно наряду с нашей ЗП - усиливает или ослабляет данный компонент в модели. Если возьмем ковариату, которая ника не связана с нашей ЗП, то объяснительная сила модели упадет. Тогда включаем другую ковариату - поиск зависимые с нашей ЗП высоко коррелируемые переменные, то есть ковариаты, которые ее усиливают. Добаляя ковариату мы добавляем дополнительные переменные, связанный с основной. Можно привести коофициент корреляции в качестве оправдания.
При обработке данных хорошо посмотреть на связь переменныз и найти координаты на ковариату!
непараметр Критерий сравнения медиана для зав и незав выборок Ранговые критерии (основаны на ранжировании нескольких выборок)
отличие от ДА - нельзя оценить эффект межфакторного взаимодействия. Критерии используются для сравнения центр медиан нескольких выборок, когда их больше двух. Для неметрических данных.
Например, критерий Фридмана - если между выборками нет различий, то и ранжирование будет случайно. Надо знать, какой критерий использовать для каких задач.
Обобщенная линейная модель - разносят логику дисперсионного анализа на ненормальное распределение - неметрические данные - непорядковое и номинальные данные. Оценивают факторные эффекты и их взаимодействуют. Обраьотка многоуровневые данные - данные с иерархической структурой - общий фактор влияет на нижележащие.
Общая линейная модель - логика нормального распределения
Способы порверки гипотез о связи, о группировке данных (варианты корелляционного анализа КА)
Задачи:
оценить кол-во связей между переменнами
когда переменных много -смотрим, можем ли мы, изучая связь между перменными, разделить их на группы
если мы считаем, что 2 перменные связаны, одна из них предиктор (объясняет), то это уже задачи регрессионного анализа.
Методы оценки связи (коофиценты - не все из них корелляционные)
Связь - это необязательно корреляция (а любая корреляция обязательно связь).
факторный анализ помогает визуализировать связи
многомерное шкалирование
кластерный анализ
структурное моделирование (с помощью линейных уравнений). Супер факторный анализ. Группа методов, кот развивалась для психологии. Если цель исследования - адаптировать опросник, и мы знаем структуру шкал опросника, то мы можем посмотреть, а схожи ли наши факторы с моделью зарубежного коллеги. Какую структуру имеют нашие данные, когда мы указываем кол-во факторов, их связи, то есть когда мы сами строим структуру данных.
анализ - корреляции - парные
Пирсон - самый мощный. (количесвенный/ метрический -отношения и интервалы). Коофициент линейной корреляции. Надежно оценивает линейную связь, если связь не линейная, то дает ошибки.Надо сначала построить диаграмму рассеивания (график связи двух переменных и посмотреть : если в линейку располагаются, то ОК.
> 0.7 высокий
>0.5 - 0.7 средний
<0.5 низкий
Коэффициент детерминации: коэффициент корреляции, возведенный в квадрат - % выбоки, которые имеют эту связь.
Коофицент ковариации - коофициент корреляции, деленный на дисперсию
Спирмен (более мощный) и Кендалл - порядковая, Спирмен свободен от линейности.
Одна порядкоая, другая - выше порядковая -> значит коофицент спирмена
Неметрические еданные (ожни нрминальные, другие - порядковые). Анализ - описательная статистика - таблица сопряженности. Если сопрягаем номинальную и интервальную, то первая всегда в строчке, а вторая в столбце. Здесь показывается не уровень значимости, а именно уровень корреляции, измеряется от 0 до 1. А в чем измеряется мы не знаем - хоть в папугаях
анализ - корреляции - частный коофициент корреляции
А не есть ли связь между двумя переменными, не детерминирована эта связь третий переменной. В расчете коофицента корреляции участвуют уже ри перменные. Как будет меняться коофициент корреляции наших переменных при условии влияний третей переменной.
Факторный анализ
анализ - снижение размерности - факторный анализ
сетод снижения размерности корреляционой матрицы, большую пытаемся заменить меньшей, чтобы выделить сгустки корееляций между переменными и выделить факторы. Метод обощения, сжатия данных, когда имеем большую структуру. Иногда используют как разведочный метод. В «описательных» выбрать «описательные статистики» если нудно среднее и дисперсии по каждой перменной. Часто используют для получения корреляционный матрицы - красиво выглядит.
extraction - извлечение факторных нагрузок.
Метод главных компонент - строго говоря не есть ФА, а способ приведения собственной матрицы к главным компонентам. Отличие от ФА; общность, специфичность и специальность. Какова доля общих факторов для всех переменных, нагрузка общих факторов - общность. Если общность низкая6 то она нагружена другими факторами.
Начальное решение - график и таблица ДО вращения.
Хорошо проведенный ФА - испробовали несколько немного методов факторизации и получили одни и те же данные.
Варимакс - процедура вращения, которая максимально приближает переменные к осям факторов. Способ повышения интерпретабильности путем вращения вокруг точек переменных.
Ортогональное вращение -
Косвенное вращение -
Поиск наилучшего графического решения.
IQS программа для структурного моделирования
Дать запрос Гусева на учебник + Ольга Валентина
21 марта
Оценить силу, направленность, тесноту и группировку переменных/ испытуемых.
Меры оценки сходства и разоличия (не корреляция)
Регрессионный анализ
ФА
Хорошо определяет перменные, которые связаны линейно, потому что формула факторнага анализа - линейная. Плюс нужен метрический уровень измерений (не ниже шкалы интервалов). На один фактор - не менее трех переменных - very good.
Планирование факторного исследования - переменных 30 - испытуемых 90. В раза больше испытуемых - минимум!! а переменных в три раза больше факторов.
Снижение размерности - ФА - извлечение - матрица ковариации или корреляции: если перменные в одной размерности - кореляция; разной- надо стандартизировать, использовать ковариацию.
Метод главных компонент (строго говоря не ФА)
Метод главных факторов = ФА (оценивает в линейную модель вклад только общих факторов). Чаще всего используют.
Если сомневаетесь, то сделаете разные методы обработки ФА. Общая конфигурация - гуд. Увеличение достоверности.
Собственные значения (=все=вклад данного фактора в эту переменную)- сумма квадратов каждой переменной по фактору. Кол-во факторов с весом > 1.
Вращения.
ФА дает некое расположение переменных относительно осей факторов. Вращение позволяет повернуть оси вокруг векоторв переменных. Варимакс так поворачивает факторные оси относительно перменных, чтобы некоторые переменные имели масимальные факторные нагрузки, а другие минимальные. Так повернуть, чтобы часть переменных прижались к одним факторам, другая - к другим. Квартимакс - усиливает интерпретацию переменных, а аваримакс факторов. Метод косоугольного вращения - если не очень хорошо получилась фактурная конфигурация, дает лучшую интерпретацию. Чаще всего используют облимин. Не забывайте про извлечение - график собственных значений!!!! (поставить галочку)
Факторная нагрузка -коофицент корреляции переменных с фактором. Факторы называют соответственно переменным.
ФА позволяет фаткоризовтаь переменные, но часто надо построить структуру по испытуемым. каждого испытуемого выразить через фактор - вычислить факторные коэффициенты (аналог факторных нагрузок). Постороить матрицу факотрных коофицентов - каждый испытуемый получит значения по первым факторам.
ФА - значение факторов - сохранить как перемнные!!!
Построение модели и расположение переменных в пространстве n-факторов в зависимоти от веса фактора
Расположение испытуемых в некоторм факторном пространстве
Анализ - корреляции - расстояния (номинальные данные можем помсотреть!!!)
Эвклидово расстояние как мера сходства и различия в n-мерным пространстве. Можно оценивать связь между номинальной и кол-вой переменной. Можно посмотреть сходство/ различия между переменными (под корнем испытуемые) или испытуемыми (под корнем переменные).
Анализ - корреляции - расстояния- меры (файл мерв различия и сходства для разнных типов данных - зависит от уровня переменных).
Интервальная - по шкалам.
Частоты - это в штуках (я дала 5 ответов правильных, Фи-квадрат = хи-квадрат, деленное на общее кол-во выборки. Петя 2 правильных).
Бинарная - обычная категориальная оценка - номинальная (да/нет; муж/ жен). Надо составить матрицу 2*2, чтобы понять, сколбко раз одинаково ответили.
Распечатываем матрицу сходств и различий - распечатываем и метим маркером, чтоы издалека посмотреть.
Регрессивной анализ
Анализ - регрессия - линейная
Одну перменную можно объяснить через другую через линейную функцию и насоклько будет хорошее объяснение. Можно ли через НП объяснить ЗП.
Анализ - регрессия - Подгонка кривых (вывести дисперсионный анали, чтобы посмотреть достоверность наших данных). R-квадрат - %процентов случаев мы можем по значению А предсказать Б.
анализ - классификация - Кластерный анализ
Что дает по сравнению с ФА. Позволяет кластеризовать любые данные!! Способ объединения переменных, потому что они похожи по ответам переменных. КА дает качесвтенные решения, а ФА колличесвтенные. Критерий ближнего соседа - объединяем ближние точки. Есть еще девизионная стратегия - разделяющая (хотим подчеркнуть различия).
анализ - классификация - иерархическая кластеризация (древовидная структура)
наблюдения = кейсы - испытуемые
1.методы
межгрупповые связи - сходные к сходным
2.мера
3.!!! Стандартизация по Z-значениям!!!
4. статистики: агломирация - как дейстововал SPSS
5. графики дендрограмма. Как ее читать. 25 единиц - мах различие/ расстояние.
внутригрупповые - растянуть, подчеркнуть связи
Если разные методы дали одну и туже картинку, то это вери гуд.
Есть еще метод Варда. Сходства подчеркивает, а различия усиливает.
28 марта
Бутстреппинг
Случайным образом делается много под выборок и строится распределения большого числа под выборок по заданном критерию (среднее например). Смотрим доверительный интервал. Для большей убедительности нашего вывода. Корреляционное исследование всегда покажет наличие связи на большой выборки. А будстрепинг, разбивая на под выборки, показывает надежность итогового вывода. Оценить доверительный интервал, его надежность, устойчивость нашего параметра (среднее, стд откл, коэффициент корреляции).
50 испытуемых - получили неожиданный результат. Сделайте подвыборки (3) и проверит те же самые гипотезы. Тем самым показывает, что ваш общий вывод это не случайность. Проверки критерия статистических гипотез.
Анализ - описательные статистики - частоты - (выбираем критерий - ст. откл, среднее)- бутсреп
Выборка рас слоенная - если выборка стратифицированная (пол, мотивация, возраст). Имелся однородная, то простая выборка.
На примере сказочного дифференциала, где выборка маленькая (15 человек). Корреляция показала связь между Мальвиной и пьеро. и Анализ - корреляция - парные - (добавляем Мальвиной и пьеро), далее будстрепинг. Получился большой доверительный интервал, что плохо.
Анализ - сравнение средних - Т-критерий для парных - бутсреппинг
Анализ - Шкалирование
Анализ пригодности - анализ надежности пунктов опросников (неправильный перевод). Берем пункты, которые работают на одну шкалу, и переносим их в пункты. Считается на коофиценте корреляции альфа-кромбаха (0.6-0.7-0.8 хороший; 0.3 - 0.4 плохо ) - суммарный вклад всех пунктов в шкалу. Опасно- обращать внимание на прямые и обратные пункты. Если таковые есть, то надо их переобозначить для спсс (7 обратная станет 1). Можем еще заказать расщемленные пополам (split half) - вся выборка пунктов делиться пополам и они сравнивается, если по первой половине пунктов одинакове альфа-кромбаха, то это хорошо. Если нет, то сморим, какой пункт не туда попала. Обязательно заказываем статистики (все 3): "шкалы, если пункт удален" - какая будет величина альфа-кромбаха, если удалить 1 пункт, потом 2 - смотрим, кой пункт не работает. Итоговые статистики тоже заказываем. Смотрим по ст. Откл - если маленький разброс, то на все пункты дали одинаковый ответы плохо описывает шкалу.
Система Test - Maker.
Анализ - Шкалирование - многомерную Шкалирование (более общие и универсальные, могут быть ошибки).
Просим испытуемых оценивать различия между объектами, то получаем матрицу смешения попарены оценок, матрицу субъективного различия. Выделить основные оси субъективного измерения, на основе которой делаем субьективную оценку.
Если ФА требует кол-ые измерения (шкала интервало), то для Шкалирование можно и не метрические (эта процедуру универсальная).
Самым простой вариант - дать испытуемому дать задачу оценивать различия между объектами.
Анализ Шкалирование - много мерное (ALSCAL)
Сказочные герои - сотворить субьективную модель пространства переменных оценки детей героев
Вычислить расстояние по данным
Инт-эвклидова
Частоты - хи квадрат
Внимательно со стандартизацией
Мебель метрическая я(отношения яи инт); неметрическая (порядковая). Если слабая порядковая шкала ( 5 оценок), то можно использовать "раз вызывать связанные"-искусственно растягивает бальные оценки (но лучше дорвать интервал в 10 был в начале исследования). Коэффициент хорошести -stress. RSQ - множественный коэффициент корреляции
Анализ Шкалирование - много мерное (PROSCALE)
Параметры - начальная конфигурация - метод симплекса более современный и универсальный
Графики - общее пространство и исходные близости
Стечет согласия - коэффициент конгруэнтности Такера - аналог коэффициента корреляции
Расстояния - данные содержат различия - есть критерия различие ни
Проскейл (сходства) современнее. Но когда мало данных он отказывается считать, тогда аскейл (матрица различий) .
