
- •Мсм как самостоятельная область научных знаний. Их особенности и отличия от методов классич. Статистики.
- •Основные исторические этапы развития мсм.
- •Классификация мсм. Параметрические и непараметрич. Методы, их различия.
- •Особенности социально-экономической информации. Измерение различ. Данных.
- •1) Особенности соц.-экономич. Инф-ции
- •2) Измерение разнотипных данных
- •Оцифровка неколичественной информации. Основные способы оцифровки.
- •2) Таблица логического описания:
- •4) Таблица рангов
- •6) Таблица сравнений:
- •Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.
- •Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
- •1) Понятие многомерной случайной величины (мсв)
- •2) Примеры наиболее часто используемых законов:
- •3) Проверка статистической гипотезы предполагает:
- •Доверительные области
- •Критерий Хотеллинга для двух многомерных выборок.
- •Критерий Бартлетта и проверка гипотезы об однородности дисперсии.
- •Груб. Ошибки. Причины их появл-ия в статистич. Сов-ти. Методы их выявл-ия.
- •Основные методы устойчивого оценивания параметров выбороч. Совокупности.
- •Корреляционно-дисперсионный анализ многомерных количественных данных.
- •Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи. Количественные многомерные данные
- •Неколичественные многомерные данные
- •2. Коэффициент Кэндалла
- •Вероятностные коэффициенты связи
- •Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.
- •Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.
- •Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.
- •Критерий независимости для таблиц сопряженности.
- •Метод главных компонент.
- •Использование главных компонент в многомерном регрессионном анализе.
- •33) Кластерный анализ качественных многомерных данных
- •34)Методы иерархического кластерного анализа. Алгоритмическая схема. Геометрическая интерпретация результатов. Основные иерархические методы:
- •3. Метод средних связей
- •Дивизивный метод
- •35)Итеративные методы:
- •39) Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.
- •Перечень вопросов по курсу «Многомерные статистические методы»
- •Основные исторические этапы развития мсм.
- •Гауссовское (непрерывное)
- •Общий критерий Хоттелинга:
- •Общий критерий Хоттелинга:
- •Частный критерий Хоттелинга:
- •Одномерный критерий:
- •1.Для количеств.Данных:
- •6 Иерархических методов:
Особенности социально-экономической информации. Измерение различ. Данных.
1) Особенности соц.-экономич. Инф-ции
Проблемы:
- неопределенность самого объекта исследования и его характеристик (например, молодой специалист - это человек до 25 лет или человек с маленьким стажем?)
- неполнота исходной информации, сопровождающая соц.-экономич. исследование (полный перебор причин и факторов невозможен)
- информация может быть измерена в разных шкалах. Особенность заключается в правильном выборе шкалы. Это связано с тем, что большой объем данных является качественным и нуждается в оцифровки.
Оцифровка – способ перевода качественной информации в количественную.
Этот способ должен быть корректен, чтобы работал мат. аппарат.
Понятие связи. Статистич. (вероятностную) связь между соц.-экономич. хар-ками мы будем понимать как причинно-следственную, т.е. о сущ-нии связи мы будем судить по установлен. стр-ре явлений. Проблема заключ-ся в том, что на начал. этапе стр-ра соц.-экон. явления практически неизвестна. Выявление данной структуры и явл-ся целью первич. обработки данных. Связь будет характер-ся 3 принципами: - стохастичностью (она не будет детерминированной); - множественностью; - ложной корреляцией
В регрессионном анализе, чтобы выявить связь, мы делали следующее:
1) формировали зависимую переменную
;
2) формировали независимую переменную
;
3) находили функционал. завис-ть
y=f(x1,…,xm).Желательно,
чтобы ЗР был нормальным, но в реал. жизни
иногда нельзя даже проверить эту
нормал-ть распред-я. Поэтому о нормал.
распределении можно говорить, только
абстрагируясь от реал. ситуации; 4) делаем
допущение относительно функционал.
связи (т.е. мы считаем, что такая завис-ть
действительно сущ-ет). Чтобы избежать
усложнен. формы данного функц-ла, мы
приходим к линейн-ти. После того как мы
выбираем линейн. функционал (парная
регрессия) y=a+bx, коэф-нт детерминации
начинает отражаться коэф-том корреляции:
D = r2,
r = cov(x,y)/xy
Таким образом, само понятие связи в регрессионном анализе искажено из-за многих допущений.
Итак, в МСМ мы уходим от допущений:
- у нас нет зависимых и независ. переменных. X, в данном случае, предикторные (т.е. первопричинные)
- мы не будем говорить о функциональных связях (функционал может не существовать вообще)
2) Измерение разнотипных данных
Социолог, проводя измерения, рассматривает не элементы, не людей, а отношения между ними, их приоритеты. Для проведения измерений социологами разработаны шкалы.
Шкала – набор свойств объекта и сопоставленных им чисел.
Шкала позволяет упорядочить изучаемые социологические характеристики.
Теоретических шкал может быть очень много, а в жизни обычно применяют 3 шкалы:
1) интервальная шкала - это полностью упорядоченная шкала с измеренными интервалами между пунктами шкалы (с точкой отсчета и масштабом):
Отсчет начинается с произвольной точки. В социологии это возраст, время и т.д.
Переход от одного вида шкалы к другому здесь осуществляется по функции вида y = a0 + a1x , где a0 сдвигает точку отсчета, a1 меняет масштаб шкалы.
В интервал. шкале интервалы могут быть равными или неравными в завис-ти от специфики вопроса.
Различают следующие виды интервальных шкал: - относительная (фиксирован масштаб, а точка отсчета выбирается); - абсолютная (точка отсчета фиксированна, а масштаб выбирается самостоятельно)
Здесь работает обычный мат. аппарат (сложение, деление, умножение и т.д.).
2) шкала порядков (качеств. признак выстраивается в монотонную последоват-ть):
Или по-другому, ординарная шкала, ранговая шкала. (ординарный – нормальный, чаще всего встречающийся). По срав-ю с номинал. шкалой можно сказать, что это номинал. упорядоч. шкала, устанавливающая отношения последоват-ти по интенсивности какого-то признака. Такую шкалу обычно применяют при изучении установок людей, отношений к каким-то ситуациям, степень согласия/несогласия с чем-либо и т.д. Каждому из ответов приписывается число, иногда дается задание на ранжирование.
Специфика: известны пункты шкалы, т.е. порядок известен, но расстояния между пунктами не известны.
Различают следующие виды порядковых шкал: - ранговая; - бальная
Здесь работает специфический мат. аппарат - ранговый.
3) номинальная шкала (шкала наименований, неупорядоченная шкала). Эта шкала имеет только одно соответствие (равно / не равно). Пример, нумерация групп (нельзя сказать, какая группа больше, какая группа лучше). По этой шкале можно определять следующие статистические характеристики: - частоты в абсолютных характеристиках (числах) или в %; - моду; - характеристики взаимосвязи признаков;