- •Тема 1. Предмет и задачи социологии. Структура социологического знания.
- •Социология как наука.
- •Основные задачи современной социологии: описание социальных процессов и явлений, их объяснение и предвидение.
- •Структура современного социологического знания.
- •Понятие «теорий среднего уровня».
- •Макро- микросоциология; теоретическая и эмпирическая социология.
- •Основные модели социологического объяснения (натурализм, функционализм, структурализм, интерпретативный подход); базовые предположения и общая характеристика.
- •Профессиональная этика социолога.
- •Тема 2. Основные этапы развития социологического знания. История классической социологии.
- •История социологии как область знания.
- •Социология Огюста Конта
- •Социологические идеи Карла Маркса (понятие общественной формации, теория социального развития, классы и классовая борьба).
- •Георг Зиммель (1857 - 1918)
- •Эмиль Дюркгейм (1858 - 1917).
- •Тема 3. Современные социологические теории.
- •Основные парадигмы социологической теории: общая характеристика и этапы развития.
- •Особенности развития социологической теории на современном этапе.
- •Социологические теории деятельности и практической рациональности: общая характеристика.
- •Теория социального действия Парсонса.
- •Проект социальной феменологии а.Щюца.
- •Драматургическая социология Гофмана.
- •Этнометодология.
- •Социологические теории обмена: истоки и общая характеристика (б. Скиннер, Дж. Хомманс, п. Блау)
- •Теория коммуникативного действия ю. Хабермаса.
- •Теории конфликта. (Козер, Дарендорф)
- •Современный теоретический синтез: теория структурации э. Гидденса, теория «практического смысла» п. Бурдье, теория систем н. Лумана.
- •Пост-модернистское теоретизирование в социологии.
- •Тема 4. Культура и общество.
- •1. Функционализм
- •2. Символизм
- •3. Адаптивно-деятельностный подход
- •Структура культуры.
- •Ценности.
- •2. Нормы.
- •Функции культуры
- •1. Коммуникативная
- •2. Регулятивная
- •3.Социализирующая.
- •4. Интегрирующая
- •Субкультуры и контркультуры
- •Социологический анализ идеологии.
- •Концепт идеологии и проект социологии знания Манхейма.
- •Идеология: ложное сознание и иллюзорная форма классовой борьбы (к. Маркс).
- •Тема 5. Социальная структура, социальное неравенство и стратификация общества.
- •Определение общества и его основные признаки.
- •Проблема социальной упорядоченности. Исторические типы обществ(охотников и собирателей, сельское общество, индустриальное общество, постиндустриальное общество)
- •Признаки общества (до глобализации) по Шилзу:
- •Социальная структура общества, ее элементы.
- •Уровни социальной структуры (макро- и микроуровни) Статус и роль – их взаимосвязь.
- •Тема 6. Личность и общество. Социальное взаимодействие.
- •Социализация как процесс усвоения культуры
- •Развитие личности
- •Ч. Х. Кули теория зеркального я
- •Особенности социализации в традиционном и современном обществах
- •Жизненные циклы социализации.
- •Социальные отношения и взаимодействия.
- •Социальные взаимодействия и социальное поведение: основные социологические подходы
- •Коммуникация.
- •Тема 7. Социальные группы и организации.
- •Понятие социальной группы: основные признаки группы, виды и классификации социальных групп.
- •Регуляция поведения в группе: групповое давление, групповые нормы и санкции, групповой конформизм, механизмы социального включения-исключения в группе.
- •Формальные организации.
- •Иерархия, лидерство и коммуникация в организациях.
- •Соотношение формальных и неформальных структур в организации.
- •Классические (м. Вебер) и современные теории бюрократии.
- •Бюрократия и олигархия («железные закон олигархии» р. Михельса).
- •Тема 8.Основные социальные институты - 1.
- •Функции и виды социальных институтов
- •Процессы институциализации
- •Важнейшие социальные институты (общая характеристика): семья и брак, образование, наука, религия.
- •Политико-правовые институты государства и институты гражданского общества. Т. Парсонс о природе социальных институтов (институты как структурно организованные наборы ролей).
- •Наука как социальный институт.
- •«Стандартная концепция науки» и релятивизм Фейерабенда-Куна.
- •Социология науки Роберта Мертона (модель равновесия рационалистического и социологического объяснения, принципы научного этоса, амбивалентность мотивации в академической профессии, «эффект Матфея»).
- •Программа «этнографии науки» (к. Кнорр-Цетины, лабораторные исследования с. Вулгар и б. Латура), «сильная программа социологии знания» д. Блура и б. Барнса.
- •Социальные функции институтов экспертизы и экспертного знания.
- •Образование как социальные институт: определение и функции.
- •Организационная структура системы образования в современных обществах: начальное, среднее, высшее.
- •Концепция б. Бернстайна («Класс, коды и контроль»): ограниченный и развитый речевые коды и проблемы адаптации представителей низших слоев в школьной среде.
- •И. Иллич: влияние скрытой программы и формирование «бесшкольного» общества.
- •Роль системы высшего образования в постиндустриальном обществе (д. Белл).
- •Наука и университеты в ситуации постмодерна (ж. Ф. Лиотар). Тема 9. Основные социальные институты-2.
- •Профессии как социальные институт.
- •1. Англо-американские исследования профессий
- •2. Континентальные исследования
- •4. Становление интеллектуальных дисциплин
- •5. Американская профессиональная система
- •7.«Университетский узел» и профессиональный комплекс
- •Политическая власть в современном обществе: основные интерпретации. Тема 10. Социальный порядок, контроль и отклоняющееся поведение.
- •Нормы, ценности, санкции – три составляющие социального контроля.
- •Основные механизмы социального контроля.
- •Конформность и девиантное поведение.
- •Социальная вариативность понятия нормы и ее изменчивость. Основные теории отклоняющегося поведения (биологические, психологические и социологические теории).
- •Социологические теории преступности.
- •Социология конфликта как парадигма современного социологического мышления.
- •Тема 11. Социальные изменения, модернизация и глобализация.
- •Понятие и социологический смысл социальных изменений. Микро- и макроуровни социальных изменений. Понятие модернизации.
- •Теории капитализма к. Маркса и м. Вебера.
- •Рациональный
- •Источники и главные движущие силы социальных изменений (социальный конфликт, технологический прогресс, демографический рост, культурные и научные инновации).
- •Модели социальных изменений (эволюционистская, циклическая, конфликтологическая). Процесс индустриализации. Расширенное развитие и конвергенция.
- •Тема 1: Предмет экономической социологии
- •1. Где пролегают различия между эк. Теорией и эк. Социологией?
- •4. В чем состоит различие методологического индивидуализма, принятого в экономической теории и социологии?
- •5. Опишите и поясните экономсоциологическое значение понятия «социальной укорененности».
- •6. Опишите способы построения моделей «социологического человека» в экономике.
- •7. В чем состоят ключевые методологические задачи экономической социологии?
- •8. Где начинается и где заканчивается компетенция экономической социологии?
- •Тема 2: Два подхода к человеку в социальной теории
- •2. В чем заключается специфика нового институционализма в эк-ке? Дайте объяснение понятию "институт", которое было принято большинством сторонников этого направления.
- •3. Что такое эконом. Империализм? Изложите осн. Идеи этого феномена науки на примерах работ Беккера
- •4. Изложите основные элементы критики немецкой исторической школы ключевых идей либеральной политической экономии
- •5. Почему Маркса, Вебера и Дюркгейма относят к классикам экономсоциологии?/
- •6. В чем состоят различия между старой и новой экономсоциологией?
- •8. Сетевой подход.
- •9. Изложите ключевые идеи "социоэкономики" (Этциони)
- •Тема 3: Социальная укорененность экономического действия
- •1. В чем состоят различия между пере- и недосоциализированными концепциями человеческого действия в социологии и экономической теории?
- •2. Каким образом доверие, порожденное личными отношениями, способствует возникновению феномена мошенничества?
- •3. Дайте определение содержательного и формального значения термина «экономический».
- •4. Почему хозяйство, согласно к.Поланьи, является институционально оформленным процессом?
- •5. Чем отличаются процессы обмена, осуществляемые в симметричных группах и ценообразующих рынках?
- •6. Выделите основные элементы экономического действия.
- •7. Чем экономически обусловленные действия отличаются от экономически ориентированных?
- •8. Дайте определение понятию капитал и охарактеризуйте основные элементы капитала.
- •9. Опишите основные формы капитала в их объективированном, институализированном и инкорпорированном состояниях.
- •Тема 4: Хозяйственное действие и типы рациональности
- •Дайте определение понятия «принуждение». Какие формы принуждения могут быть использованы в хозяйственной деятельности?
- •Назовите и охарактеризуйте три источника хозяйственной мотивации.
- •В чем состоит специфика экономического подхода к рациональности?
- •В чем состоит противоречие между «объективной» и «субъективной» рациональностью?
- •Опишите эволюцию экономических взглядов на природу интереса.
- •6. В чем состоит специфика социологического взгляда на природу рациональности?
- •Что такое формальная и субстантивная рациональность? Чем отличаются указанные формы рациональности?
- •Что такое локальная рациональность?
- •Тема 5: Хозяйственная власть и экономическая культура
- •2 Как хозяйственная культура способствует регуляции хозяйственной деятельности.
- •3 Определение хозяйственной власти. Основные элементы хозяйственной власти.
- •5 Каким образом связаны между собой процессы социализации и хозяйственной деятельности.
- •6 Выявите экономическое и социологическое значение феномена дарения.
- •7 Что такое концепции контроля? Каким образом концепции контроля могут стабилизировать ситуацию на кризисных рынках?
- •8 Сравните подходы н. Флигстина, н. Биггарт и х. Уайта к рынкам.
- •Тема 6: Социология хозяйственных организаций
- •1. Опишите основные неоинституциональные экономические теории организаций. В чем состоит социологическая критика этих теорий?
- •2. Что такое организация с социологической точки зрения? Дайте ряд социологических определений организации.
- •3. Какими признаками должна обладать организация?
- •4. Каким чертами должна обладать хозяйственная организация?
- •5. Сравните основные виды хозяйственных организаций выделив общие и особенные признаки каждого вида организаций.
- •6. Вслед за м. Вебером охарактеризуйте основные черты бюрократической организации.
- •7. Назовите основные способы построения организаций по способу подчинения своих членов и утверждения внутреннего контроля.
- •8. Охарактеризуйте идеальные типы хозяйственных организаций и раскройте способы их построения.
- •9. Опишите четыре способа построения авторитета внутри фирмы.
- •10. Каково отношение между так называемыми «традиционными» и «современными» формами организаций?
- •Тема 7: Трудовые отношения и трудовой контроль
- •2. Какими недостатками, по мнению ф.Тейлора, страдала традиционная система управления и что, по его же мнению, необходимо было предпринять для их устранения?
- •3. Изложите основные принципы фордизма.
- •4. Опишите хоторнские эксперименты. Каковы основные результаты этих экспериментов? Концепция человеческих отношений.
- •5. Что в современной экономической социологии понимается под институционализацией трудового конфликта?
- •6. Опишите методы активного и пассивного сопротивления менеджменту.
- •7. Какие мотивы движут исполнителями в коллективных действиях?
- •8. Какие социальные изменения способствовали достижению трудового компромисса в ведущих западных странах?
- •9. Сравните подходы теории действия и институциональной школы к определению исходных посылок, формирующих стратегии исполнителей.
- •Тема 8: Социология занятости
- •1) Назовите основные элементы отношений занятости. Какие социальные группы находятся вне сферы занятости (рынка труда).
- •2) В чём проявляется неоднородность рынка труда?
- •3) Опишите концепцию внутренних и внешних рынков труда.
- •4) Чем стратегия функциональной гибкости отличается от стратегии численной гибкости?
- •5) Назовите и охарактеризуйте наиболее привлекательный для наёмных работников сегмент рынка труда.
- •6) Опишите наиболее популярное стратификационное деление рынка труда на «ядро» и «периферию».
- •7) Какие факторы обуславливают сегментацию групп занятых?
- •8) Опишите основные положения теории человеческого капитала г. Беккера.
- •9) Кто одним из первых среди экономсоциологов обратил внимание на значимость социальных связей при трудоустройстве? Каким образом персональные контакты способствуют трудоустройству?
- •10) С какими проблемами сталкиваются исследователи и официальные лица при определении статуса безработного?
- •Тема 9: Социология домашнего хозяйства
- •1: Что понимается под домашним хозяйством?
- •2: Насколько правомерно противопоставление домашнего хозяйства и рыночной занятости?
- •4. Каким образом разделение труда в домохозяйстве связано с изменениями занятости на рынке труда? Опишите модели приспособления д/х к этим изменениям.
- •5. Субстантивная экономика.
- •6. Почему в моральной экономике принцип рациональности зачастую не работает?
- •7. Какие группы факторов определяют социальную структуру домашнего хозяйства?
- •8. Какие изменения произошли и в структуре домашнего хозяйства за последние десятилетия?
- •Тема 10: Неформальная экономика
- •По каким причинам важно изучать неформальный сектор экономической активности? Дайте ответ с точки зрения экономистов, политологов и социологов.
- •2. Версии причин существования неформальной экономики в развивающихся странах
- •3. Версии причин существования неформальной экономики в развитых странах
- •4. Каковы исторические корни развитости неформальной экономики в России?
- •5. Каким образом определенные этнические группы способствуют воспроизводству неформальной занятости?
- •6. Какова связь между неформальной экономикой, домашней экономикой и нерыночными формами обмена, например, реципрокностью?
- •7. Дайте классификацию неформальной экономики по степени легальности и регистрации. Могут ли пересекаться эти формы неформальной активности?
- •8. В чем состоит отличие экономсоциологического и экономического подходов к изучению неформальной экономики?
- •9. Каким образом могут осуществляться практики легитимации неформальной деятельности.
- •Тема 11: Социология потребления
- •1. В чем состоит различие моделей поведения потребителя в экономике и социологии?
- •2. В чем состоит функция потребления согласно марксистской традиции?
- •3. В чем различие между показным и подставным потреблением? (Веблен)
- •Веблен «Теория праздного класса» 1899 г.
- •В чем состоит связь между референтными группами и феноменом рекламы?
- •Что такое символическое насилие? (Бурдье)
- •Каким образом потребительское поведение связано с социальной стратификацией индивидов и групп?
- •2. Современный интерьер.
- •Чем постмодернистские теории потребления отличаются от марксистских концепций потребления?
- •8. Что такое «габитус» и как он влияет на дифференциацию потребительских практик?
- •Какие типы потребительского потребления вы знаете? Опишите специфику стиля жизни различных социальных групп в современной России?
- •Тема 12: Человек в социальной иерархии
- •Вопрос 1. На примере современного российского общества опишите комбинацию стратификационных систем. Можно ли говорить о том, что одна из систем стратификации является в настоящее время доминирующей?
- •Вопрос 2. Каким образом связаны феномены социального исключения и социальной мобильности?
- •Вопрос 3. Чем социальные классы отличаются от статусных групп? Какова значимость объективных и субъективных методов стратификации при выделении статусных групп и социальных классов?
- •Вопрос 4. В чем состоят различия м/у веберианским и марксистским стратификационными подходами?
- •Вопрос 6. В чем состоят ключевые аргументы сторонников идеи о «смерти социальных классов»?
- •Вопрос 7. Каким образом осуществляется выделение среднего класса в стратификационных исследованиях? Опишите основные подходы и схемы операционализации.
- •Вопрос 8. Чем низшие классы отличаются от андеркласса?
- •Тема 13: Социология финансового поведения населения
- •Вопрос 1. В чем заключается специфика экономико-социологического подхода к изучению сбережений по сравнению с экономическим подходом?
- •Вопрос 2. В чем различия понятия запасов и потоков сбережений.
- •Вопрос 3. Какие показатели потоков и запасов сбережений существуют в национальной статистике? Как они взаимосвязаны?
- •Вопрос 4.В чем основное отличие модели сберегательного поведения Дж. Катоны от гипотезы перманентного дохода?
- •Вопрос 5. Опишите основные положения теории социальной множественности денег в. Зелизер.
- •Вопрос 6. Каким образом пример со становлением страхования жизни в Америке XIX века иллюстрирует экономико-социологический тезис о социальной укорененности финансового поведения людей?
- •Вопрос 7. Какую классификацию типов управления семейными финансами предложила ж.Пал ?
- •Вопрос 8. От чего зависит выбор типа управления финансами в семье?
- •Тема 14: Формирование и смена хозяйственных идеологий
- •Дайте определение понятию «хозяйственная идеология». Выделите основные элементы хозяйственной идеологии.
- •На каких уровнях происходит воспроизводство хозяйственных идеологий? Охарактеризуйте каждый уровень.
- •Что такое идеологическая система? Чем идеологическая система отличается от идеологической программы?
- •Опишите основные типы идеологических систем. Чем они отличаются друг от друга.
- •Что в современной экономической социологии понимается под идеологическим гибридом?
- •Какие сдвиги произошли в описании хозяйственной системы России в последнее десятилетие?
- •Как осуществляется смена идеологических парадигм?
- •Тема 9. Виды массовых опросов, их организационные и методические особенности. 324 Тема 1.Элементы теории измерений.
- •1.1 Общее определение измерения. Понятие шкалы и ее допустимого преобразования. Понятие формальной адекватности метода. Общее представление о содержательной адекватности. Примеры.
- •1.2 Основные используемые в социологии шкалы: номинальная, порядковая, интервальная, шкалы отношений и разностей, абсолютная. Их допустимые преобразования.
- •Тема 2. Основы математической статистики.
- •2.2 Понятие точечного и интервального оценивания. Состоятельность, несмещенность, эффективность оценок.
- •2.3 Построение доверительных интервалов для матем. Ожидания и доли. Вычисление объема выборки.
- •2.4 Общее представление о проверке статистической гипотезы: цели, логика. Проверки гипотезы о независимости признаков на основе критерия «хи-квадрат».
- •Тема 3. Общее представление о выборочном методе в социологических исследованиях.
- •3.1 Преимущества и недостатки выборочных и сплошных исследований.
- •3.2 Вероятностные выборки. Их виды.
- •3.3 Невероятностные выборки. Их виды.
- •3.4 Ошибки выборки. Ее ремонт. Недостижимые единицы, взвешивание.
- •Тема 4. Анализ одномерных и двумерных частотных распределений.
- •4.1 Виды одномерных распределений. Проблемы, возникающие при их построении.
- •4.2 Основные меры средней тенденции распределения значений признака.
- •4.3 Основные меры разброса значений признака.
- •4.4 Коэффициент «хи-квадрат». Производные от него.
- •4.5 Коэффициенты ранговой корреляции.
- •Тема 5. Корреляционно-регрессионный анализ в социологии.
- •5.1 Коэффициент корреляции: формула, вид измеряемой связи, тип используемых шкал, роль в социологии.
- •5.2 Основные идеи регрессионного анализа. Линейная регрессия. Интерпретация коэффициентов уравнения линейной регрессии, их статистическая оценка.
- •5.3 Ограничения регрессионной модели. Способы их преодоления.
- •5.4 Регрессия с фиктивными переменными: определение, цели использования.
- •Тема 6. Модели факторного анализа в социологии.
- •6.1 Общая модель факторного анализа. Значение ее использования для социологов.
- •6.2 Оценка качества факторной модели.
- •6.3 Проблема интерпретации факторов в факторном анализе.
- •Тема 7. Модели кластерного анализа в социологии.
- •Тема 8. Общие принципы проведения социологического исследования.
- •8.1 Понятие методологии, метода, техники, методики, процедуры в социологических исследованиях.
- •8.2 Программа социологического исследования: роль, функции, требования к ней, ее структура.
- •1. Проблема, объект и предмет исследования
- •2. Определение цели и задач исследования
- •3. Уточнение и интерпретация основных понятий
- •4. Предварительный системный анализ объекта исследования
- •5 Ыдвижение рабочих гипотез
- •8.3 Операционализация понятий в социологии.
- •Тема 9. Виды массовых опросов, их организационные и методические особенности.
- •9.1 Виды опроса: основания классификации.
- •9.2 Виды интервью. Достоинства и недостатки каждого подхода.
- •9.3 Подготовка интервьюеров и контроль качества их работы. Эффект интервьюера.
- •9.4 Возможности разрешения противоречий между содержательными задачами исследования и организационно-экономическими ограничениями.
- •Тема 10. Анкета как исследовательский инструмент. Вопрос как исследовательский инструмент в соц. Опросе.
- •10.1 Анкета как исследовательский инструмент.
- •10.2 Разные концепции и функции вопроса.
- •10.3 Логическая структура вопроса. Ошибки, связанные с ее нарушением и с конструированием области поиска ответа.
- •10.4 Социолингвистические, социокультурные, психологические требования к вопросу.
- •10.5 Эмпирическая апробация вопросника.
- •Тема 11. Наблюдение в социологии.
- •11.1 Наблюдение как общенаучный метод. Специфика наблюдения в социологии.
- •11.2 Классификация видов наблюдения в социологии.
- •11.3 Плюсы и минусы метода наблюдения.
- •Тема 12. Качественные методы в социологии.
- •Наблюдение
- •Глубинное интервью
- •Метод фокус-группы
- •Анализ личных документов
- •Визуальные документы
- •Сферы применения
- •12.4. Метод фокус-групп.
Тема 7. Модели кластерного анализа в социологии.
7.1 Понятие автоматической классификации объектов (кластерного анализа). Цели ее использования в социологии.
Метод автоматической классификации является одним из двух основных классов методов классификации. Методы многомерной классификации в литературе иногда называются автоматической классификацией, кластерным анализом, распознаванием образов без учителя и т. д. Помимо этого класса методов, существуют еще класс «методы группировки». Методы группировки предполагают отнесение к тому или иному классу объектов, либо обладающих одним и тем же сочетанием значений некоторого фиксированного набора рассматриваемых признаков, либо обладающих сочетанием значений фиксированного набора признаков из некоторой совокупности таких сочетаний, либо для которых величина вариации по всем рассматриваемым признакам «не слишком большая».
Методы многомерной (автоматической) классификации позволяют отразить более многообразные представления о содержательном типе объектов, чем методы группировки.
Формальные свойства алгоритмов многомерной классификации и их связь с содержательным пониманием типа.
1. Большинство алгоритмов многомерной классификации предполагает наличие «сгустков» объектов, рассматриваемых как точки в исходном признаковом пространстве. Пользование подобными алгоритмами возможно лишь в случае, если мы считаем имеющей место определенную расчлененность изучаемой совокупности объектов. Используя алгоритм, рассчитанный на наличие «сгустков», мы тем самым делаем определенные содержательные предположения. Эти предположения должны быть четко сформулированы в виде определенных содержательных гипотез.
Вопрос о наличии «сгустков» связан с вопросом об их виде, о форме искомых классов. Разные алгоритмы классификации позволяют отыскивать классы разной формы. Выбор алгоритма в значительной мере должен определяться соответствующими содержательными предпосылками.
Существуют алгоритмы классификации, которые позволяют отыскивать интересующие нас «сгустки». Мы имеем в виду алгоритмы, основанные на оценивании функции плотности распределения изучаемой совокупности объектов в рассматриваемом признаковом пространстве.
2. Большинство алгоритмов многомерной классификации предполагает задание определенной метрики, т. е. функции расстояния (либо меры близости) между любыми двумя рассматриваемыми объектами. При реализации алгоритма классификации объекты, расстояние между которыми не превышает некоторого порога (величина его задается априори или определяется из опыта), попадают в один класс. Соответственно объекты, расстояние между которыми превышает этот порог, попадают в разные классы.
Введением функции расстояния по существу задается понятие однотипности объектов. «Выбор метрики (или меры близости) является узловым моментом исследования, от которого решающим образом зависит окончательный вариант разбиения объектов на классы при заданном алгоритме разбиения. В каждой конкретной задаче этот выбор должен производиться по-своему. При этом решение данного вопроса зависит в основном от главных целей исследования, физической и статистической природы вектора наблюдения X, полноты априорных сведений о характере вероятностного распределения X, характера взаимосвязей отдельных компонент изучаемого явления.
В качестве других факторов, определяющих выбор функции расстояния, можно назвать и следующие: необходимость корректного сочетания функции расстояния с типом шкал, использованных для получения исходных данных; 2) взаимная обусловленность выбора функции расстояния и исходного признакового пространства; 3) оценка возможности ослабить некоторые традиционные требования, предъявляемые к функции расстояния, с целью расширить круг тех функций, которые могут использоваться при решении социологических задач типологии.
3. Почти все алгоритмы многомерной классификации предполагают реализацию нескольких «шагов» процесса разбиения совокупности на классы. Задавая определенные параметры (для различных алгоритмов эти параметры могут быть разными: число классов, на которые следует разбить совокупность, «радиус» искомых классов и т. д.), исследователь получает разные разбиения исходной совокупности на классы. Естественно, что выбор шага классификации, на котором следует остановиться, играет большую роль в обеспечении соответствия результатов формальной классификации представлениям о содержательных типах объектов. При анализе результатов классификации с целью выделения такого шага обычно используют содержательную интерпретацию классов, анализ характеристик распределения в классах рассматриваемых признаков, привлечение с аналогичной целью так называемых внешних признаков и т. д.
Цель использования автоматической классификации в социологии – выделение типов объектов по некоторым значимым с точки зрения гипотез и концепций исследования характеристикам.
7.2 Описание принципов работы алгоритма CLUSTER.
Методы кластерного анализа позволяют разбить изучаемую совокупность объектов на группы «схожих» объектов, называемых кластерами. Синонимами кластерного анализа являются «автоматическая классификация объектов без учителя», «таксономия».
Если данные понимать как точки в признаковом пространстве, то задача кластерного анализа формулируется как выделение "сгущений точек", разбиение совокупности на однородные подмножества объектов.
Кластерный анализ, равно как и факторный, является описательной процедурой, он не позволяет сделать никаких статистических выводов, но дает возможность провести своеобразную разведку - изучить "структуру совокупности".
Методы кластерного анализа можно разделить на 2 больших класса: иерархический кластерный анализ и кластерный анализ центров (K-means).
Большинство методов иерархической кластеризации являются агломеративными. Смысл агломеративного алгоритма состоит в том, что перед началом кластеризации все объекты считаются отдельными кластерами, которые в ходе алгоритма объединяются. Вначале берется N объектов и между всеми ними попарно вычисляются расстояния. Далее выбирается пара объектов, которые расположены наиболее близко друг от друга и которые объединяются в один кластер. В результате количество кластеров становится равным N-1. Процедура повторяется, пока все классы не объединятся. На любом этапе объединение можно прервать, получив нужное число кластеров.
Помимо агломеративного алгоритма существует еще дивизионный, в котором изначально все объекты объединены в один кластер, который в ходе реализации алгоритма последовательно делится на более мелкие и однородные кластеры.
Результат работы алгоритмов кластерного анализа определяют способы вычисления расстояния между объектами и определения близости между кластерами. Для определения расстояния между парой кластеров могут быть сформулированы различные разумные подходы. Предусмотрены следующие методы, определяемые на основе расстояний между группами объектов (кластерами):
Среднее расстояние между кластерами (Between-groups linkage) - Связь между группами – дистанция между кластерами равна среднему значению дистанций между всеми возможными парами наблюдений, причём одно наблюдение берется из одного кластера, а другое - из другого. Информация, необходимая для расчета дистанции, находится на основании всех теоретически возможных пар наблюдений. По этой причине данный метод и устанавливается по умолчанию.
Среднее расстояние между всеми объектами пары кластеров с учетом расстояний внутри кластеров (Within-groups linkage) - Связь внутри групп – дистанция между двумя кластерами рассчитывается на основании всех возможных пар наблюдений, принадлежащих обоим кластеров, причем учитываются также и пары наблюдений, образующиеся внутри кластеров.
Расстояние между ближайшими соседями - ближайшими объектами кластеров (Nearest neighbor) - дистанция между двумя кластерами определяется, как расстояние между парой значений наблюдений, расположенных друг к другу ближе всего, причем каждое наблюдение берется из своего кластера.
Расстояние между самыми далекими соседями (Furthest neighbor) - дистанция между двумя кластерами определяется как расстояние между самыми удаленными друг от друга значениями наблюдений, причем каждое наблюдение берется из своего кластера.
Расстояние между центрами кластеров (Centroid clustering), или центроидный метод. В обоих кластерах рассчитываются средние значения переменных относящихся к ним наблюдений. Затем расстояние между двумя кластерами рассчитывается как дистанция между двумя осредненными наблюдениями. Недостатком этого метода является то, что центр объединенного кластера вычисляется как среднее центров объединяемых кластеров, без учета их объема.
Метод медиан - тот же центроидный метод, но центр объединенного кластера вычисляется как среднее всех объектов (Median clustering). В предыдущем методе центроид нового кластера получается как взвешенное среднее центроидов обоих исходных кластеров, причем количества наблюдений исходных кластеров образовывают весовой коэффициент. В медианном же методе оба исходных кластера берутся с одинаковым весом.
Метод Варда (Ward's method). В качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения. сначала в обоих кластерах для всех имеющихся наблюдений производится расчёт средних значений отдельных переменных. Затем вычисляются квадраты евклидовых расстояний от отдельных наблюдений каждого кластера до этого кластерного среднего значения. Эти дистанции суммируются. Потом в один новый кластер объединяются те кластеры, при объединении которых получается наименьший прирост общей суммы дистанций
Расстояния и меры близости между объектами.
Евклидово расстояние
(Euclidian distance).Квадрат евклидова расстояния
(Squared
Euclidian distance)
Эвклидово расстояние и его квадрат целесообразно использовать для анализа количественных данных.
Мера близости - коэффициент корреляции
,
где
и
компоненты стандартизованных векторов
X и
Y.
Эту меру целесообразно использовать
для выявления кластеров переменных, а
не объектов.Расстояние хи-квадрат получается на основе таблицы сопряженности, составленной из объектов X и Y (рисунок 7.3.), которые, предположительно, являются векторами частот. Здесь рассматриваются ожидаемые значения элементов, равные E(Xi)=X.*(Xi+Yi)/(X.+Y.) и E(Yi)=Y.*(Xi+Yi)/(X.+Y.), а расстояние хи-квадрат имеет вид корня из соответствующего показателя
.
Расстояние Фи-квадрат является расстоянием хи-квадрат, нормированным "числом объектов" в таблице сопряженности, представляемой строками X и Y, т.е. на корень квадратный из N=X.+Y. .
В иерархическом кластерном анализе в SPSS также имеется несколько видов расстояний для бинарных данных (векторы X и Y состоят из нулей и единиц, обозначающих наличие или отсутствие определенных свойств объектов). Наиболее естественными из них, по видимому, являются евклидово расстояние и его квадрат.
Результаты кластеризации сильно зависят от выбранного метода – алгоритма вычисления, меры близости между объектами и между кластерами. И эта зависимость тем сильнее, чем менее явно изучаемая совокупность разделяется на группы объектов. Поэтому результаты вычислительной кластеризации могут быть дискуссионными и часто они служат лишь подспорьем для содержательного анализа.
Стандартизация. Непосредственное использование переменных в анализе может привести к тому, что классификацию будут определять переменные, имеющие наибольший разброс значений. Поэтому применяются следующие виды стандартизации:
Z-стандартизация (Z-Scores). Из значений переменных вычитается их среднее и эти значения делятся на стандартное отклонение.
Разброс от -1 до 1. Линейным преобразованием переменных добиваются разброса значений от -1 до 1.
Разброс от 0 до 1. Линейным преобразованием переменных добиваются разброса значений от 0 до 1.
Максимум 1. Значения переменных делятся на их максимум.
Среднее 1. Значения переменных делятся на их среднее.
Стандартное отклонение 1. Значения переменных делятся на стандартное отклонение.
Кроме того, возможны преобразования самих расстояний, в частности, можно расстояния заменить их абсолютными значениями, это актуально для коэффициентов корреляции. Можно, также все расстояния преобразовать так, чтобы они изменялись от 0 до 1.
На практике интерпретация кластеров требует достаточно серьезной работы, изучения разнообразных характеристик объектов для точного описания типов объектов, которые составляют тот или иной класс. Кроме того, методы кластерного анализа не дают какого-либо сп-ба для проверки статистической гипотезы об адекватности полученных классификаций. Иногда результаты кластерного анализа можно обосновать с помощью метода дискриминантного анализа.
Процедура иерархического кластерного анализа хороша для малого числа объектов. Ее преимущество в том, что каждый объект можно, образно говоря, пощупать руками. Но эта процедура не годится для огромных социологических данных из-за трудоемкости агломеративного алгоритма и слишком большого размера и практической бессмысленности дендрограмм.
Описание принципов работы алгоритма K-means
Иерархические методы объединения, хотя и точны, но трудоёмки: на каждом шаге необходимо выстраивать дистанционную матрицу для всех текущих кластеров. Расчётное время растёт пропорционально третьей степени количества наблюдений, что при наличии нескольких тысяч наблюдений может утомить и серьёзные вычислительные машины.
Поэтому при наличии большого количества наблюдений применяют другие методы. Недостаток этих методов заключается в том, что здесь необходимо заранее задавать количество кластеров, а не так как в иерархическом анализе, получить это в качестве результата Эту проблему можно преодолеть проведением иерархического анализа со случайно отобранной выборкой наблюдений и, таким образом, определить оптимальное количество кластеров. Если количество кластеров указать предварительно, то появляется следующая проблема: определение начальных значений центров кластеров. Их также можно взять из предварительно проведённого иерархического анализа, в котором для каждого наблюдения рассчитывают средние значения переменных, использовавшихся при анализе.
Алгоритм заключается в следующем: выбирается заданное число k точек и на первом шаге эти точки рассматриваются как "центры" кластеров. Каждому кластеру соответствует один центр. Объекты распределяются по кластерам по такому принципу: каждый объект относится к кластеру с ближайшим к этому объекту центром. Таким образом, все объекты распределились по k кластерам.
Затем заново вычисляются центры этих кластеров, которыми после этого момента считаются покоординатные средние кластеров. После этого опять перераспределяются объекты. Вычисление центров и перераспределение объектов происходит до тех пор, пока центры не стабилизируются (кластерные центры не перестанут изменять свое положение).
Часто переменные, используемые в кластеризации, имеют разный диапазон изменений, так как измерены они в различных шкалах или просто из-за того, что характеризуют разные свойства объектов (например, рост и вес, килограммы и граммы). В этих условиях основное влияние на кластеризацию окажут переменные, имеющие большую дисперсию. Поэтому перед кластеризацией полезно стандартизовать переменные. К сожалению, в данной команде кластерного анализа средства стандартизации не предусмотрены непосредственно, как в процедуре иерархического кластерного анализа.
Говоря о допустимом уровне измерения для переменных, используемых при кластеризации необходимо помнить, команда использует только евклидово расстояние. Следовательно, корректные результаты при применении данного метода можно ожидать только при применении метрических переменных.
Интерпретация кластеров осуществляется на основе сравнения средних значений, выдаваемых процедурой, а также исследования сохраненной переменной средствами статистического пакета. Принципиально важным вопросом для понимания содержания полученных кластеров – групп респондентов - является то, на сколько действительно эти группы однородны.
