Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2. Соц. дослідження.doc
Скачиваний:
125
Добавлен:
11.03.2016
Размер:
1.98 Mб
Скачать

4.4. Оброблення і аналіз соціальної інформації

В емпіричній соціології нагромаджено немало стати­стичних процедур, за допомогою яких розрізнені дані, що містяться в окремих анкетах чи інших матеріалах со­ціологічних досліджень, адаптують для узагальнення, опису, аналізу, наукової інтерпретації. За результатами узагальнень роблять певні висновки, розв'язуючи за­вдання дослідження. Внаслідок цих процедур з'являє­ться реальна змога з'ясувати тенденції у досліджуваних процесах, явищах, виробити прогнози і практичні реко­мендації, що відкривають вихід соціальної інформації у соціальну практику.

Опис інформації та обчислення узагальнюючих параметрів

Найчастіше статистичні методи аналізу соціальної інформації використовують для:

— опису інформації та обчислення узагальнюючих параметрів (одновимірна статистика);

— виміру зв'язку між окремими ознаками, отрима­ними у відповідях на різні запитання анкети, якщо як метод збору даних застосовувалося опитування або контент-аналіз текстів ЗМІ, якщо використовувався метод аналізу документів (двовимірна статистика);

— проведення складних математичних процедур, які дають змогу проаналізувати водночас кілька взає­мопов'язаних ознак (багатовимірна статистика).

Застосування методів математичної статистики за­безпечує:

— стислий опис первинної соціологічної інформації, обчислення одновимірних розподілів, наочне уявлення її у вигляді таблиць, графіків, діаграм;

— обчислення зв'язків між ознаками досліджувано­го суспільного явища, оцінку їх за допомогою статистич­них коефіцієнтів зв'язку, застосування кореляційного, регресійного аналізу тощо;

- встановлення латентних (прихованих) факторів, 1КІ визначають взаємозв'язки всередині групи, ознак досліджуваного явища (факторний, латентно-структур­ний аналіз);

— класифікацію ознак та об'єктів, побудову типоло­гій (кластерний аналіз, дискримінантний аналіз, фак­торний аналіз);

— перевірку (підтвердження чи спростування) вихід­них гіпотез дослідження, формулювання нових проблем;

— вироблення коротко- і довгострокових прогнозів щодо функціонування та розвитку певного суспільного явища.

Використання методів математичної статистики пе­редбачає певний набір попередніх процедур, до яких на­лежать: підготовка анкети, іншого первинного матеріа­лу до оброблення, яка може здійснюватися вручну чи автоматизовано; вибір рівня майбутнього аналізу (опи­совий чи пояснювальний); вибір конкретних статистич­них процедур для оброблення інформації.

В емпіричному дослідженні соціолог вивчає певну множину об'єктів, наприклад колектив працівників підприємства. Кожному елементу множини притаманні певні властивості (ознаки), скажімо стать, вік, задово­леність умовами праці. Кожний об'єкт має певне зна­чення за кожною ознакою. Так, працівник має одне з двох можливих значень ознаки «Стать» (чоловіча або жіноча), одне з трьох можливих значень ознаки «За­доволеність умовами праці» (задоволений, не зовсім за­доволений, незадоволений), певне значення ознаки «Вік» (число повних років від 18 до 80) та ін.

Як правило, для спрощення оброблення всі значен­ня ознак кодують числами, тому дані для оброблення становлять прямокутну таблицю (матрицю) чисел. Кожний рядок цієї таблиці відповідає одному об'єкту, а кожний стовпчик — певній ознаці. На перетині певного рядка та стовпчика цієї таблиці знаходиться значення певної ознаки певного об'єкта.

Ознаки поділяють на якісні та кількісні. Якісні оз­наки не мають кількісного виразу («Стать», «Задоволеність умовами праці»). Кількісні ознаки мають одиниці вимірювання. Наприклад, одиницею вимірювання кількісної ознаки «Вік» є рік, «Заробітна плата» — гривня. Ці ознаки ще називають ознаками, заданими у метричній шкалі.

При кодуванні значень якісної ознаки числами можливі два суттєво відмінні варіанти. У першому значеним якісної ознаки можна впорядковувати, тобто для будь-якої пари значень можна зазначити, яке з них відпові­дає сильнішому виявленню ознаки. Наприклад, зна­чення «Задоволений» відповідає інтенсивнішому ви­явленню ознаки «Задоволеність умовами праці», ніж значення «Не зовсім задоволений». У такому разі доці­льно і числові коди добирати так, щоб сильнішому ви­явленню ознаки відповідало більше число. Так, для оз­наки «Задоволеність умовами праці» можна обрати та­кі числові коди значень: 3 — «Задоволений»; 2 — «Не зовсім задоволений»; 1 — «Незадоволений». Такі якіс­ні шкали ще називають порядковими шкалами, або шкалами рангів. У другому випадку значення якісної ознаки не піддаються жодному змістовому впорядку­ванню. Наприклад, ознака «Стать» містить два зна­чення — «чоловіча» та «жіноча». Для значень ознак такого типу можна добирати будь-які числові коди. Го­ловне, щоб різні значення мали різні коди (тобто не мо­жна кодувати два різні значення ознаки одним чис­лом). Такі якісні пікали ще називають номінальними шкалами. Як правило, для кодування значень ознак у номінальних шкалах використовують цілі додатні чис­ла — 1, 2, 3 і т. д.

Соціологові постійно доводиться при складанні про­грами дослідження обирати (або навіть самостійно конс­труювати) шкали. Від того, наскільки вдало це буде зро­блено, значною мірою залежить результат опрацювання отриманих даних. Крім того, вибір математичного мето­ду аналізу даних тісно пов'язаний зі шкалами відповід­них ознак. Невідповідність такого методу даним є суттє­вою методичною помилкою, що може звести нанівець роботу зі збору даних та обчислення результатів.

Щоб первинні дані можна було використовувати для змістового аналізу і висновків, вони повинні бути неза­лежно упорядковані та опрацьовані. З цією метою за­стосовують спеціальні статистичні методи: групування, обчислення узагальнюючих параметрів та коефіцієнтів, кореляційний, кластерний, факторний аналізи та ін. Незалежно від методу аналізу опрацювання даних по­чинають з попереднього впорядкування інформації, здебільшого за допомогою статистичного групування та побудови статистичних таблиць.

Структуру сукупності об'єктів з точки зору однієї виокремленої ознаки доцільно вивчати за таблицею, в якій для кожного з можливих значень ознаки зафіксо­вано, скільки разів трапляються в сукупності об'єкти, що мають відповідне значення. Таку таблицю назива­ють таблицею одновимірного розподілу, одновимірною таблицею, варіаційним рядом. Наприклад, для ознаки «Задоволеність умовами праці» одновимірна таблиця може мати такий вигляд:

Таблиця 4.3. Ознака «Задоволеність умовами праці»

Значення

Код

Частота

% до всіх опитаних

% до тих, хто відповів на питання

Задоволений

3

45

12,60

12,93

Не зовсім задоволений

2

249

69,75

71,55

Незадоволений

1

54

15,13

15,32

Кількість об'єктів — 357. Для 348 об'єктів (що стано­вить 97,48% від загальної сукупності) відоме значення оз­наки «Задоволеність умовами праці». Для інших об'єктів сукупності (в даному разі їх 9) значення цієї ознаки неві­доме (наприклад, інформація зібрана методом опитуван­ня, і деякі працівники підприємства не захотіли відпові­дати на поставлене питання). Аналіз таблиці свідчить, що задоволених умовами праці — 45 об'єкти (12,60% від загальної сукупності та 12,93% від кількості працівників, які відповіли на поставлене запитання). Більшість працівників повністю або частково не задоволена умовами праці.

В одновимірній таблиці часто перший або другий стовпчики відсутні (тобто в таблиці зазначають або самі значення, або їх коди);

Неможливо перелічити всі можливі значення оз­нак, заданих у метричних шкалах. Отже, неможливо і безпосередньо побудувати одновимірну таблицю. За таких обставин усі можливі значення ознаки розбивають на інтервали, а потім будують таблицю. Так, для сукупності працівників певного підприємства всі значення ознаки «вік» перебувають між віком наймолодшого робітника (припустимо, 18 років) та віком найстаршого робітника (припустимо, 68). Розіб'ємо їх на 4 інтервали: від 18 до 25 років, від 26 до 40 років, від 41 до 59 років та від 60 до 68 років. Тоді одновимірна таблиця, що демонструє структуру сукупності працівників за віком, набуде іншого вигляду (табл. 4.4):

Таблиця 4.4. Ознака «Вік (інтервал)»

Кількість об'єктів

Частота

% до всіх опитаних

% до тих, хто відповів на питання

18—25 років

43

12,04

12,04

26—40 років

223

62,47

62,47

41—59 років

67

18,77

18,77

60—68 років

24

6,72

6,72

У цій таблиці відсутній стовпчик, в якому зазначені коди інтервалів, а оскільки відомий вік усіх працівників (є відповідні значення для всіх об'єктів), то третій і чет­вертий стовпчики збігаються. Метрична ознака розбита у цій таблиці на різні за розміром (нерівномірні) інтерва­ли. А нерідко доцільно розбивати весь діапазон значень на інтервали однакової довжини (рівномірні інтервали).

Для полегшення аналізу великої кількості таблиць та забезпечення можливості порівняння кількох із них обчислюють узагальнюючі характеристики рядів роз­поділу. Найчастіше використовують характеристику «середнє значення ознаки». Для кількісної ознаки обчислюють її середнє арифметичне значення щодо всіх об'єктів сукупності. Для якісних ознак такою узагаль­нюючою характеристикою ряду є «мода» — значення, що найчастіше зустрічається в одновимірній таблиці.

Щоб оцінити, наскільки репрезентує середнє зна­чення весь ряд розподілу, обчислюють статистичні по­казники варіації ознак. Для кількісних ознак — це ди­сперсія, середнє квадратичне відхилення, коефіцієнт варіації. Для якісних ознак розроблені спеціальні інде­кси якісної варіації. Чим більше значення відповідного показника варіації, тим розсіяніші навколо середнього значення реальні значення ознаки, а отже, тим з біль­шою обережністю потрібно оперувати із середнім зна­ченням при побудові змістових висновків.

Межі варіації також дають змогу оцінити, наскіль­ки однорідною за певною ознакою є сукупність. Якщо ця сукупність неоднорідна, може постати потреба поді­лити її на кілька однорідних за цією ознакою частин та аналізувати кожну з них окремо. Припустимо, що вивчається задоволеність умовами праці на певному під­приємстві. З логічних міркувань або за результатів попередніх досліджень відомо, що заробітна плата праців­ника впливає на його задоволеність умовами праці. Нехай коефіцієнт варіації заробітної плати для всієї сукупності працівників дорівнює 0,7. Тоді необхідно поділити всю сукупність працівників на групи, при­близно однакові за рівнем заробітної плати (щоб у кож­ній групі коефіцієнт варіації зарплати був нижчим від 0,4), та аналізувати задоволеність умовами праці окре­мо у кожній з них.

Кореляційний і регресійний аналіз

Одним із важливих завдань аналізу є встановлення та оцінювання взаємозв'язків між окремими ознаками для певної сукупності об'єктів. Цю роботу починають з побудови кореляційних таблиць (таблиць спряженості двох ознак, двовимірних таблиць). Вони дають змогу впорядковувати інформацію про розподіл сукупності об'єктів за двома ознаками. Такі таблиці мають прямо­кутну форму. Кількість рядків у них дорівнює кілько­сті можливих значень однієї ознаки, а кількість стовп­чиків — кількості можливих значень другої ознаки. У таблиці 4.5 у клітинці на перетині другого рядка і тре­тього стовпчика знаходиться число 42 (в центрі клі­тинки) — кількість робітниць (значення ознаки «Стать» — «жіноча»), що не задоволені умовами праці (значення ознаки «Задоволеність умовами праці» — « незадоволений »).

Таблиця 4.5. Двовимірна таблиця (ознаки «Стать» і «Задоволеність умовами праці»)

Задоволений

Не зовсім задоволений

Незадово­лений

Всього

Чоловіки

18,40%

39

86,67%

75,94%

161

64,66%

5,66%

12

22,22%

100%

212

60,92%

Жінки

4,41%

6

13,33%

64,71%

88

35,34%

30,88%

42

77,78%

100%

136

39,08%

Всього

45

12,93%

249

71,55%

54

15,52%

348

100%

Крім того, двовимірна таблиця, як правило, містить ще один додатковий стовпчик і ще один додатковий ря­док — так звані маргінальні стовпчик і рядок. У таблиці маргінали позначені словом «Всього». Кожна клітинка маргінального стовпчика містить суму чисел відповідно­го рядка, тобто кількість об'єктів, що мають відповідне значення першої ознаки (незалежно від того, якого зна­чення для цих об'єктів набуває друга ознака), а також відсоток, який становить це число щодо загальної кіль­кості об'єктів. Так, з маргінального стовпчика таблиці бачимо, що на підприємстві працює 136 жінок (39,08% загальної кількості працівників). Маргінальний рядок містить відповідні суми стовпчиків таблиці.

У кожній клітинці таблиці, як правило, записують відсоток стосовно відповідного значення в маргінально­му стовпчику (цей відсоток записують вище від самого числа) та відсоток стосовно відповідного значення в ма­ргінальному рядку (записують нижче від числа). Якщо знову повернутися до клітинки в другому рядку третьо­го стовпчика таблиці, побачимо, що кількість незадоволених умовами праці жінок (таких на підприємстві 42) становить 30,88% від загальної кількості жінок (всього на підприємстві — 136 жінок) та 77,78% від загальної кількості незадоволених умовами праці (всього умова­ми праці на підприємстві не задоволені 54 працівники).

Числа в таблиці свідчать, що серед жінок відсоток незадоволених умовами праці на підприємстві значно вищий, ніж серед чоловіків. Отже, є підстави для гіпо­тези, що стать працівника та його задоволеність умова­ми праці взаємопов'язані.

Вміння читати двовимірні таблиці приходить з дос­відом. Нелегко знаходити закономірності в досить вели­ких за розміром таблицях. Крім того, зв'язок між озна­ками простежується далеко не завжди. Тому на практи­ці наявність зв'язку між двома ознаками встановлюють за допомогою так званого критерію %2, який ґрунтуєть­ся на аналізі частот, записаних у клітинках таблиці. Це дає змогу дійти висновків про те, чи можна висувати та аналізувати гіпотезу про наявність зв'язку між двома ознаками.

Застосовуючи зазначений критерій, необхідно обчи­слити коефіцієнт х-квадрат за формулою (формула за­лежить від частот у клітинках таблиці та маргінальних частот), а одержане значення порівняти з табличним (критичним). При цьому слід мати на увазі певний рі­вень значущості (ймовірність прийняття хибного рі­шення) — в соціології, як правило, 0,05 або 0,01. Крім того, табличне значення залежить від кількості ступе­нів свободи, що визначають-за кількістю рядків і стовп­чиків таблиці. Отже, для заданого рівня значущості та кількості ступенів свободи необхідно знайти в таблиці критичне значення і порівняти його з обчисленим. Як­що обчислене значення більше від критичного, то факт існування зв'язку можна вважати встановленим.

Силу зв'язку можна оцінити обчисленням та аналі­зом коефіцієнтів спряженості (Пірсона, Чупрова, Крамера). Значення цих коефіцієнтів перебувають в інтер­валі від нуля до одиниці та мають такий зміст: чим бли­жче значення до одиниці, тим тісніший зв'язок. Якщо обидві ознаки, між якими вивчають зв'язок, мають ли­ше по два значення (тобто фіксують наявність або відсут­ність певної ознаки в об'єкті), то для таких «чотириклітинкових» таблиць обчислюють коефіцієнти асоціації та контингенції.

Якщо певному значенню однієї величини відповідає сукупність значень другої, то між цими двома величи­нами існує кореляційний зв'язок. Він виявляється тоді, коли на досліджуване явище впливає не один, а багато чинників. Наприклад, стаж впливає на продуктивність праці, але не остаточно визначає її, бо залежить від рів­ня освіти, віку, кваліфікації працівника та інших фак­торів. Оскільки явища суспільного життя складні та багатофакторні, зв'язок між ознаками в соціології прак­тично завжди кореляційний.

Якщо кожному значенню однієї ознаки відповідає сукупність значень другої ознаки, близько розміщених біля свого середнього значення (тобто всі значення су­купності не дуже відрізняються від свого середнього арифметичного), то такий кореляційний зв'язок вважа­ють сильнішим. Кількісно силу кореляційного зв'язку оцінюють за допомогою коефіцієнтів кореляції.

Для кількісних ознак часто використовують коефіцієнт Пірсона (r), який оцінює силу зв'язку за лінійної кореляції (за припущення, що значення однієї ознаки пов'язані з відповідними значеннями другої ознаки лінійною залежністю). Всі значення коефіцієнта кореляції Пірсона належать інтервалу від -1 до 1. Знак коефіцієнта показує напрям зв'язку: додатне значення свідчить про «прямий» зв'язок (зростання однієї ознаки зумовлює зростання другої), від'ємне значення — про «зворотний» зв'язок, а значення «0» — про відсутність лінійного кореляційного зв'язку. Наприклад, зв'язок між заробітною платою робітника та кількістю виготов­лених ним деталей — прямий, а між заробітною платою та кількістю бракованих деталей — зворотний. При r —1 або r = -1 маємо функціональний зв'язок між ознаками (тобто кожному значенню однієї ознаки відповідає одне значення другої ознаки, і ці значення пов'язані ліній­ною залежністю). Отже, чим далі значення коефіцієнта Пірсона від нуля (чим більша його абсолютна величи­на), тим тісніший лінійний кореляційний зв'язок існує між ознаками. Однак якщо r = 0, то це означає відсут­ність лише лінійного зв'язку, а не відсутність зв'язку між ознаками взагалі: зв'язок може існувати, але нелі­нійний. Для оцінювання сили нелінійного зв'язку вико­ристовують кореляційне відношення, що набуває зна­чення між 0 та 1 (0 означає відсутність зв'язку, 1 — функціональний зв'язок).

Для ознак, заданих у порядкових шкалах, обчислю­ють рангові коефіцієнти кореляції (Спірмена та Кендела), які також набувають значення між —1 та 1 та інтер­претуються так само, як і коефіцієнт кореляції Пірсона.

Встановлення кореляції між двома ознаками ще не означає встановлення причинного зв'язку між ними. Це лише свідчення того, що одна з ознак частково спри­чинила іншу або обидві ознаки і є наслідком деяких спільних для них причин. Зауважимо, що кількісна оцінка кореляційних зв'язків не може замінити спеці­альних знань, але може допомогти дослідникові відкину­ти несуттєві зв'язки, чіткіше окреслити напрям пошу­ків, порівняти вплив різних чинників тощо. Крім того, коефіцієнти часткової кореляції дають змогу оцінити зв'язок між двома ознаками, усуваючи вплив однієї або кількох інших ознак. Якщо після усунення впливу тре­тьої ознаки коефіцієнт кореляції між двома ознаками збільшується, то третя ознака послаблює зв'язок, а як­що зменшується, то саме ця третя ознака певною мірою спричинює наявність цього зв'язку (тобто зв'язок, мож­ливо, є лише наслідком впливу цієї третьої ознаки). Об­числити коефіцієнти часткової кореляції досить склад­но через коефіцієнти кореляції Пірсона. Обсяг обчис­лень зростає з кількістю тих ознак, вплив яких бажають усунути. Силу спільного зв'язку сукупності ознак дає змогу оцінити коефіцієнт множинної кореляції.

Методи регресійного аналізу забезпечують не тільки оцінювання сили зв'язку між двома ознаками, а й вста­новлення виду цього зв'язку у вигляді рівняння (рів­няння регресії), що описує залежність між середнім значенням однієї ознаки (залежної, поведінку якої вив­чають) та значеннями певної сукупності ознак (незале­жних, вплив яких на залежну ознаку намагаються оці­нити). У соціологічних дослідженнях, як правило, від­бувається пошук такої залежності у лінійному вигляді (у вигляді лінійного рівняння), тому йдеться про рів­няння багатовимірної (множинної) лінійної регресії.

Знання залежності у вигляді рівняння дає змогу не тільки пояснювати поведінку залежної ознаки, а й прогнозувати її значення за різних змін значень неза­лежних ознак. Наприклад, на основі аналізу факторів, що впливають на рівень заробітної плати на підприєм­стві, було побудовано рівняння лінійної регресії: у = 4,27 х1 1,83 х2-9,20. Воно описує зв'язок між заробіт­ною платою у (залежна ознака, вимірюється в гривнях) і двома незалежними ознаками працівника: стаж х1 (ви­мірюється в роках) та освітній рівень х2 (вимірюється в роках). Аналіз цього рівняння наводить на думку, що зростання трудового стажу працівника на один рік зу­мовлює зростання його середньої заробітної плати на 4,27 грн., а зростання освітнього рівня на один рік — зростання середньої заробітної плати лише на 1,83 грн. Отже, на даному підприємстві трудовий стаж суттєвіше впливає на середню заробітну плату працівника, ніж його освітній рівень. Якість рівняння регресії (наскіль­ки точно рівняння регресії описує зв'язок між ознака­ми) оцінюють коефіцієнтом множинної кореляції.

Суттєвим для одержання надійних, статистично об­ґрунтованих результатів є оцінювання значущості ста­тистичних показників — комплекс математичних процедур, що дають змогу відповісти на низку питань щодо розрахованих статистичних показників і парамет­рів вибіркової сукупності. Так, після обчислення коефі­цієнта кореляції між двома ознаками та отримання чис­ла, що не дорівнює нулю, цілком логічно постають запи­тання: чи справді цей коефіцієнт суттєво відрізняється від нуля (а отже, фіксує наявність лінійного кореляційного зв'язку), чи ця різниця випадкова і спричинена лише похибкою нашої вибірки? Відповідь на них можна дати, оці­нивши значущість відмінності коефіцієнта кореляції від нуля і звернувши особливу увагу на обсяг вибірки та рі­вень значущості (ймовірність прийняття хибного рішен­ня). Ця процедура така ж, як і процедура застосування критерію х2, і дає змогу за певною формулою обчислити критерій. Одержане ж значення порівнюють із таблич­ним. На основі результатів порівняння роблять висновок. Крім оцінювання значущості відмінності від нуля коефіцієнта кореляції між двома ознаками, часто засто­совують і процедури оцінювання значущості різниці між двома відсотками (наприклад, різниці між відсот­ками незадоволених умовами праці на певному підпри­ємстві серед жінок і чоловіків), різниці між двома серед­німи (між середньою заробітною платою на одному та іншому підприємствах), двох коефіцієнтів кореляції. Для кожної такої задачі існують формула обчислення критерію та статистичні таблиці, якими користуються для порівняння.

Факторний і кластерний аналіз як методи багатовимірної статистики

Якщо аналіз даних передбачає використання вели­кої кількості взаємопов'язаних ознак, доцільно засто­сувати спеціальні методи та алгоритми багатовимірної статистики. Ці методи потребують значних обчислень, для ефективного застосування яких необхідно мати об­числювальну техніку та спеціальне програмне забезпе­чення. Серед методів багатовимірної статистики най­поширенішими є факторний та кластерний аналіз.

Суть факторного аналізу полягає в тому, що групу сильно скорельованих ознак можна пояснити та описа­ти невеликою кількістю прихованих (латентних) фак­торів, які безпосередньо не спостерігаються, але роз­кривають значення ознак цієї групи. Наприклад, за та­кими ознаками, як «кількість прочитаних книг», «кількість книг у домашній бібліотеці», «кількість від­відувань театрів і музеїв», приховано фактор, який мо­жна було б назвати «рівень культурного розвитку особи­стості». Факторний аналіз дає змогу виявити ці латентні фактори, описати залежність між ними та первинними ознаками, обчислити значення всіх побудованих таким чином факторів для кожного об'єкта. У результаті вини­кає можливість без значних втрат інформації перейти від аналізу великої кількості первинних ознак до аналі­зу порівняно невеликої кількості факторів.

Алгоритми кластерного аналізу дають змогу поділи­ти сукупність об'єктів на однорідні за певним формаль­ним критерієм подібності групи (кластери). Основною властивістю цих груп є те, що об'єкти, які належать од­ному кластеру, подібніші між собою, ніж об'єкти з різ­них кластерів. Таку класифікацію можна виконувати од­ночасно за досить великою кількістю ознак. Наприклад, відомо чимало статистичних показників, які характери­зують рівень соціально-економічного розвитку адмініс­тративних районів країни: кількість населення, кіль­кість безробітних, протяжність шосейних доріг, кіль­кість квадратних метрів житла на одну людину тощо. Для організації опитування необхідно згрупувати ра­йони у більші утворення (регіони), але варто зробити це так, щоб у кожному такому регіоні були райони, близькі за своїм соціально-економічним розвитком. Це дасть змогу вибрати в такому регіоні один типовий район і результати опитування в ньому узагальнити щодо всього регіону. Таке групування може бути ефек­тивно проведене методом кластерного аналізу, оскіль­ки у даному разі враховується та узагальнюється вели­ка кількість показників.

Підсумок аналізу та інтерпретації соціологічних да­них набуває форми документів: звіту за результатами дослідження, інформаційної чи аналітичної довідки. Вони містять відомості, висновки та рекомендації для прийняття практичних (управлінських) рішень. У нау­ково-дослідному плані — це банк соціологічних даних наукового аналізу.

Запитання. Завдання

1. У чому полягають особливості якісних і кількісних ознак?

2. Які показники використовуються для оцінювання зв'язку між двома ознаками?

3. Яких значень може набувати коефіцієнт кореляції Пірсона (r)? Як інтерпретуються ці значення?

4. 3 якою метою застосовують методи регресійного аналізу даних?

5. Охарактеризуйте клас задач, що розв'язуються методами факторного і кластерного аналізу.

Соседние файлы в предмете Социология