Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекції з соціології Урін О.В. 2011.doc
Скачиваний:
5
Добавлен:
04.05.2019
Размер:
11.58 Mб
Скачать

Аналіз однієї ознаки

Первинні дані мають бути певним чином упорядковані. Для цього застосовують різноманітні статистичні методигрупування, обчислення узагальнюючих параметрів та коефіцієнтів, кореляційний, регресійний, кластерний, факторний аналіз та ін.

Структура відповідей на запитання анкети наводиться в таблиці, де для кожного з можливих значень ознаки записано, скільки разів воно трапляється в сукупності зібраних даних. Таку таблицю називають таблицею одновимірною, або варіаційним рядом.

PS. Кластерний аналіз – це багатомірна статистична процедура (кластеризація), яка класифікує об’єкти або спостереження в однорідні групи. Набір усіх досліджуваних об’єктів розподіляється по підкласах, які називаються кластерами (англ.cluster - щітка, гроно) згустками, класами, скупченнями або таксонами.

Для ознаки "Задоволеність умовами праці" вона має такий вигляд:

Значення

Частота

% до всіх

% до значень

Цілком задоволений

45

12,61

12,93

Більше задоволений, ніж не задоволений

88

24,65

25,29

Більше не задоволений, ніж задоволений

105

29,41

30,17

Повністю не задоволений

110

30,81

31,61

Без відповіді

9

2,52

Кількість опитаних у досліджуваній сукупності — 357. Для 348 опитаних (що становить 97,48 % загального обсягу сукупності) відоме значення ознаки "Задоволеність умовами праці". Для інших (у нашому випадку їх 9) значення цієї ознаки не відоме (наприклад, інформація збиралася методом опитування, і деякі робітники підприємства не захотіли відповісти на поставлене запитання). Аналізуючи таблицю, ми бачимо, наприклад, що задоволених умовами праці — 45, а це становить 12,61 % загального обсягу сукупності та 12,93 % кількості робітників, які відповіли на поставлене запитання. Ми бачимо також, що переважна більшість опитаних робітників (29,41 % + 30,81 % - 60,22 %) або повністю, або частково не задоволені умовами праці.

Слід зауважити, якщо впорядкувати шкали за рівнем вимірювання (найвищий рівень — це метричні шкали, потім — порядкові шкали, далі — номінальні шкали), то можна сформулювати таке загальне правило: якщо певний показник визначений для шкали певного рівня вимірювання, то його можна обчислювати і для шкал більш високого рівня, але, звичайно, не можна обчислювати для шкал нижчого рівня. Для того щоб оцінити весь ряд розподілу, обчислюють статистичні показники варіації ознак, або міри варіації. Для метричних ознак це — дисперсія, середнє квадратичне відхилення та коефіцієнт варіації. Для якісних ознак розроблено спеціальні індекси якісної варіації. Чим більшим є значення відповідного показника варіації, тим більше розсіяні навколо середнього значення реальні значення ознаки, а отже, тим обережніше при побудові змістових висновків слід оперувати із середнім значенням.

Графічне зображення даних

Найпоширенішими формами графічного зображення одновимірних розподілів є гістограма (або стовпчикова діаграма), полігон розподілу та секторна діаграма.

Гістограма — це послідовність стовпчиків, розміщених вертикально (вертикальна гістограма) чи горизонтально (горизонтальна гістограма). Кожний стовпчик має висоту (або довжину), пропорційну кількості (або частці, або відсотку) об'єктів, що мають відповідне значення ознаки. Запитання: Чи задоволені Ви власним становищем? Кількість об'єктів 431. Є значень 430 (99,7 %) рис.1:

У процесі аналізу досить часто виникає необхідність розбити метричні ознаки на нерівні інтервали. Саме на нерівні інтервали розбивають, як правило, такі ознаки, як прибуток, вік та ін. При побудові гістограм на нерівних інтервалах висоту стовпчика відкладають пропорційно не до частки (відсотка), а до щільності розподілу відповідної ознаки. У побудованій таким чином гістограмі не висота, а площа кожного зі стовпчиків пропорційна до кількості (або частки, або відсотка) об'єктів, що мають відповідне значення ознаки. Вік (згрупований). Наприклад: кількість об'єктів 431. Є значень 399 (92,7 %), рис.2:

Якщо центри верхніх горизонтальних ліній стовпчиків гістограми з'єднати відрізками прямої, то вийде фігура, яку називають "полігон розподілу". На рис. З зображено полігон розподілу респондентів за віком (аналогічний гістограмі на рис. 3).

Для ілюстрації досить часто застосовують таку форму подання даних, як секторна діаграма. На схемі 4 зображено секторну діаграму розподілу респондентів за віком (аналогічна гістограмі на рис. 4). Вибірка представлена у вигляді кола. Кожній віковій групі (а їх 4) відповідає виділений певним кольором сектор цього кола, при цьому площа кожного сектора пропорційна кількості респондентів (або частці, або відсотку) у відповідній віковій групі.

Порівнювати кілька розподілів зручно, якщо розмістити полігони цих розподілів, побудованих в однаковому масштабі, на одному рисунку. При цьому кожен з полігонів зображується або іншим кольором, або іншою лінією (штрихованою, хвилястою тощо). Таке поєднання на одному рисунку кількох графіків дає змогу ефективно та швидко порівнювати між собою розподіли, що має на меті виокремлення ділянок, які збігаються, тенденцій зміни ознак.

Аналіз двовимірних таблиць

Одним з важливих завдань аналізу даних є пошук та оцінка взаємозв'язків окремих ознак для певної сукупності об'єктів. Першим кроком при розв'язуванні цієї задачі є побудова кореляційних таблиць (їх ще називають двовимірними таблицями). Двовимірні таблиці дають змогу впорядкувати інформацію про розподіл сукупності об'єктів за двома ознаками. Така таблиця має прямокутну форму. Кількість рядків у таблиці дорівнює кількості можливих значень однієї ознаки, а кількість стовпчиків — кількості можливих значень іншої ознаки.

Стать

Повністю задоволений

Скоріше так, ніж ні

Скоріше ні, ніж так

Повністю не задоволений

Разом

Чоловік

18,4 %

39

86,6 %

25,5 %

54

61,4 %

33,0 %

70

66,7 %

23,1 %

49

44,5 %

212

60,9 %

Жінка

4,4 %

6

13,3 %

25,0 %

34

38,6 %

25,7 %

35

33,3 %

44,9 %

61

55,5 %

136

39,1 %

Разом опитаних

45

12,9 %

88

25,3 %

105

30,2 %

110

81,6 %

Крім того, двовимірна таблиця, як правило, містить ще один додатковий стовпчик та ще один додатковий рядок — так звані маргінальні стовпчик та рядок. Кожна клітинка маргінального стовпчика містить суму чисел відповідного рядка, а також відсоток, який становить це число по відношенню до загальної кількості об'єктів. Крім того, в кожній клітинці таблиці, як правило, записують два відсотки — відсоток, який становить число, що міститься в клітинці, по відношенню до відповідного значення в маргінальному стовпчику (цей відсоток записують над числом), та відсоток по відношенню до відповідного значення в маргінальному рядку (записується під числом). Так, якщо ми знову повернемося до клітинки в другому рядку четвертого стовпчика таблиці, то побачимо, що кількість незадоволених умовами праці жінок (таких на підприємстві 61) становить 44,9 % загальної кількості жінок (а всього на підприємстві працює 136 жінок) та 55,5 % загальної кількості незадоволених умовами праці (всього умовами праці на підприємстві не задоволені 110 робітників). З таблиці також видно, що відсоток жінок, не задоволених умовами праці на підприємстві, значно більший, ніж чоловіків.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]