
- •Соціальна статистика Підручник
- •Isbn 966-574-307-*
- •4.1. Сім'я та домогосподарство у структурі суспільства
- •5.2. Система показників політичного і громадського життя
- •Результати виборів 29 березня 1998 року за партійними списками
- •Поділ домашніх господарств за розміром житлової площі на одну особу та за типом житла (у % до загальної кількість домогосподарств)
- •Поділ домогосподарств україни за складом та кількістю кімнат, що їх вони займають1 (у % від загальної кількості домогосподарств
- •8.1. Джерела інформації й основні поняття статистики зайнятості населення
- •8.2. Показники економічної активності, зайнятості і безробіття
- •Економічна активність населення україни у 1999 році1
- •Групування регіонів україни за рівнем безробіття в 1999 році' (% до кількості економічно активного населення віком 15—70 років)
- •Розподіл безробітного населення за тривалістю незайнятості та пошуку роботи в 1999 році
- •9.1. Здоров'я населення
- •Кількість зареєстрованих злочинів за окремими видами (тисяч)
- •Раціональні норми і фактичне споживання продуктів харчування у домогосподарствах україни у 1999 році
- •12.3. Показники споживання
- •Структура сукупних витрат домогосподарств україни у 1999 році1
- •Структура сукупних витрат домогосподарств україни із різними середньодушовими сукупними витратами у 1999 році1
- •14.1. Соціальний час
- •15.1. Методологічні підходи до вивчення громадської думки
- •15.3. Узагальнюючі показники аналізу громадської думки
- •Розподіл відповідей на запитання «як ви оцінюєте характер змін рівня життя, що відбулися у вашому житті за останній рік?»
- •Проект стандартної статистичної класифікації екологічної якості прісної води (Європейська Економічна Комісія)
- •Б) у повітрі населених пунктів
- •Міщмальнии набір товарів культурно-побутового та господарського призначення (на одну середньостатистичну сім'ю)
- •Послуги культури
- •А. Вихідні дані для обчислення індексів
15.1. Методологічні підходи до вивчення громадської думки
Контрольні
запитання
А
наліз бюджету часу як метод вивчення видів діяльностіі способу життя населення.
Класифікації, що використовуються при вивченні бюд жету часу населення.
Показники структурних розбіжностей бюджетів часу рі зних груп населення.
Одним із джерел інформації про соціальні процеси і явища, що відбуваються в суспільстві і про ставлення населення до їх проявів є вивчення суспільної думки.
Громадська думка — це особливий стан реальної свідомості населення, що виражає домінуюче ставлення або позицію по актуальних суспільно значущих питаннях.
Будь-яка громадська думка є стійким проявом інтересів людей до будь-яких явищ. Вона виникає лише тоді, коли йдеться про інтереси мас: матеріальні, духовні, суспільні, політичні та інші.
Громадська думка в будь-якому суспільстві є не тільки індикатором соціальних процесів, але, значною мірою, і рушійною силою розвитку суспільства. Роль громадської думки в суспільстві визначається її функціями або напрямками впливу на суспільство. Розрізняють такі функції громадської думки1:
експресивна функція — визначає позиції населення до конк ретних фактів, подій, суспільних і соціальних інститутах і т. д.;
консультативна функція — виробляє рекомендації з вирі шення зазначених проблем;
директивна функція — виносить рішення з тих чи інших пи тань (референдуми, вибори і т.ін.);
оцінна функція — дає оцінку фактам, подіям, особистостям і т. д.;
•діагностична функція — ставить діагноз певним явищам і проблемам громадського життя;
контролююча функція — впливає на соціальні процеси за допомогою ставлення до них (духовного контролю над ними);
нормативна функція — установлює правила і норми пове дінки;
прогностична функція — дає уявлення про розвиток ситуації на перспективу.
Вивчення громадської думки набуває особливого значення в періоди трансформації суспільства. Перспектива виходу суспільства із соціальної кризи, що зумовлена перебудовою усталеної
Сурмин
10. 77.
Теория общественного мнения.— К., 1999.
— С. 12—16.
283
t
Si
і і її
її
системи і пошуком нових орієнтирів розвитку, багато в чому визначається соціальним самопочуттям різних категорій населення.
Соціальне самопочуття — узагальнена характеристика суб'єктивного ставлення людей до свого становища в суспільстві. Воно може бути оцінено показниками ставлення людей до існуючої суспільної ситуації і їхньої готовності підтримувати певний курс розвитку соціально-економічних і політичних процесів або протидіяти цьому курсу, якщо він суперечить їхнім інтересам і призводить до погіршення соціального самопочуття.
Громадська думка належить до малодосліджених явищ суспільства, насамперед через труднощі, що пов'язані зі збором достатньо повної і достовірної інформації про неї. Головна проблема полягає у формуванні репрезентативної вибірки, особливо в сучасних умовах суспільства, що трансформується. На сучасному етапі розвитку відбуваються значні зміни соціальної структури суспільства, пов'язані з появою нових соціальних груп і змінами характеристик існуючих груп. При цьому значна частина населення перебуває в маргінальному стані (проміжний перехідний стан, коли деякі якості колишньої соціальної належності уже втрачені, а якості нової групи ще не набуті).
Не менше важливим для одержання достовірної інформації про ставлення населення до суспільних процесів і явищ є й підготовка відповідного інструментарію для вивчення громадської думки.
Вивчення громадської думки здійснюється, як правило, в ході соціологічних досліджень. Оскільки створити уявлення про громадську думку без спілкування з респондентом неможливо, то базисним методом її вивчення є опитування. Все розмаїття опитувань громадської думки можна класифікувати так:
за охопленням генеральної сукупності — вибіркове і суціль не опитування;
за засобами спілкування між респондентом і дослідником — анкетне опитування, інтерв'ю, поштове і телефонне опитування;
за ступенем формалізації запитань і відповідей — вільне і формалізоване опитування;
за змістом інформації — про факти, події, поведінку людей і т.ін.;
за типами респондентів — індивідуальні, групові, експерт ні, масові опитування;
за типом досліджуваної суспільної думки — політичні, еконо мічні, соціальні, маркетингові, культурологічні, релігійні опитування.
Головна мета будь-якого опитування, незалежно від його виду і методу проведення, — дістати інформацію про ставлення насе-
лення до тих явищ і процесів, які відбуваються в суспільстві, впливаючи зрештою на соціальний добробут людей і рівень їх життя. Для досягнення цієї мети соціологи розробляють спеціальні тести, що містять у собі запитання з досліджуваної проблеми і варіанти очікуваних відповідей респондентів на ці запитання. При розробці тестів запитання формулюються таким чином, щоб відповіді на них відбивали ті форми судження людей, які дозволяють робити висновки про їх емоційні і раціональні оцінки, декларативні установки і фактологічні судження.
Емоційно-оцінні судження дають змогу людині висловити загальну позитивну, негативну або нейтральну оцінку щодо того або іншого предмета дослідження в категоріях «добре — погано», «краще — гірше», «довіряю — не довіряю», «задоволений — не задоволений», «вистачає — не вистачає».
Раціонально-оцінні судження в категоріях «правильно — неправильно», «відповідає думці — не відповідає» використовуються для оцінювання раціональності і доцільності тих або інших політичних і управлінських рішень і дій у різних сферах життя суспільства. Ці судження характеризують ступінь декларативної підтримки і сприйняття населенням різних напрямків розвитку суспільства.
Декларативно-установочні судження відбивають готовність населення діяти тим або іншим чином за певних суспільних і особистих обставин (готовність до соціального протесту, підтримці тих або інших політичних сил, міграції й т. ін.).
Фактологічні судження фіксують наявність життєвих умов або певних обставин і відбивають конкретні умови життя і форми активності людей.
Думки, судження й оцінки населення з приводу конкретного питання через неоднозначність завжди містяться в певному діапазоні (інтервалі). Тому крім правильного формулювання запитання необхідно вибрати потрібну шкалу вимірювання, що відбивала б достатньо повно усі відтінки громадської думки з цього питання. При вивченні громадської думки використовуються, як правило, номінальні і порядкові шкали вимірювання, що мають безліч різновидів. До найширше використовуваних шкал належать:
шкала достатності, що дозволяє вимірювати різноманітні компоненти соціального самопочуття населення. Ця шкала має такі градації достатності: «вистачає», «важко сказати вистачає або не вистачає», «не вистачає»;
шкала задоволеності дозволяє виміряти ступінь задоволен ня населення своїм рівнем життя або розвитком суспільних про цесів. Градації шкали задоволеності: «цілком задоволений», «ско-
284
шкала схвалення виражає ставлення населення, до лідерів і політичних сил, до запропонованих і прийнятих рішень, вчинків і конкретних дій. Ця шкала має такі градації: «цілком схвалюю», «скоріше схвалюю, ніж не схвалюю», «важко сказати однознач но, схвалюю або немає», «скоріше не схвалюю», «зовсім не схва люю»;
шкала довіри використовується в тих самих випадках, що і шкала схвалення, і має градації: «цілком довіряю», «скоріше до віряю», «важко сказати, довіряю або немає», «скоріше не дові ряю», «зовсім не довіряю»;
шкала якості дозволяє оцінити доступність і якість тих або інших соціальних благ і умов життя населення в цілому, а також стосунків у суспільстві, колективі, сім'ї. Градації: «значно поліп шилися», «трохи поліпшилися», «залишилися такими ж», «злегка погіршилися», «значно погіршилися».
Кількість градацій кожної шкали може змінюватися залежно від цілей і задач дослідження.
Вивчення громадської думки найчастіше здійснюється шляхом проведення вибіркових опитувань з окремих питань або з комплексу питань, результати котрих після обробки поширюються на генеральну сукупність.
У результаті організації і проведення опитувань здійснюється збір первинної інформації, що становить ті відомості, які можуть бути отримані за допомогою різних соціологічних методів.
Первинна інформація являє собою невпорядкований ряд розподілу результуючих ознак (оцінок, думок, позицій і т. п.) у залежності від факторів (стать, вік, соціальний статус, рівень освіти, місце проживання, рівень доходів і ін.). Характерною особливістю цієї інформації є те, що вона не дає, як правило, кількісних оцінок досліджуваного соціального явища. Ці оцінки і висновки можуть бути знайдені лише в результаті її обробки й аналізу із застосуванням відомих статистичних методів: побудова угруповань, структурний аналіз, оцінка взаємозв'язків тощо.
Труднощі в застосуванні статистичних методів при вивченні суспільної думки зумовлені складністю і різноманіттям соціальних явищ і процесів, що відбуваються в суспільстві. Крім того, дослідник під час вивчення громадської думки стикається не лише з об'єктивними факторами, які можна кількісно виміряти, а й
з думками, ставленнями та оцінками конкретних людей, статистичний аналіз яких потребує застосування специфічних методів.
Головна мета аналізу отриманих результатів полягає у виявленні закономірностей, притаманних громадській думці. Під закономірністю громадської думки розуміється об'єктивний, не випадковий, стійкий та істотний зв'язок явищ і процесів. Виявлення закономірностей, притаманних громадській думці, дозволяє досліднику зрозуміти і пояснити явища і процеси, що відбуваються в суспільстві
Оцінка будь-яких явищ і процесів соціального життя суспільства, яка отримана в результаті вивчення громадської думки, являє собою, по суті, складний вектор, що утворюється з різних співвідношень чотирьох оцінок: схвалення, негативного ставлення, байдужості і нездатності оцінювати. Структура всієї сукупності оцінок респондентів з якогось досліджуваного питання описується наступною формулою1:
М+ + М_ + Мр + М„ = 100%,
де М+, М_, Мр, МИ— відсоток респондентів, котрі, відповідно,
схвалюють дану позицію, не схвалюють її, байдужі до неї або не змогли визначити свого ставлення до даної позиції.
У цій формулі містяться практично всі варіанти закономірностей громадської думки. Значення, що виражають громадську думку з досліджуваного питання, можуть змінюватися за абсолютною величиною, і їх співвідношення визначає ставлення суспільства в цілому до даної проблеми.
Можливі різні варіанти співвідношення складових:
а) М = Мн = 0; М+ + М_ = 100 %. Таке суспільство можна виз начити як конфронтаційне, оскільки громадська думка визнача ється лише двома крайніми точками зору: позитивною і негатив ною. При М+ =М_ =50% конфронтаційне суспільство перебу ває в рівновазі. Якщо М+ > М_ або М+ < М_, то в суспільстві є опозиція, тобто це суспільство або боротьби з опозицією, або бо ротьби опозиції;
б) Мр = Мп =0; М+ -» max, М_ -» 0. Це становище означає, що
суспільство максимально підтримує дану точку зору. Для проведення її в життя створюються найбільш сприятливі умови в суспільній свідомості. Якщо така ситуація підтримується силою, те дане суспільство є диктаторським, або авторитарним;
1
Сурмин
Ю. П. Теория
общественного мнения. — К., 1999. — С.
48—53.
286
в) при
Мр=Мн
=0; М_—»тах,
Л/+->0
суспільство характе
ризується
крайнім негативізмом, що свідчить про
кризу суспіль
них
цінностей і є ознакою наближення
революції;
г) М+,М_,Ми — прямують до 0, а А/я->тах. Це свідчить про суспільство «байдужих». Для такого типу суспільства харак терна несприйнятливість до будь-яких змін, що відбуваються у суспільстві;
д) М+,М_,Мр — прямують до 0, а М„ -^ max. У даному сус пільстві населення не може виробити свого ставлення до найваж ливіших явищ, які в ньому відбуваються.
З погляду прийняття і реалізації управлінських рішень стан громадської думки, що виражається співвідношенням Мр = Ми =
= М_ = 0, називається законом сприяння, а Мр =М„=М+=0 — законом не сприяння розвитку.
Аналізуючи результати соціологічного дослідження, доводиться роз'язувати подвійну задачу:
діставати з маси розрізненої, найчастіше суперечливої, інфор мації конкретні статистичні показники, що характеризують цю інфор мацію в цілому і дають змогу виявляти приховані в ній тенденції;
оцінювати якість здобутих показників, тобто визначати, на скільки вони значущі та вірогідні. Ця оцінка дає підстави для ви сновку про якість первинної інформації, на підставі якої доходять висновків про результати дослідження.
Обробка інформації, здобутої у процесі соціологічного дослідження, здійснюється в кілька етапів:
подання інформації у вигляді зручному для проведення статис тичного аналізу: побудова варіаційних рядів розподілу, статистичних групувальних таблиць, розрахунок параметрів розподілу і т. ін.;
аналіз структури суспільної думки й одержання її узагаль нюючих характеристик;
« встановлення і вимірювання розміру зв'язку між ознаками досліджуваного соціального явища і думкою населення з урахуванням його соціального статусу.
і 15.2. ОСОБЛИВОСТІ ЗАСТОСУВАННЯ СТАТИСТИЧНИХ МЕТОДІВ ДЛЯ АНАЛІЗУ ГРОМАДСЬКОЇ ДУМКИ
При обробці й аналізі матеріалів соціологічних досліджень широко застосовуються загальновідомі методи теорії статистики. Вибір цих методів визначається завданнями і метою
288
конкретного дослідження, а також типом наявних даних, тобто рівнем їх вимірювання або типом шкали вимірювання: номінальна, порядкова, метрична.
Вивчаючи громадську думку, найчастіше використовують вимірювання за номінальною або порядковою шкалою, що зумовлює деякі особливості застосування статистичних методів або використання специфічних методів, особливо в разі оцінювання та вимірювання взаємозв'язків між ознаками.
d
і
Варіація якісних (атрибутивних) ознак оцінюється так: а) для альтернативних (взаємовиключних) ознак:
(і
U+n2
де щ, ri2 — значення альтернативних ознак, п = щ + щ;
d\, <%2 — частки відповідних ознак у їх загальній сукупності.
б) для якісних ознак, що мають к взаємовиключних градацій, обчислення варіації здійснюється за формулою:
1 =
де п\, «2, Щ, ■■■, пк — значення ознаки відповідної градації; к — кількість градацій ознаки, т — кількість складових у чисельнику індексу.
Таблиця 15.1
289
РОЗПОДІЛ ВІДПОВІДЕЙ НА ЗАПИТАННЯ «ЩО Б ВИ МОГЛИ СКАЗАТИ ПРО СТАНОВИЩЕ ВАШОЇ СІМ'Ї?»
Варіанти відповідей |
Розподіл респондентів за варіантами відповідей, отриманими у ході опитування, % |
Рівномірний розподіл респондентів за варіантами відповідей, % |
Живемо добре |
2,0 |
20,0 |
Живемо більш-менш пристойно |
38,7 |
20,0 |
Ледь зводимо кінці з кінцями |
47,5 |
20,0 |
Живемо за гранню бідності |
8,3 |
20,0 |
Важко відповісти |
3,5 |
20,0 |
Разом |
100,0 |
100,0 |
191-344
I
її:
Цей показник називається індексом варіації і вказує на ступінь неоднорідності отриманих відповідей. Значення показника, що дорівнює 0, означає, що думки всіх респондентів з даного питання цілком збігаються, у разі показника, що дорівнює 1, усі думки поділилися порівну між усіма варіантами відповідей.
Розглянемо застосування цієї формули на прикладі розрахунку варіації оцінювання респондентами матеріального стану своєї сім'ї (табл. 15.1).
"J0 ■ 38,7 + 2,0 • 47,5 + 2,0 • 8,3 + 2,0 ■ 3,5 + 38,7 ■ 47,5 -38,7 • 8,3 + 38,7 ■ 3,5 + 47,5 • 8,3 + 47,5 ■ 3,5 + 8,3 ■ 3,5)
10x1
100 = 77,0%.
3080,46 4000
Отримане значення показника, що дорівнює 77,0 %, свідчить про значну варіацію відповідей респондентів на поставлене запитання.
Одним із головних завдань статистичного аналізу громадської думки є виявлення закономірностей, що притаманні цьому суспільному явищу.
Закономірності масових суспільних явищ, у тому числі й громадської думки, складаються під впливом множини факторів, що діють одночасно і взаємозалежно. При вивченні цих закономірностей постає необхідність вирішувати два види завдань:
завдання на вимірювання та описання взаємної залежності між декількома випадковими перемінними. Це завдання вирішу ється із застосуванням кореляційного аналізу;
завдання на вимірювання та описання залежності одної змін ної від набору інших змінних. Для розв'язування такого типу зав дань застосовуються регресійний аналіз.
Перш ніж вибрати статистичний метод, який доцільно застосувати для оцінювання зв'язку під час виконання конкретного завдання, слід засобами змістовного аналізу встановити наявність і характер зв'язку між фактором і результативною ознакою. Це необхідно тому, що існуючі методи аналізу зв'язків дають можливість оцінити розмір й істотність зв'язку, але не пояснюють причин виникнення цього зв'язку.
Для оцінювання ступеня одностороннього впливу одного з факторів (групи факторів) на результуючу ознаку при фіксованих значеннях інших факторів звичайно використовують коефіцієнти
290
регресії. Ступінь взаємного впливу одного з факторів і результуючої ознаки, коли виключається вплив інших факторів, оцінюється коефіцієнтами часткової кореляції. Оцінювання ступеня зв'язку результуючої ознаки із сукупністю факторів здійснюються за допомогою коефіцієнта множинної кореляції.
При статистичному аналізі залежностей, що притаманні суспільним явищам і процесам, дуже часто доводиться стикатися з якісними ознаками, як результуючими, так і факторними. У теорії статистики існує багато показників, що характеризують зв'язки між якісними ознаками. Пояснюється це тим, що поняття «взаємозв'язок» не є однозначним, існують певні розбіжності між різними його відтінками. Реально існуюча розмаїтість складних соціальних взаємозв'язків у суспільстві і прагнення дослідників до їх точного вимірювання і достовірної інтерпретації зумовлюють потребу використовувати все розмаїття методів оцінювання зв'язків.
Вибір засобу вимірювання зв'язку в кожному конкретному випадку визначається цілями і завданнями дослідження з урахуванням таких факторів:
видів інформації (атрибутивні або кількісні ознаки);
форми і типу залежності між ознаками (лінійна або неліній на залежність, додатний або від'ємний зв'язок);
зручності при обчисленні та порівняної простоти при інтер претації;
поширеності використання того або іншого показника;
необхідної точності розрахунків і наявного технічного за безпечення їх виконання.
Взаємозв'язки між атрибутивними ознаками аналізуються на основі таблиць взаємної спряженості.
При вивченні зв'язку між альтернативними ознаками, а також у випадках, коли при спостереженні фіксуються тільки наявність або відсутність ознаки і отриману інформацію можна звести в таблицю розміром 2x2 (так звану чотириклітинкову таблицю), для оцінювання зв'язку застосовуються коефіцієнт асоціації (зв 'язку) Q / коефіцієнт спряженості (контингенції) Ф.
Чотириклітинкова таблиця в загальному вигляді подається так:
Значення ознак |
А |
Не А |
Разом |
В |
а |
b |
a+b |
Не В |
с |
d |
c+d |
Разом |
а + с |
b+d |
n |
291
І
чи-
де a,b,c,d— частоти порівнюваних ознак; n = a + b + c + dчисло спостережень.
ad-cb
Ф =
Коефіцієнт
асоціації (зв'язку)Q
і
коефіцієнт спряженості Ф
обчислюються
за формулами:
1<Ф<1.
Обидва коефіцієнти набувають значення від -1 до 1. Якщо знак додатний, то між ознаками існує пряма залежність, від'ємні значення коефіцієнтів свідчить про обернену залежність.
Незважаючи на певну подібність між коефіцієнтами асоціації і спряженості, вони вимірюють різні аспекти взаємозв'язку. Коефіцієнт асоціації відбиває тільки наявність односторонньо спрямованого зв'язку і ніяк не характеризує зв'язок у зворотному напрямі. Коефіцієнт спряженості дозволяє відбити ступінь взаємозв'язку між досліджуваними ознаками в обох напрямах. Тому, обчислюючи коефіцієнти асоціації і спряженості за тими самими даними, дістають, як правило, різні їх значення. Значення коефіцієнтів збігаються лише в тому разі, коли існує повний двосто-. ронній зв'язок між ознаками. Наявність повного двосторонього зв'язку можна визначити візуально за розміщенням частот у діагональних клітинках таблиці. Концентрація частот у клітинках будь-якій діагоналі є свідченням повного двостороннього зв'язку. Значення коефіцієнтів асоціації та спряженості не змінюються, якщо всі частоти таблиці помножити або поділити на те саме число. Тому ці коефіцієнти можна розраховувати як за абсолютними, так і за процентними розподілами.
При виборі того або іншого показника в конкретному дослідженні варто звернути увагу на таке. Якщо значення підсумкових сум у таблиці (а + b, c + d, b + d, a + с) значно різняться між собою, то доцільніше використовувати коефіцієнт асоціації, щоб перевірити, чи існує взагалі зв'язок між ознаками. У тому випадку, коли розбіжності між значеннями підсумкових сум не дуже великі, є сенс розрахувати коефіцієнт спряженості, щоб оцінити наявність двостороннього зв'язку. Якщо при цьому отримане значення коефіцієнта спряженості виявиться досить низьким, то слід обчислити коефіцієнт асоціації, оскільки односторонній зв'язок може бути досить значний навіть при малому значенні коефіцієнта спряженості.
292
Обчислимо коефіцієнти асоціації і спряженості для розподілу, наведеного в табл. 15.2.
Таблиця 15.2
СТАВЛЕННЯ ПІДПРИЄМЦІВ І НЕ ПІДПРИЄМЦІВ ДО ЗДІЙСНЮВАНИХ РЕФОРМ
Ставлення до реформ |
Підприємці, % |
Не підприємці, % |
Разом, % |
Схвалюють |
68,3 |
38,9 |
107,2 |
Не схвалюють |
31,7 |
61,1 |
92,8 |
Разом |
100,0 |
100,0 |
200,0 |
= 68,3 ■ 61,1 -31,7 • 38,9 _ 2940,00
~ 68,3 ■ 61,1 + 31,7 ■ 38,9 ~ 5406,26 " ' '
= 0,29.
ф_ 68,3-61,1-31,7-38,9 2940,00 VlO7,2 -92,8 -100,0 -100,0 ~ 9974,06
Коефіцієнти асоціації і спряженості характеризують наявність одно- або двостороннього зв'язку між досліджуваними ознаками і дають оцінку їх істотності, але їх досить важко інтерпретувати, особливо коли вони застосовуються до таких якісних ознак, як, наприклад, стать, національність, віросповідання та ін., значення котрих важко або неможливо упорядковувати, бо вони рівноправні.
Крім коефіцієнтів асоціації і спряженості для вимірювання зв'язку між атрибутивними ознаками застосовуються показники взаємозв'язку: «Хі-квадрат» (%2) і коефіцієнти взаємної спряженості Пірсона (Р), Чупрова (Т) і Крамера (К). На відміну від коефіцієнтів асоціації (Q) і коефіцієнта спряженості (Ф) вони можуть застосовуватися не тільки до таблиць розміру 2><2, а й до таблиць більшого розміру.
Застосування зазначених показників розглянемо на прикладі аналізу взаємозв'язку між рівнем середньодушового доходу респондентів і їх оцінкою свого рівня життя (табл. 15.3).
Частоти комбінаційного розподілу респондентів за рівнем доходів і їх оцінками свого рівня життя концентруються в клітинках діагоналі з нижнього лівого кута.у верхній правий кут, що свідчить про наявність стохастичного зв'язку між цими ознаками.
293
Зі
зростанням розміру таблиці т
максимальне
значення Р
поступово
наближається до 1. Тому на практиці для
порівняння коефіцієнтів
Р,
що
характеризують те саме явище громадського
життя,
але отримані з таблиць різної розмірності,
їх нормують ділячи фактичне значення
відповідного коефіцієнта на його можливе
максимальне значення, що визначається
розміром даної таблиці:
р =
норм Р
max
позбавлений
зазначеного недоліку, притаманного
коефіцієнту Р,
і
для
квадратних таблиць (у випадках коли тх
= ту)
він
набуває значення
в межах від 0 до 1. Для розглянутого
прикладу
252,71
= 0,254.
/19597(3^1X3-1)
Знайдене
значення менше, ніж значення коефіцієнта
Пірсона. Коефіцієнт Чупрова дає більш
обережну оцінку існуючого взаємозв'язку.
Недоліком коефіцієнта Чупрова є те, що
при тх
ф
ту
він
завжди менший від 1.
Цей недолік
усунутий у коефіцієнті взаємної
спряженості Крамера:
ґ
ТУ"
_
Коефіцієнт
Крамера може завжди досягати 1 незалежно
від виду
і розміру таблиці спряженості. Для
квадратної таблиці значення
коефіцієнтів Крамера і Чупрова
збігаються, а в інших випадках
К>Т.
Через
те, що коефіцієнти взаємної спряженості
визначаються на
основі х2,
то
всі обмеження для %2
справджуються і для цих коефіцієнтів,
а саме:
теоретичні
частоти Fy
у
будь-яких клітинках таблиць взаємної
спряженості не повинні бути меншими
за 5, а ще краще не меншими
за 10. Якщо в якійсь клітинці таблиці
частота виходить менше
5, то звичайно роблять об'єднання сусідніх
шпальт або рядків;
296
• повинно бути достатньо великим і загальне число спостережень п, зведених у таблицю спряженості. Задовільний результат, якому можна довіряти, одержується, коли загальна кількість спостережень перевищує 100.
Оцінка значимості коефіцієнтів взаємної спряженості провадиться на основі оцінки значимості х2> тобто якщо цей критерій значущий, те і коефіцієнти значимі.
Для вивчення зв'язків між ознаками, вимірюваними по порядковій шкалі використовуються коефіцієнти рангової кореляції. Порядкова (рангова) шкала вимірів установлює не тільки відношення подоби елементів, що вимірюються, але і відношення послідовності (порядку). Кожному пункту порядкової шкали присвоюється певне число — ранг, що відображає послідовність значень ознаки, але не враховує відстань між ними.
До коефіцієнтів рангової кореляції, що широко відомі і застосовуються в статистичній практиці, відносять коефіцієнти Спірмена (р), Кендала (х) і множинний коефіцієнт рангової кореляції (W).
Ранги, що привласнені елементам сукупності по ознаках х і у, позначаються відповідно Rx і Ry . У залежності від ступеня зв'язку між ознаками певним чином співвідносяться і ранги, привласнені цим ознакам.
У разі прямої функціональної залежності Rx - Ry , тобто відхилення між рангами будуть рівні 0, а отже, і сума квадратів відхилень Y,d2~Q. У разі оберненої функціональної залежності
"Zd2 =-n(n2 -1), де п — кількість рангів. ;=і З
За відсутності зв'язку між ознаками, сума квадратів відхилень рангів являє собою середню арифметичну цих крайніх значень:
=^+{-п(п2 -\у\ = х-п(п2 -\). іг :';■:::'
Отже, за відсутності зв'язку маємо
7=1
= 1.
1 , 2 п п(п2 -1) -и(и -1) v
Коефіцієнт кореляції рангів Спірмена визначається за формулою:
п{п2-\У
297
і має такі властивості: у разі повної прямої залежності між ознаками х і у коефіцієнт дорівнює 1, у разі повної оберненої залежності він дорівнює -1.
У випадку відсутності повної прямої або зворотної залежності значення коефіцієнта міститься в межах між -1 і 1, причому, чим ближче до нуля абсолютна величина коефіцієнта, тим залежність між ознаками менша.
Визначимо коефіцієнт рангової кореляції Спірмена за даними табл. 15.4: ;
6-6
— = 1 - = 0 929 ' - 8(8'-1) 504 и'У2У-
Зауважимо, що дані, які характеризують сукупність за ознакою х, розташовуються в ранжованому порядку.
Отримане значення коефіцієнта рангової кореляції свідчить про наявність прямого зв'язку між ступенем задоволеності респондентів рівнем життя і їхнім ставленням до продовження ринкових реформ.
;■ Таблиця 15.4
РОЗРАХУНОК КОЕФІЦІЄНТА РАНГОВОЇ КОРЕЛЯЦІЇ СПІРМЕНА
Соціально-фаховий статус респондентів |
Відсоток респондентів, що відповіли позитивно на запитання: |
Ранги |
dJ |
*) | ||
«Чи влаштовує Вас Ваш рівень ЖИТТЯ?», X |
«Чи потрібно продовжувати ринкові реформи?», V |
Rt хі |
R yj | |||
Учні |
68,0 |
45,2 |
І |
2 |
-1 |
1 |
Фахівці |
57,4 |
49,9 |
2 |
1 |
1 |
1 |
Домогосподарки |
53,9 |
41,0 |
3 |
3 |
0 |
0 |
Службовці |
48,9 |
33,9 |
4 |
5 |
-1 |
1 |
Керівники |
45,1 |
38,1 |
5 |
4 |
1 |
1 |
Робітники |
42,7 |
31,1 |
6 |
6 |
0 |
0 |
Пенсіонери |
33,5 |
19,3 |
7 |
8 |
_[ |
1 |
Безробітні |
30,1 |
29,7 |
8 |
7 |
1 |
1 |
Разом |
X |
X |
X |
X |
X |
6 |
: Критичне значення коефіцієнта рангової кореляції (табл. 15.5) для рівня значимості а = 0,05 і п - 8 дорівнює 0,642. Отже* установлено, що з імовірністю 0,95 зв'язок між розглянутими ознаками існує.
Таблиця 15.5
|
КРИТИЧНІ ЗНАЧЕННЯ КОЕФІЦІЄНТА РАНГОВОЇ КОРЕЛЯЦІЇ СПІРМЕНА для а = 0,05. |
| |||||
п |
4 |
5 |
6 |
7 |
8 |
9 |
10 • |
Ро,«(«) |
1,000 |
0,900 |
0,828 |
0,714 |
0,642 |
0,600 |
0,564 |
Наведена формула коефіцієнта Спірмена вірна лише в тих випадках, коли всім об'єктам сукупності привласнені різні ранги. Якщо ж два або більше елементи сукупності мають однакові значення ознаки, то кожному з них приписується ранг, рівний середньому арифметичному порядкових номерів цих елементів- Так, якби в розглянутому прикладі «службовці» і «керівники» мали б однакове значення ознаки х, то кожному з них варто було б присвоїти ранг, що дорівнює (4 + 5) / 2 = 4,5. Для розподілів, ідо мають значне число однакових (пов'язаних) рангів, застосування вище зазначеної формули коефіцієнта Спірмена дає завищену величину коефіцієнта. У таких випадках більш придатна уточнена формула коефіцієнта Спірмена:
12
-1)
12
Т -■ у -
tx — кількість зв'язаних рангів у розподілі х;
ty — кількість зв'язаних рангів ^розподілі у.
Коефіцієнт кореляції рангів Кендала (г) також оцінює зв язок між двома якісними ознаками, які можна упорядковувати, але його побудова заснована на іншому підході до порівняння рангів двох ознак. Розглянемо обчислення коефіцієнта Кендала за даними табл. 15.6.
298
299
, .,...-,,■ Таблиця 15.6
РОЗРАХУНОК КОЕФІЦІЄНТА РАНГОВОЇ КОРЕЛЯЦІЇ КЕНДАЛА
|
Відсоток респондентів, що відповіли позитивно на запитання: |
Ранги |
Я |
д! | ||
«Чи влаштовує Вас Ваш рівень життя?», х |
«Чи потрібно продовжувати ринкові реформи?», у |
RK ' j |
\ | |||
Учні |
68,0 |
45,2 |
1 |
2 |
6 |
і |
Фахівці |
57,4 |
49,9 |
2 |
1 |
6 |
0 |
Домогосподарки |
53,9 |
41,0 |
3 |
3 |
5 |
0 |
Службовці |
48,9 |
33,9 |
4 |
5 |
3 |
1 |
Керівники |
45,1 |
38,1 |
5 |
4 |
3 |
0 |
Робітники |
42,7 |
31,1 |
6 |
6 |
■ 2 |
0 |
Пенсіонери |
33,5 |
19,3 |
7 |
8 |
1 |
1 |
Безробітні |
30,1 |
29,7 |
8 |
7 |
0 |
0 |
Разом |
X |
X |
X |
X |
26 |
3 |
У кожну клітинку шпальти Rf заносяться числа, що показують число рангів Ry , розташованих нижче даного рядка, але перевищують ранг Ry , що знаходиться в даному рядку. Так, у першому рядку таблиці знаходиться Ry =2. З семи рангів, розташованих нижче цього рангу, шість (3, 5, 4, 6, 8, 7) перевищують його по величині, тому в першу клітинку шпальти R, записується число 6. В другому рядку знаходиться Ry =1, усі шість
рангів, що розташовані нижче, більше 1, отже, у другу клітинку шпальти записується число 6. Аналогічно визначаються числа для інших клітинок шпальти Rt. У шпальту R] заносяться числа, що показують кількість рангів Ry , які розміщені нижче даного рядка і величина котрих менше рангу Ry у даному рядку. Меншим за ранг 2 є тільки ранг, що дорівнює 1, тому в першу клітинку шпальти R\ заноситься число 1 і т. д.
На практиці застосовуються дві формули розрахунку коефіцієнта кореляції рангів Кендала:
2)т = -
■п(п-\у Для розглянутого приклада обидві формули дають близькі за
значенням результати:
1} -^1)-1 = °'857;
Якщо досліджувані розподіли містять багато зв'язаних рангів, то, як і при розрахунку коефіцієнта Спірмена, цей факт варто враховувати, і тоді формула коефіцієнта Кендала набирає вигляду:
2S
Де S =
т= 2(26-3) 8(8-1)
2)
и-і)-Т; 10,5/1 (n-l)-
де tx, ty — число зв'язаних рангів у групах змінних х і у.
Коефіцієнт кореляції рангів Кендала приймає значення від -1 до 1. Значення 1 свідчить про наявність функціональної прямої залежності, -1 — про функціональну зворотну залежність, 0 — про відсутність залежності між ознаками.
Для перевірки істотності зв'язку між ознаками необхідно фактичне значення коефіцієнта Кендала зіставити з його критичним значенням, величина якого знаходиться за формулою:
2(2я
+ 5)
кр 2к
де zKp — критична точка, що знаходять з таблиці функції Лапласа по рівності Ф(гкр) = (1 - а) / 2.
Для значимості а = 0,05 значення Ф(гкр) = (1 - 0,05) / 2 = 0,475. По таблиці (дод. 10) знаходимо zKp = 1,96. Знайдемо критичне значення коефіцієнта Кендала для розглянутого приклада:
Т =1
0,566.
кр
2(2-8
+ 5)9-8(8-1)
~
У зв'язку з тим, що фактичне значення коефіцієнта Кендала т= 0,821 більше критичного значення Ткр = 0,566, варто зробити висновок про істотність зв'язку між рівнем доходу респондентів і оцінкою ними свого рівня життя.
300
301
Нерідко в дослідженнях постає потреба порівняти не два ряди ранжованих значень ознак, а більше їх число. Зокрема, ця задача виникає при використанні того або іншого варіанта методики експертних оцінок, коли потрібно оцінити узгодженість думок експертів по цих методиках. У цьому випадку для виміру зв'язку між довільним числом ранжованих перемінних використовується коефіцієнт множинної рангової кореляції W, що обчислюється за формулою:
У даному прикладі за об'єкти, що ранжуються, взято причини, які на думку респондентів ускладнюють життя їхніх сімей (п = 10), а в якості перемінних — групи респондентів із різним рівнем се-редньодушових доходів (к = 3).
З таблиці Rk = YRk/n= 165/10= 16,5. \
= 0,79.
12-586,5 32-10(102-1)
w=
де к — кількість перемінних; п — кількість об'єктів; R^ — сума значень рангів за всіма змінним в рядку; Rt = ТЯкІп — середнє арифметичне значення рангів.
Як приклад оцінимо узгодженість думок респондентів із різним рівнем середньодушових доходів про причини, що ускладнюють життя їхніх сімей (табл. 15.7).
Таблиця 15.7
РОЗРАХУНОК КОЕФІЦІЄНТА МНОЖИННОЇ КОРЕЛЯЦІЇ РАНГІВ
Причини, що ускладнюють життя сім'ї |
Ранги причин у груп респондентів із доходами |
Сума рангів Rt |
№-Я*)2 | ||
низькими |
середніми |
високими | |||
Низькі доходи |
1 |
1 |
1 |
3 |
182,25 |
Побоювання залишитися без роботи |
5 |
5 |
2 |
12 |
20,25 |
Стан здоров'я |
3 |
2 |
3 |
8 |
72,25 |
Погане житло |
9 |
7 |
8 |
24 |
56,25 |
Побутові труднощі |
4 |
4 |
5 |
13 |
12,25 |
Неможливість дати дітям гарну освіту |
6 |
8 |
9 |
23 |
42,25 |
Погані стосунки в сім'ї |
8 |
10 |
10 |
28 |
132,25 |
Втомленість, перевтома |
7 |
6 |
6 |
19 |
6,25 |
Відсутність перспектив у житті |
2 |
3 |
7 |
12 |
20,25 |
Нестача вільного часу |
10 |
9 |
4 |
23 |
42,25 |
Разом |
X |
X |
X |
165 |
586,50 |
Значимість зв'язку між ознаками перевіряється за критерієм X2, що для коефіцієнта множинної кореляції розраховується за наступною формулою:
12=-
кп(п + \) Для розглянутого прикладу:
2_ 12-586,5 _ 1 3-10(10 + 1)
Критичне значення %2 для а = 0,05 і числа ступенів свободи £ = п-1 = 10-1=9 дорівнює 16,92. Фактичне значення 21,33 підтверджує наявність значимого зв'язку між ознаками.
Отримане значення коефіцієнта множинної рангової кореляції свідчить про достатньо високу узгодженість респондентів з питання про ступінь впливу різноманітних причин на погіршення життя їхніх сімей.
На практиці часто виникає необхідність оцінити зв'язок між ознаками, з яких деякі вимірювані на метричній шкалі, а інші на порядковому або номінальному рівні виміру. Ця задача вирішується за допомогою обчислення бісеріального коефіцієнта зв'язку, за умови що значення якісних ознак будуть зведені до альтернативного вигляду.
Розглянемо методику розрахунку бісеріального коефіцієнта зв'язку на прикладі оцінки зв'язку між освітою респондентів і їхнього рівня доходу (табл. 15.8).
У таблиці ознака «рівень освіти» зведена до двох альтернативних значень. У першу групу включені всі респонденти, що мають рівень освіти вищий за середню загальну освіту, у другу — з освітою не вищу за середню. Значення результуючої ознаки, які вимірювані на інтервальній шкалі, утворюють два ряди розподілу уи й уОІ, що характеризують розподіл респондентів із різною освітою за рівнем доходу. Потрібно оцінити напрямок і величину зв'язку між рівнем доходів респондентів і їхньої освітою.
302
303
Таблиця
15.8
РОЗПОДІЛ РЕСПОНДЕНТІВ ЗА РІВНЕМ СЕРЕДНЬОДУШОВОГО СУКУПНОГО ДОХОДУ ЗАЛЕЖНО ВІД РІВНЯ ОСВІТИ
Рівень освіти |
Число респондентів, що мають дохід на місяць, грн., уі: |
Разом | |||||||
до 30,0 |
ЗОЛ— 60,0 |
60,1— 90,0 |
90.1— 120,0 |
120,1— 150,0 |
150,1— 180,0 |
180,1— 210,0 |
понад 210,0 | ||
Вищий за середній |
2 |
18 |
64 |
84 |
69 |
52 |
43 |
74 |
406 |
Не вищий за середній |
9 |
87 |
138 |
87 |
41 |
16 |
9 |
7 |
394 |
Разом |
11 |
105 |
202 |
171 |
110 |
68 |
52 |
81 |
800 |
Позначимо число респондентів з освітою вище за середню = ~Еуи , 3 освітою не вище за середню — п0 - ^уОІ , тоді сума
и, і п0 буде дорівнювати чисельності всіх респондентів: л, + п0 - п . Загальне число респондентів у дохідній групі у, = уХІ + уОі.
Для обчислення бісеріального коефіцієнта зв'язку необхідно одну з груп у і прийняти як умовну середню групу А. У випадку, коли число груп уі непарне, у якості умовної середньої групи приймається група розподілу, що знаходиться у середині ряду.
Якщо ж число груп парне, то в якості умовної середньої групи приймається будь-яка з двох груп у середині ряду. Коли умовна середня група визначена, у розрахункову таблицю вводяться значення умовних відхилень (а) всіх інших груп від умовної середньої групи, що виражаються додатними і від'ємними числами 1, 2, 3 і т. д. залежно від видалення групи від умовної середньої.
Коефіцієнт бісеріального зв'язку уь обчислюється за однією із таких формул:
n,
=■
с
п
Розрахунок необхідних значень математичних виражень, що входять у формули, здійснюється за схемою, наведеною в табл. 15.9.
■ ••'■■■-,.■.'■■.■'■-, ' ■•:'■■■ '•■'■' ■■'■ Таблиця 15.9
ОБЧИСЛЕННЯ КОЕФІЦІЄНТА БІСЕРІАЛЬНОГО ЗВ'ЯЗКУ
Факторна ознака хі |
Групи результуючої ознаки |
Разом | |||||||
1 |
2 |
3 |
4 |
5 |
6 |
1 |
8 | ||
|
Уи |
Уп |
Ум |
Уіл |
Ум |
У\ь |
Уп |
Уп |
"1=2>і; |
х0 |
Ут |
У02 |
Ут |
У04 |
Уог |
Уоб |
У<л |
Уоі |
Ио=ИУо/ |
Разом уі |
Уі |
Уі |
Уз |
У* |
Уі |
Уб |
Уі |
У» |
|
Виберемо групу 4 у якості умовної середньої групи, тоді: | |||||||||
а |
-3 |
-2 |
_ ] |
0 |
1 |
2 |
3 |
4 |
|
а" |
9 |
4 |
1 |
0 |
1 |
4 |
9 |
16 |
|
ауі |
-зу, |
-2Уі |
-у- |
0 |
Уі |
2у, |
ь, |
*Уі |
lay, |
а% |
9у, |
4 У, |
Уі |
0 |
Уі |
fyi |
|
Щі |
Тау, |
аУи |
-З^п |
-Ьп |
-Уп |
0 |
Ум |
2уів |
Зу17 |
4^І8 |
Т-ауи |
ауоі |
-ЗУо\ |
-ІУаг |
-Уоз |
0 |
Уоі |
2у06 |
3^07 |
4^08 |
"Lay® |
Для розглянутого прикладу розрахунок необхідних виражень наведений у табл. 15.10:
Таблиця 15.10
РОЗРАХУНОК КОЕФІЦІЄНТА ЗВ'ЯЗКУ МІЖ РІВНЕМ ОСВІТИ РЕСПОНДЕНТІВ І ЇХНІМИ ДОХОДАМИ
Факторна ознака хі |
Групи результуючої ознаки |
Разом | |||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 | ||
Вища за середню освіту |
2 |
18 |
64 |
84 |
69 |
52 |
43 |
74 |
406 |
Не вища за середню освіту |
9 |
87 |
138 |
87 |
41 |
16 |
9 |
7 |
394 |
Разом |
11 |
105 |
202 |
171 |
ПО |
68 |
52 |
81 |
800 |
а |
-3 |
-2 |
_] |
0 |
1 |
2 |
3 |
4 |
|
2 а |
9 |
4 |
1 |
0 |
1 |
4 |
9 |
16 |
|
ауі |
-33 |
-210 |
-202 |
0 |
ПО |
136 |
156 |
324 |
281 |
а2у, |
99 |
420 |
202 |
0 |
по |
272 |
468 |
1296 |
2867 |
ауи |
-6 |
-36 |
-64 |
0 |
69 |
104 |
129 |
296 |
492 |
ауоі |
-27 |
-174 |
-138 |
0 |
41 |
32 |
27 |
28 |
-211 |
304
20 1-34}
305
?Я1 = 2867-^ = 2768,3;
Підставляючи значення у формули, дістаємо:
-211 281
394 800 2768,3 2768,3
- = -0,470.
= 0,470;
800
|
492 |
281 |
|
406 |
800 |
|
/2768,3 |
2768,3 |
406 800 V 394 8
Отримані значення коефіцієнта зв'язку свідчать про те, що між рівнем освіти респондентів і рівнем їхніх доходів є зв'язок. Позитивне значення коефіцієнта гь\ можна інтерпретувати як прямий зв'язок між підвищенням освіти і зростанням доходів, а негативне значення коефіцієнта гьо — як зворотний зв'язок між низькими видами освіти і рівнем доходів.