Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка мол.спец.денне.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.22 Mб
Скачать

Питання, які розглядаються на лекції

2.2.1.Опис інформації та обчислення узагальнюючих параметрів.

2.2.2. Коефіцієнти зв’язку між двома ознаками. Кореляційний і регресійний аналіз

Після вивчення матеріалу теми Ви повинні

Знати підсумковий документ аналізу соціологічної інформації, інформаційна записка, аналітична записка, звіт про науково-дослідну роботу.

Вміти аналізувати загальні процедури обробки соціологічних даних

Короткий зміст матеріалу

2.2.1.Математиками нагромаджена значна кількість методів та конкретних статистичних алгоритмів, які успіш­но використовують у різних галузях природничих та гумані­тарних наук. Але застосування математичних методів у кожній новій галузі має свою специфіку і складнощі. Про­блеми використання математичних методів у соціології обу­мовлені складністю та багатофакторністю суспільних явищ та процесів, необхідністю мати справу не тільки з об'єктив­ними фактами, а й з громадською думкою, поглядами лю­дей, їх ставленням до суспільних явищ, ціннісними орієнта­ціями, які дуже важко піддати кількісному аналізові. Мате­матичні методи ефективні за умови, що вони спираються на ґрунтовний змістовний аналіз досліджуваних явищ. Використовуючи методи математичної статистики, соціологія здійснює:

1. Компактний опис первинної соціологічної інформації (побудова таблиць одновимірних розподілів, обчислення па­раметрів розподілів та ін.).

2. Пошук та оцінювання зв'язків між ознаками дослідуваного суспільного явища (обчислення статистичних коефіцієнтів зв'язку, кореляційний аналіз, регресійний аналіз).

З Пошук латентних (прихованих) факторів, які визнача­ють взаємозв'язки всередині групи ознак досліджуваного явища (факторний аналіз, латентно-структурний аналіз),

4,Класифікацію ознак та об'єктів, побудову типологій (кластерний аналіз, дискримінантний аналіз, факторний аналіз),

5.Прогнозування тенденцій розвитку певного суспільного явища (комплексне застосування різних методів).

В емпіричному дослідженні соціолог вивчає певну множи­ну об'єктів, наприклад, колектив робітників підприємства, Кожному елементові множини притаманні певні властивості (ознаки), скажімо, стать, вік, задоволеність умовами праці Кожний об'єкт має певне значення за кожною ознакою, Так, наприклад, кожний робітник має одне з двох можливих зна­чень ознаки «Стать» (чоловіча або жіноча), одне з трьох мож­ливих значень ознаки «Задоволеність умовами праці» (задово­лений, не зовсім задоволений, зовсім не задоволений), певне значення ознаки «Вік» (число повних років від 18 до 80) та ін.

Як правило, для спрощення обробки всі значення ознак кодують числами, Таким чином, дані для обробки являють собою прямокутну таблицю (матрицю) чисел. Кожний рядок цієї таблиці відповідає одному об'єкту, а кожний стовпчик — певній ознаці. На перетині певного рядка та стовпчика цієї таблиці знаходиться значення певної ознаки певного об'єкта, Ознаки поділяють на якісні та кількісні. Якісні ознаки — ознаки, які не мають кількісного виразу, Приклади якісних ознак — «Стать», «Задоволеність умовами праці». Кількісні ознаки — це такі, для яких відомі одиниці вимірювання. Приклади кількісних ознак — «Вік» (одиниця вимірюван­ня — рік), «Заробітна плата» (одиниця вимірювання — грив­ня), Кількісні ознаки ще називають ознаками, заданими у метричній шкалі.

При кодуванні значень якісної ознаки числами можливі два суттєво відмінні варіанти, У першому значення якісної ознаки можна впорядковувати, тобто для будь-якої пари зна­чень можна вказати, яке з них відповідає сильнішому вияв­ленню ознаки. Наприклад, значення «задоволений* відпові­дає більш інтенсивному виявленню ознаки «Задоволеність умовами праці», ніж значення «не зовсім задоволений», У такому разі доцільно і числові коди добирати так, щоб силь­нішому виявленню ознаки відповідало більше число. Так, для вже вищезазначеної ознаки «Задоволеність умовами праці* можна обрати такі числові коди значень: 3 — «задоволений», 2 — «не зовсім задоволений», 1 — «зовсім не задоволений» Такі якісні шкали часто називають порядковими шкалами, або шкалами рангів.

У другому випадку значення якісної ознаки не піддають­ся жодному змістовому впорядкуванню. Наприклад, ознака «Стать» з двома значеннями — «чоловіча» та «жіноча». Для значень ознак такого типу можна добирати будь-які числові коди. Головне — щоб різні значення мали різні коди (тобто не можна кодувати два різні значення ознаки одним числом). Такі якісні шкали часто ще називають номінальними шкала­ми. Як правило, для кодування значень ознак в номінальних шкалах використовують цілі додатні числа — 1, 2, ...

Соціологові постійно доводиться при складанні програми дослідження обирати (або навіть самостійно конструювати) шкали. Від того, наскільки вдало це буде зроблено, значною мірою залежить результат опрацювання отриманих даних. Крім того, вибір математичного методу аналізу даних тісно пов'язаний зі шкалами відповідних ознак. Вибір методу ана­лізу, що не відповідає даним, є дуже суттєвою методичною помилкою, що може звести нанівець роботу щодо збору да­них та обчислення результатів.

Для того щоб первинні дані можна було використовувати для змістового аналізу і висновків, вони повинні бути пев­ним чином упорядковані та опрацьовані. З цією метою засто­совують спеціальні статистичні методи — групування, обчис­лення узагальнюючих параметрів та коефіцієнтів, кореля­ційний, кластерний, факторний аналізи та ін. Незалежно від того, який метод аналізу застосовують, опрацювання даних починається з попереднього впорядковування інформації, головним чином за допомогою статистичного групування та побудови статистичних таблиць.

Структуру сукупності об'єктів з точки зору однієї виділеної ознаки доцільно вивчати за таблицею, в якій для кожного з можливих значень ознаки зафіксовано, скільки разів зустріча­ються в сукупності об'єкти, що мають відповідне значення. Таку таблицю називають таблицею одновимірного розподілу, одновимірною таблицею, або варіаційним рядом. Для ознаки «Задо­воленість умовами праці» одновимірна таблиця може мати та­кий вигляд:

Ознака: Задоволеність умовами праці. Кількість об'єктів - 357 Кількість значень -348 (97,48%)

Значення

Код

Частота

% до всіх

% до значень

Задоволений

3

45

12.60

12.93

Не зовсім задоволений

2

249

69.75

71.55

Незадоволенні

1

54

15.13

15.32

Кількість об'єктів у досліджуваній сукупності — 357. Для 348 об'єктів (що становить 97,48% від загальної сукупності) відоме значення ознаки «Задоволеність умовами праці». Для інших об'єктів сукупності (в даному разі їх 9) значення цієї ознаки не відоме (наприклад, інформація зібрана методом опитування, і деякі працівники підприємства не захотіли відповідати на поставлене запитання). Аналіз таблиці свідчить, що задоволених умовами праці — 45 (12,6% від загальної су­купності та 12,93% від кількості працівників, які відповіли на поставлене запитання). Значна більшість працівників (по­над 82%) повністю або частково не задоволена умовами праці.

В одновимірній таблиці часто перший або другий стовпчи­ки відсутні (тобто в таблиці зазначають або самі значення, або їх коди); відсоток, зазначений у четвертому стовпчику, ніколи не перевищує відсотка, зазначеного у тому ж рядку п'ятого стовпчика; сума чисел в четвертому стовпчику не пе­ревищує 100, а сума чисел у п'ятому стовпчику повинна дорівнювати 100.

Неможливо перелічити всі можливі значення ознак, за­даних в метричних шкалах, а отже, неможливо і безпосеред­ньо побудувати одновимірну таблицю. За таких обставин усі можливі значення ознаки розбивають на інтервали, а потім будують таблицю. Так, наприклад, для сукупності праців­ників даного підприємства всі значення ознаки «Вік» знахо­дяться між віком наймолодшого робітника (припустимо, 18 років) та віком найстаршого робітника (припустимо, 68). Розіб'ємо їх на 4 інтервали: від 18 до 25 років, від 26 до 40 років, від 41 до 59 років та від 60 до 68 років. Тоді одновимірна таблиця, що демонструє структуру сукупності працівників за віком, матиме такий вигляд:

Ознака: Вік (інтервал).

Кількість об'єктів — 357. Кількість значень — 357 (100%).

Значення

Частота

% до всіх

% до значень

18—25 років

43

12.04

12.04

26—40 років

223

62.47

62.47

41—59 років

67

18.77

18.77

60—68 років

24

6.72

6.72

У цій таблиці відсутній стовпчик, у якому вказані коди інтервалів, а оскільки відомо вік усіх працівників (є відповідні значення для всіх об'єктів), тому третій і четвертий стовпчи­ки збігаються. Метрична ознака розбита у даній таблиці на різні за розміром (нерівномірні) інтервали. А нерідко корис­но розбивати весь діапазон значень на інтервали однакової довжини (рівномірні інтервали).

Для полегшення аналізу великої кількості таблиць та за­безпечення можливості порівняння декількох таблиць обчис­люють узагальнюючі характеристики рядів розподілу. Одна з них, що найчастіше використовується, — середнє значення ознаки. Для кількісної ознаки обчислюють її середнє ариф­метичне значення щодо всіх об'єктів сукупності. Для якіс­них ознак такою узагальнюючою характеристикою ряду є мода — значення, що найчастіше зустрічається в одновимірній таблиці. Так, наприклад, за таблицею (див. с. 354) модою ознаки «Задоволеність умовами праці» є значення «не дуже задоволений».

Щоб оцінити, наскільки репрезентує середнє значення весь ряд розподілу, обчислюють статистичні показники варіації ознак. Для кількісних ознак — це дисперсія, середнє квадра­тичне відхилення, коефіцієнт варіації. Для якісних ознак розроблені спеціальні індекси якісної варіації. Чим більше значення відповідного показника варіації, тим розсіяніші нав­коло середнього значення реальні значення ознаки, а отже, тим з більшою обережністю потрібно оперувати з середнім значенням при побудові змістовних висновків. Межі варіації також дають змогу оцінити, наскільки од­норідною за певною ознакою є сукупність. Якщо сукупність за певною ознакою неоднорідна, може постати потреба розби­ти цю сукупність на декілька однорідних за цією ознакою частин та аналізувати кожну з них окремо. Припустимо, що вивчається задоволеність умовами праці на певному підприємстві. З логічних міркувань або з результатів попе­редніх досліджень відомо, що заробітна плата працівника впливає на його задоволеність умовами праці. Нехай ко­ефіцієнт варіації заробітної плати для всієї сукупності праців­ників дорівнює 0,7. Тоді необхідно розбити всю сукупність працівників на групи, приблизно однакові за рівнем заробіт­ної платні (щоб у кожній групі коефіцієнт варіації заробітної плати був нижчим від 0,4), й аналізувати задоволеність умо­вами праці окремо у кожній з них. Кількість об'єктів у досліджуваній сукупності — 357. Для 348 об'єктів (що становить 97,48% від загальної сукупності) відоме значення ознаки «Задоволеність умовами праці». Для інших об'єктів сукупності (в даному разі їх 9) значення цієї ознаки не відоме (наприклад, інформація зібрана методом опитування, і деякі працівники підприємства не захотіли відповідати на поставлене запитання). Аналіз таблиці свідчить, що задоволених умовами праці — 45 (12,6% від загальної су­купності та 12,93% від кількості працівників, які відповіли на поставлене запитання). Значна більшість працівників (по­над 82%) повністю або частково не задоволена умовами праці.

В одновимірній таблиці часто перший або другий стовпчи­ки відсутні (тобто в таблиці зазначають або самі значення, або їх коди); відсоток, зазначений у четвертому стовпчику, ніколи не перевищує відсотка, зазначеного у тому ж рядку п'ятого стовпчика; сума чисел в четвертому стовпчику не пе­ревищує 100, а сума чисел у п'ятому стовпчику повинна дорівнювати 100. Неможливо перелічити всі можливі значення ознак, за­даних в метричних шкалах, а отже, неможливо і безпосеред­ньо побудувати одновимірну таблицю. За таких обставин усі можливі значення ознаки розбивають на інтервали, а потім будують таблицю. Так, наприклад, для сукупності праців­ників даного підприємства всі значення ознаки «Вік» знахо­дяться між віком наймолодшого робітника (припустимо, 18 років) та віком найстаршого робітника (припустимо, 68), Розіб'ємо їх на 4 інтервали: від 18 до 25 років, від 26 до 40 років, від 41 до 59 років та від 60 до 68 років. Тоді одновимірна таблиця, що демонструє структуру сукупності працівників за віком, .матиме такий вигляд:

Ознака: Вік (інтервал).

Кількість об'єктів — 357. Кількість значень — 357 (100%),

Значення

Частота

% до всіх

% до значень

18—25 років

43

12.04

12.04

26—40 років

223

62.47

62.47

41—59 років

67

18.77

18.77

60—68 років

24

6.72

6.72

У цій таблиці відсутній стовпчик, у якому вказані коди інтервалів, а оскільки відомо вік усіх працівників (є відповідні значення для всіх об'єктів), тому третій і четвертий стовпчи­ки збігаються. Метрична ознака розбита у даній таблиці на різні за розміром (нерівномірні) інтервали. А нерідко корис­но розбивати весь діапазон значень на інтервали однакової довжини (рівномірні інтервали). Для полегшення аналізу великої кількості таблиць та за­безпечення можливості порівняння декількох таблиць обчис­люють узагальнюючі характеристики рядів розподілу. Одна з них, що найчастіше використовується, — середнє значення ознаки. Для кількісної ознаки обчислюють її середнє ариф­метичне значення щодо всіх об'єктів сукупності. Для якіс­них ознак такою узагальнюючою характеристикою ряду є мода — значення, що найчастіше зустрічається в одно-вимірній таблиці. Так, наприклад, за таблицею (див. с. 354) модою ознаки «Задоволеність умовами праці» є значення «не дуже задоволений». Щоб оцінити, наскільки репрезентує середнє значення весь ряд розподілу, обчислюють статистичні показники варіації ознак. Для кількісних ознак — це дисперсія, середнє квадра­тичне відхилення, коефіцієнт варіації. Для якісних ознак розроблені спеціальні індекси якісної варіації. Чим більше значення відповідного показника варіації, тим розсіяніші нав­коло середнього значення реальні значення ознаки, а отже, тим з більшою обережністю потрібно оперувати з середнім значенням при побудові змістовних висновків. Межі варіації також дають змогу оцінити, наскільки од­норідною за певною ознакою є сукупність. Якщо сукупність за певною ознакою неоднорідна, може постати потреба розби­ти цю сукупність на декілька однорідних за цією ознакою частин та аналізувати кожну з них окремо. Припустимо, що вивчається задоволеність умовами праці на певному підприємстві. З логічних міркувань або з результатів попе­редніх досліджень відомо, що заробітна плата працівника впливає на його задоволеність умовами праці. Нехай ко­ефіцієнт варіації заробітної плати для всієї сукупності праців­ників дорівнює 0,7. Тоді необхідно розбити всю сукупність працівників на групи, приблизно однакові за рівнем заробіт­ної платні (щоб у кожній групі коефіцієнт варіації заробітної плати був нижчим від 0,4), й аналізувати задоволеність умо­вами праці окремо у кожній з них.

2.2.2.Одним із важливих завдань аналізу даних є по­шук та оцінка взаємозв'язків між окремими ознаками для певної сукупності об'єктів. Вирішувати цю проблему почина­ють з побудови кореляційних таблиць (їх ще називають таб­лицями спряженості двох ознак, двомірними таблицями). Вони дають змогу впорядковувати інформацію про розподіл сукупності об'єктів за двома ознаками. Такі таблиці мають прямокутну форму. Кількість рядків у них дорівнює кількості можливих значень однієї ознаки, а кількість стовпчиків — кількості можливих значень другої ознаки. В наведеній ниж­че таблиці в клітинці на перетині другого рядка і третього стовпчика знаходиться число 42 (в центрі клітинки) — кількість робітниць (значення ознаки «Стать» — «жіноча»), що не задоволені умовами праці (значення ознаки «Задово­леність умовами праці» — «не задоволений»).

Задовол.

Не зовсім задовол.

Не задовол.

Всього

Чол.

18.40% 39

86.67%

75,94%

161

64.66%

5.66%

12

22.22%

212

60.92%

Жін.

4.41%

6

13.33%

64.71%

88

35.34%

30.88%

42

77.78%

136

39.08%

Всього

45

12.93%

249

71.55%

54

15.52%

Крім того, двомірна таблиця, як правило, містить ще один додатковий стовпчик і ще один додатковий рядок — так звані маргінальні стовпчик та рядок. У таблиці маргінали помічені словом «Всього». Кожна клітинка маргінального стовпчика містить суму чисел відповідного рядка, тобто кількість об'єктів, що мають відповідне значення першої ознаки (неза­лежно від того, якого значення для цих об'єктів набуває дру­га ознака), а також відсоток, який становить це число відносно загальної кількості об'єктів. Так, з маргінального стовпчика таблиці бачимо, що на підприємстві працює 136 жінок (39,08% від загальної кількості працюючих). Маргінальний рядок містить відповідні суми стовпчиків таблиці.

У кожній клітинці таблиці, як правило, записують відсо­ток, відносно відповідного значення в маргінальному стовпчи­ку (цей відсоток записують вище від самого числа) та відсо­ток відносно відповідного значення в маргінальному рядку (записують нижче від числа). Якщо знову повернутися до клітинки в другому рядку третього стовпчика таблиці, побачи­мо, що кількість не задоволених умовами праці жінок (таких на підприємстві 42) становить 30,88 % від загальної кількості жінок (всього на підприємстві 136 жінок) та 77,78 % від за­гальної кількості незадоволених умовами праці (всього умова­ми праці на підприємстві не задоволені 54 працівники).

Числа в таблиці свідчать, що серед жінок відсоток неза­доволених умовами праці на підприємстві значно вищий, ніж серед чоловіків. Отже, є підстави для гіпотези, що стать пра­цівника та його задоволеність умовами праці взаємопов'я­зані. Вміння читати двовимірні таблиці приходить неодразу - потрібна практика. Нелегко знаходити закономірності в досить великих за розміром таблицях. Крім того, далеко не завжди явно простежується зв'язок між ознаками. Тому на практиці наявність зв'язку між двома ознаками встановлю­ють за допомогою так званого критерію %2, який базується на аналізі частот, записаних в клітинках таблиці, і дає змогу робити висновки про те, чи можна висувати й аналізувати гіпотезу про наявність зв'язку між двома ознаками. Застосовуючи зазначений критерій, необхідно обчислити коефіцієнт Хі-квадрат за формулою (формула залежить від частот в клітинках таблиці та маргінальних частот), а одер­жане значення порівняти з табличним (критичним). При цьому слід мати на увазі певний рівень значущості (ймовірність прийняття хибного рішення) — в соціології, як правило, 0,05 або 0,01. Крім того, табличне значення залежить від кількості ступенів свободи, що визначають за кількістю рядків та стовп­чиків таблиці. Отже, для заданого рівня значущості та кількості ступенів свободи необхідно знайти в таблиці кри­тичне значення і порівняти його з обчисленим. Якщо обчис­лене значення більше від критичного, то факт існування зв'яз­ку можна вважати встановленим. Силу зв'язку можна оціни­ти обчисленням та аналізом коефіцієнтів спряженості (Пірсона, Чупрова, Крамера). Значення цих коефіцієнтів знаходяться в інтервалі від нуля до одиниці та мають такий зміст: чим ближче значення до одиниці, тим тісніший зв'язок. Якщо обидві ознаки, між якими вивчають зв'язок, мають лише по два значення (тобто фіксують наявність або відсутність даної ознаки в об'єкта), то для таких «чотирьохклітинкових» таб­лиць обчислюють коефіцієнти асоціації та контингенції. Якщо певному значенню однієї величини відповідає су­купність значень другої, то між цими двома величинами існує кореляційний зв'язок. Він зустрічається тоді, коли на дослід­жуване явище впливає не один, а багато факторів. Наприк­лад, стаж впливає на продуктивність праці, але не остаточно визначає її, бо залежить і від рівня освіти, віку, кваліфікації працівника та інших факторів. Оскільки явища суспільного життя складні та багатофакторні, зв'язок між ознаками в соціології практично завжди кореляційний.

Якщо кожному значенню однієї ознаки відповідає су­купність значень другої ознаки, близько розміщених коло свого середнього значення (тобто всі значення сукупності не дуже відрізняються від свого середнього арифметичного), то такий кореляційний зв'язок вважають сильнішим. Кількісно сила кореляційного зв'язку оцінюють за допомогою ко­ефіцієнтів кореляції. Для кількісних ознак часто використовують коефіцієнт Пірсона (ч), що оцінює силу зв'язку за лінійної кореляції (тобто в припущенні, що значення однієї ознаки пов'язані з відповідними середніми другої ознаки лінійною залежністю). Всі значення коефіцієнта кореляції Пірсона належать інтер­валу від —1 до 1. Знак коефіцієнта показує «напрямок» зв'яз­ку: додатне значення свідчить про «прямий» зв'язок (зрос­тання однієї ознаки зумовлює зростання другої ознаки), від'ємне значення — про «зворотний» зв'язок, а значення «О» — про відсутність лінійного кореляційного зв'язку. На­приклад, зв'язок між заробітною платою робітника та кількістю виготовлених ним деталей — прямий, а між заро­бітною платою та кількістю бракованих деталей — зворот­ний. При ч=1 або ч=1 маємо функціональний зв'язок між оз­наками (тобто кожному значенню однієї ознаки відповідає одне значення другої ознаки і ці значення пов'язані лінійною залежністю). Отже, чим далі значення коефіцієнта Пірсона від нуля (чим більша його абсолютна величина), тим тісніший лінійний кореляційний зв'язок існує між ознаками. Але якщо ч=0, то це означає відсутність лише лінійного зв'язку, а не відсутність зв'язку між ознаками взагалі, зв'язок може існу­вати, але нелінійний. Для оцінювання сили нелінійного зв'яз­ку використовують кореляційне відношення, що набуває зна­чення між 0 та 1 (0 означає відсутність зв'язку, а 1 — функ­ціональний зв'язок). Для ознак, заданих в порядкових шкалах, обчислюють рангові коефіцієнти кореляції (Спірмена та Кендела), які також набувають значення між —1 та 1 й інтерпретуються так само, як і коефіцієнт кореляції Пірсона. Якщо встановлено кореляцію між двома ознаками, то це не означає, що визначено причинний зв'язок між ними, а лише те, що одна з ознак частково спричинила іншу чи обидві ознаки і є наслідком деяких спільних для них причин. Зау­важимо, що кількісна оцінка кореляційних зв'язків не може замінити спеціальних знань, але може допомогти дослідни­кові відкинути несуттєві зв'язки, чіткіше окреслити напрям пошуків, порівняти вплив різних факторів тощо. Крім того, коефіцієнти часткової кореляції дають змогу оцінити зв'я­зок між двома ознаками, усуваючи вплив однієї або декіль­кох інших ознак. Якщо після усунення впливу третьої озна­ки коефіцієнт кореляції між двома ознаками збільшується, то третя ознака ослаблює зв'язок, а якщо зменшується, то саме ця третя ознака певною мірою спричиняє наявність цьо­го зв'язку (тобто зв'язок, можливо, є лише наслідком впливу цієї третьої ознаки). Обчислити коефіцієнти часткової коре­ляції досить складно через коефіцієнти кореляції Пірсона. Обсяг обчислень зростає з кількістю тих ознак, вплив яких бажають усунути. Силу спільного зв'язку сукупності ознак дає змогу оцінити коефіцієнт множинної кореляції. Методи регресійного аналізу дають змогу не тільки оці­нити силу зв'язку між двома ознаками, а й встановити вид цього зв'язку у вигляді рівняння (рівняння регресії), що опи­сує залежність між середнім значенням однієї ознаки (залеж­ної, поведінку якої вивчають) та значеннями певної сукуп­ності ознак (незалежних, вплив яких на залежну ознаку на­магаються оцінити). В соціологічних дослідженнях, як пра­вило, відбувається пошук такої залежності у лінійному виг­ляді (у вигляді лінійного рівняння), тому йдеться про рівняння багатовимірної (множинної) лінійної регресії.

Знання залежності у вигляді рівняння дає змогу не тільки пояснювати поведінку залежної ознаки, а й прогнозувати її значення за різних змін значень незалежних ознак. Наприк­лад, на основі аналізу факторів, що впливають на рівень за­робітної плати на підприємстві, було побудовано рівняння лінійної регресії: у= 4,27 х, -1,83x2-9,20

Воно описує зв'язок між заробітною платою у (залежна ознака, вимірюється в гривнях і двома такими незалежними ознаками, як стаж х1 (вимірюється в роках) та освітній рівень х2 (вимірюється в роках) працівника. Аналіз цього рівняння наводить на думку, що зростання трудового стажу працівни­ка на один рік зумовлює зростання його середньої заробітної платні на 4,27 грн., а зростання освітнього рівня на один рік — зростання середньої заробітної плати лише на 1,83 грн. Отже, на даному підприємстві трудовий стаж значно більше впливає на середню заробітну плату працівника, ніж його освітній рівень. Якість рівняння регресії (наскільки точно рівняння регресії описує зв'язок між ознаками) оцінюють ко­ефіцієнтом множинної кореляції. Суттєвим для одержання надійних, статистично обґрун­тованих результатів є оцінка значущості статистичних по­казників. Це цілий комплекс математичних процедур, що дають змогу відповісти на низку питань щодо розрахованих статистичних показників та параметрів вибіркової сукупності. Так, обчисливши коефіцієнт кореляції між двома ознаками та одержавши число, що не дорівнює нулю, цілком логічно постає питання, чи справді цей коефіцієнт суттєво відрізняєть­ся від нуля (а отже, фіксує наявність лінійного кореляційно­го зв'язку), чи ця різниця випадкова і спричинена лише по­хибкою нашої вибірки. На таке питання можна дати відповідь, оцінивши значущість відмінності коефіцієнта кореляції від нуля, звернувши особливу увагу на обсяг вибірки та рівень значущості (ймовірність прийняття хибного рішення). Ця про­цедура така ж, як і процедура застосування критерію %г і дає змогу обчислити за певною формулою критерій, а одержане значення порівнюється з табличним. На основі результатів порівняння і робиться висновок. Крім оцінки значущості відмінності від нуля коефіцієнта кореляції між двома ознаками, часто застосовують і процеду­ри оцінки значущості різниці між двома відсотками ( наприк­лад, різниці між відсотками незадоволених умовами праці на даному підприємстві серед жінок та чоловіків), різниці між двома середніми (між середньою заробітною платою на одному й на іншому підприємствах), двох коефіцієнтів кореляції. Для кожної такої задачі існують формула обчислення критерію та статистичні таблиці, якими користуються для порівняння.

Література

1. Піча В. М. Предмет, структура, функції соціології. -Львів, 1994.

2. Піча В.М. Соціологія: загальний курс. Навч. посів. - К., 1999.