Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВСЯ КУЧА.doc
Скачиваний:
7
Добавлен:
13.09.2019
Размер:
3.66 Mб
Скачать

37. Способи ремонту вибірки: відсікання, перезважування.

Навіть якщо вибірка є правильно спланованою, та під час практичної

реалізації плану вибірки часто виникають різноманітні

проблеми. Зокрема, "недосяжність" певних потенційних респондентів

може призводити до певних викривлень у структурі вибірки. Досить

часто після завершення етапу збору інформації виконують процедуру

ремонтування вибірки. Метою цієї процедури є відтворення у вибірці

відомих із зовнішніх надійних джерел інформації характеристик

генеральної сукупності. Такими зовнішніми джерелами інформації

часто є або дані державної статистики, або ж дані інших досліджень.

Пакет SPSS дає можливість досліднику ремонтувати вибірку

методом зважування. Ідея методу зважування полягає в тому, що

кожному спостереженню присвоюється певне позитивне число, що

розглядається як ваговий коефіцієнт цього спостереження (або говорять

просто про вагу спостереження) у загальній вибірці. Працюючи

зі зваженою вибіркою, комп'ютерна програма оперує не кількостями

спостережень, а сумами вагових коефіцієнтів цих спостережень.

Зокрема зазначимо, що навіть незважена вибірка може розглядатися

як така, в якій кожне спостереження має вагу 1.

Технічно процес зважування виглядає дуже просто. Потрібно

вказати певну змінну, яка під час подальшого аналізу буде розглядатися

як вагова. Значення цієї змінної для кожного із спостережень

розглядається як ваговий коефіцієнт цього спостереження у загальній

вибірці. Якщо для певного спостереження значенням вагової змінної

є 0 або від'ємне значення, або відсутнє значення, то таке спостереження

в результаті зважування виключається з аналізу.

Процедура зважування спостережень проста. Цей етап виконується

в два кроки:

- визначити ваги даних;

- обчислити змінну, значеннями якої будуть відповідні значення

ваг.

Приклад. Ми продовжуємо працювати із даними дослідження,

проведеного у місті Києві у 1991 р. Нехай, за даними державної

статистики, нам відомі такі пропорції:

• за статтю - 46 % становлять чоловіки і 54 % жінки;

• за освітою у чоловіків - 42,2 % вища освіта, 29,6 % середня

спеціальна освіта, 22,2 % середня загальна освіта, 6,1 % неза-

кінчена середня освіта;

• за освітою у жінок - 47, 4 % вища освіта, 30,4 % середня спеціальна

освіта, 18,1 % середня загальна освіта, 4,1 % неза-

кінчена середня.

Наша мета полягає в тому, щоб обчислити такі ваги, які б відтворювали

в нашому файлі даних зазначені пропорції за статтю та

освітою.

Для того, щоб з'ясувати реальний розподіл за статтю та освітою у

побудуємо двовимірну таблицю для змінних (стать)

та (освіта). Результат обчислень операції Crosstabs... представлений

нижче у таблиці 8.2.

Всього у файлі даних 431 спостереження. Проте в одному спостереженні

не вказана стать респондента, отже таблиця побудована для

430 спостережень, і після зважування ми будемо мати також 430

спостережень (сума всіх ваг для всіх спостережень має дорівнювати 430).

Спостереження із незазначеною статтю респондента в результаті

зважування буде просто викинуто з аналізу.

У побудованій двовимірній таблиці є 8 клітин. Отже, маємо 8

груп спостережень, і для кожної такої групи треба вказати формулу

для обчислення ваги (всі спостереження з однієї групи будуть мати

однакову вагу). Розглянемо верхню ліву клітину таблиці. Вона

містить дані про чоловіків із вищою освітою. Спостереження, що

потрапили до цієї клітини, можна відібрати умовою (vl65=l and

v167=1). Загальний обсяг вибірки після зважування мас бути 430 і 46 %

мають становити чоловіки. Інакше кажучи, після зважування у вибірці

має бути 430x0.46 чоловіків. Серед них 42,2 % - чоловіки із

вищою освітою. Отже, після зважування у нас має бути

(430*0,46)*0,422 чоловіків із вищою освітою. Саме така сума ваг спостережень, що

стосуються чоловіків із вищою освітою. Проте у нашому файлі даних

є 95 чоловіків із вищою освітою. Отже, кожному зі спостережень, що

стосуються цієї групи (тобто спостережень, що відповідають умові

(vl65=1 and vl67=l)) потрібно присвоїти вагу, що обчислюється за

Формулою

Якщо тепер обчислити за цими формулами значення певної

змінної (категорії цієї змінної матимуть відповідно вісім різних

значень) і вказати цю змінну як вагову, то потрібні нам пропорції за

статтю та освітою будуть відтворені.

Зауваження 1. Якщо ваги є не цілими числами (а, як правило, так

воно завжди і є), то в результаті округлень може виникнути ситуація,

коли сума частот на 1 або 2 об'єкти не збігається із маргінальними

значенням суми у відповідному рядку. Те ж саме і відносно сум

частот у стовпчиках та загальної суми частот у таблиці. Такі розбіжності

не впливають на значення статистичних коефіцієнтів та на

висновки аналізу, але можуть справляти неприємне враження на тих,

хто не знайомий зі специфікою зважування нецілими значеннями.

Зауваження 2. Значення вагової змінної не повинні бути дуже

великими. Ті групи спостережень, для яких обчислене значення ваги

є більшим ніж 1, у зваженій вибірці будуть "штучно збільшені". Ті ж

групи, для яких ваговий коефіцієнт буде менше 1, після зважування

зменшуватимуться. Занадто велике штучне, шляхом зважування,

збільшення певної групи є небажаним. Не потрібно компенсувати

зважуванням невдале планування вибірки або ж її погану реалізацію.

Бажано, щоб значення ваг не перевищували

38. Статистичний висновок. Спеціальні математичні процедури називають приводних ремнем емпіричного дослідження. В їх основі лежить теорія ймовірностей, що визначає технологію складання вибіркової сукупності та електронної обробки даних. До неї тісно примикає процедура емпіричного узагальнення, звана ще статистичними висновком. У його основі лежить індукція - умовивід від фактів до деякої гіпотези (загальним твердженням).

  Статистичний висновок - це індуктивно узагальнення, побудоване на основі математичної обробки і додавання деякого безлічі одиниць дослідження. Ми опитали 1500 виборців і з'ясували, що понад 60% людей похилого віку (старше 60 років) на останніх виборах голосували за комуністів. У даному випадку вивчалася статистична зв'язок двох змінних: вік і електоральне поводження. Звідси можна зробити статистичний висновок: чим більше вік респондента, тим вища ймовірність того, що він проголосує за комуністів. І навпаки.

  Статистичний висновок ми отримали після обробки анкет та аналізу первинних даних. Це кількісний висновок. На відміну від нього два інших, розглянутих раніше типу виводу - логічний та теоретико-гіпотетичний - є якісними. Зв'язок між ними наступна. При складанні програми дослідження вчений теоретично постулірует (будує теоретичну гіпотезу) можливість зв'язку між двома змінними - віком та електоральним поведінкою. Пізніше, коли він склав анкети та провів дослідження, при математичної обробки даних будується статистичний висновок. Це дві сторони однієї медалі, перший (вік) служить пробні проектом, теоретичним макетом можливої зв'язку двох змінних, а другий (електоральне поведінка) - його емпіричним підтвердженням.

  Статистичний висновок - область імовірнісного знання. Ймовірність - числова характеристика ступеня можливості появи будь-якої випадкової події за тих чи інших певних, які можуть повторюватися необмежену кількість разів умовах. Вона вивчається в теорії ймовірностей - розділ математики, в якому поданим ймовірність одних випадкових подій знаходять ймовірності інших подій, пов'язаних яким-небудь чином з першими. Математична статистика - наука про математичних методах систематизації та використання статистичних даних. Спираючись на теорію ймовірностей, вона дозволяє оцінити, зокрема, необхідний обсяг вибірки для отримання результатів необхідної точності при вибіркових обстежень. Одна з основних задач теорії ймовірностей полягає у з'ясуванні закономірностей, що виникають при взаємодії великого числа випадкових факторів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]