Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторна робота № 1. пс.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
684.54 Кб
Скачать

3.1.2. Систематична рандомізована вибірка

Ця вибірка відповідає принципам рівноімовірнісного відбору (РІВ) і вважається оптимальною тоді, коли генеральна сукупність складає великий список об'єктів. Наприклад, для вибірки обсягом 100 об'єктів з генеральної сукупності обсягом 100000 можна визначити перший випадковий об'єкт (індекс), а потім узяти ще 99 випадкових індексів, причому кожний k-ий об'єкт зі списку повинен відстояти від першого взятого на k позицій.

Приклад 3.2. Необхідно отримати систематичну радомізовану вибірку обсягом n=10 з генеральної сукупності обсягом N=30 (обмеженість обсягів n і N обумовлено метою зручності).

Послідовність рішення:

  1. Виконаємо пункти 1-7 попереднього прикладу 3.1, у комірках D1:D30 отримаємо випадкову послідовність індексів для формування вибірки (рис. 3.8) .

Рис. 3.8.

Рис. 3.9.

Рис. 3.10.

  1. У стовпчику D, починаючи з 1-го випадкового значення (14) і з кроком k=3, виберемо перші 10 значень, що не повторюють одне одного (рис. 3.9). При фіксуванні індексів у стовпчиках А і D застосуємо засоби текстового редагування (рис. 3.10).

Отже, систематична рандомізована вибірка може містити такі об'єкти: 5, 8, 9, 14, 16, 17, 19, 20, 23, 30.

Прості й систематичні рандомізовані вибірки можуть не відповідати вимогам репрезентативності у разі, коли необхідно відобразити співвідношення важливих підгруп генеральної сукупності (популяції). Наприклад, коли у вибірці повинні бути пропорційно представлені студенти усіх чотирьох курсів з урахуванням співвідношення осіб жіночої і чоловічої статі. Подібна проблема вирішується за допомогою так званих стратифікованих і кластерних вибірок.

3.1.3. Стратифікована (розшарована) вибірка

Ця методика формування вибірки гарантує репрезентативність вибраних осіб по відношенню до обраних властивостей об'єкта дослідження. Наприклад, з генеральної сукупності обсягом 1000 студентів, з яких 700 – жінки, а 300 – чоловіки, необхідно сформувати репрезентативну вибірку обсягом 100 студентів, у якій було б пропорційно (70% і 30%) представлена кількість осіб кожної статі. Якщо використовувати просту (або систематичну) рандомізовану вибірку, то якісне і кількісне співвідношення осіб може відрізнятися від генеральної сукупності, тобто бути представлене неадекватно.

Приклад 3.3. Необхідно отримати стратифіковану вибірку студентів обсягом n=12 з генеральної сукупності обсягом N=30, де особи чоловічої статі становлять лише третину (33%) сукупності (обмеженість обсягів n і N вибрана з метою зручності).

Послідовність рішення

  1. Моделюємо генеральну сукупність, де жінки становлять 67% , а чоловіки 33%. Для цього у комірки А1:А20 (рис. 3.11) заносимо послідовний список осіб популяції жіночої статі у вигляді індексів від 1 до 20, а в комірки А21:А30 – послідовний список осіб чоловічої статі у вигляді індексів від 21 до 30.

  2. Виконуємо процедуру генерації значень за рівномірним випадковим розподілом окремо для осіб жіночої та осіб чоловічої статі, причому для стратифікованої вибірки повинно бути збережено співвідношення «жінки–чоловіки» у пропорції 67% – 33%. Це значить, що у вибірці загальним обсягом 12 жінки становитимуть 8 осіб (8/12=67%), а чоловіки – 4 особи (4/12=33%).

  1. Рис. 3.11.

    Для генерації дискретних значень стосовно осіб жіночої статі за рівномірним розподілом в інтервалі від 1 до 20 у комірки В1:В20 заносимо функцію =СЛУЧМЕЖДУ(A$1;A$20). У результаті отримаємо 20 випадкових чисел, серед яких необхідно узяти перші 8 значень, що не повторюються. У нашому прикладі це такі індекси: 1, 12, 4, 17, 10, 8, 18, 15.
  2. Для генерації дискретних значень для представників чоловічої статі за розподілом в інтервалі від 21 до 30 у комірки В21:В30 заносимо функцію =СЛУЧМЕЖДУ(A$21;A$30). Отримаємо 10 випадкових значень чисел, серед яких необхідно узяти перші 4, що не повторюються. У цьому прикладі це такі індекси: 21, 26, 22, 29.

  3. Для оцінки збереження у вибірці співвідношення об'єктів генеральної сукупності «жінки–чоловіки» заносимо такі вирази:

    • у комірку В31 =СЧЁТЕСЛИ(B$1:B$30;"<21")/30,

    • у комірку В32 =СЧЁТЕСЛИ(B$1:B$30;">20")/30,

    • у комірку С31 =СЧЁТЕСЛИ(C$1:C$30;"<21")/12,

    • у комірку С32 =СЧЁТЕСЛИ(C$1:C$30;">20")/12.

Отже, стратифікована (розшарована) вибірка обсягом n=12 із генеральної сукупності обсягом N=30 може включати такі об'єкти: 1, 4, 8, 10, 12, 15, 17, 18, 21, 22, 26, 29.

Головна обмеженість використання стратифікованої вибірки полягає в тому, що досить часто склад генеральної сукупності щодо основних підгруп або головних досліджуваних властивостей залишається невідомим. Проблема неповноти списку підгруп вирішується при формуванні так званої кластерної вибірки, яка передбачає вибір груп елементів (кластерів), а не окремих елементів.