Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Statistika_Husak_VL_DG_2015_16_06_2015.doc
Скачиваний:
5
Добавлен:
01.07.2025
Размер:
2.9 Mб
Скачать

Розділ 1. Сукупність, вибірка і типи даних

1.1. Генеральні та вибіркові сукупності

В більшості випадків питання статистичної обробки даних виникає тоді, коли дослідникові необхідно чисельно охарактеризувати явище. Так, одноразове визначення активності алкогольдегідрогенази у культурі пекарських дріжджів мало про що не свідчить. Ця активність залежить від дуже багатьох чинників. Тому повторне визначення активності для цієї самої культури або культури дріжджів, вирощених у подібних умовах, буде відрізнятися. Іншими словами, активність алкогольдегідрогенази у дріжджів буде варіювати. Для оцінки цієї варіації потрібно провести бодай декілька незалежних визначень, або повторів. Середнє значення активності, обраховане на основі значень повторів, а також показники варіації вже є інформативнішими. Набір значень, який ми отримали в результаті незалежних вимірювань вважатиметься вибіркою, а окремі значення варіантами. Власне цей набір даних може бути підданий надалі статистичній обробці. Проте вибірка – це не тільки значення, отримані в кількох незалежних вимірюваннях. Частіше під вибіркою розуміють також набір значень, отриманих після вимірювань, зроблених для групи об’єктів, наприклад, для кількох культур дріжджів у нашому випадку. Такою групою можуть бути листки або насіння різних дерев, пацієнти з різними синдромами, риби одного виду і т.д.

Будь-яка група, незалежно від її розміру, в статистиці називається сукупністю. Об’єкти, які входять у сукупність, мають певні ознаки, які відрізняють їх від інших об’єктів. Розрізняють генеральні та вибіркові сукупності. Генеральною сукупністю є всі об’єкти, які відносяться до категорії, що цікавить дослідника. Наприклад, всі мухи виду Drosophila melanogaster, всі листки дуба, всі дафнії Івано-Франківської області і т.д. В окремих випадках є можливість вивчити всю генеральну сукупність (наприклад, коли вивчаємо зріст всіх студентів одного курсу, або вміст гемоглобіну для всіх в місті хворих на певну рідкісну хворобу). Проте, дослідник не може вивчити повністю великі генеральні сукупності. Уявлення про генеральну сукупність можна скласти за її частиною – вибірковою сукупністю. Вибіркова сукупність, або вибірка – це частина сукупності, відібрана за певними правилами для дослідження з генеральної сукупоності.

Для того, щоб за вибіркою скласти правильне уявлення про генеральну сукупність, вона має бути репрезентативною. Єдиний принцип, який береться в основу відбору об’єктів у вибірку – принцип випадковості. Для реалізації цього принципу, дослідник створює такі умови відбору, щоб у кожного представника генеральної сукупності була однакова ймовірність потрапити у вибірку.

Вибірки, задіяні в експерименті, можуть бути незалежними та залежними. В незалежних вибірках об’єкти ніяк не пов’язані один з одним. Якщо кожному об’єктові однієї вибірки відповідає об’єкт з іншої вибірки, то такі вибірки є залежними.

1.2. Уявлення про малу вибірку

Одне з основних питань математичної статистики: якою повинна бути мінімальна необхідна кількість інформації для отримання достатньої статистично коректної достовірності результату?

За Р. Фішером мінімальне число зразків не може бути менше 4. В іншому випадку, неминуче виникає систематична помилка (систематична помилка, або зсув (bias) – це систематичне (невипадкове, однонаправлене) відхилення результатів від дійсних значень). Розрізняють декілька основних типів цих помилок. Зсув, зумовлений відбором, виникає, коли порівнювані групи розрізняються не лише за ознакою, яка вивчається, але й за іншими чинниками, що впливають на результат. Зсув, зумовлений виміром, виникає тоді, коли в порівнюваних групах використовуються різні методи виміру. Зсув, зумовлений чинниками, які втручаються, виникає, коли один чинник пов'язаний з іншим і ефект одного спотворює ефект іншого.

Дослідники на практиці найчастіше мають справу з малою вибіркою, коли кількість варіант є меншою за 30 (4 ≤ n ≤ 30). Розробка теорії малої вибірки належить англійському статистикові У.С. Госсету, який у 1908 році опублікував свою працю «Біометрика» під псевдонімом «Стьюдент». Дослідження, які стосуються малих вибірок, пов'язані також з іменами А.М. Колмогорова, Дж. Ноймана і А. Вальда. Так, А.М. Колмогоров запропонував критерій достатності статистики при обмеженому числі спостережень. Дж. Нойман створив новий напрямок у математичній статистиці, основне положення якого говорить: "Завдання статистики – виявляти загальний характер поведінки об'єкту в умовах невизначеності". А. Вальд розробив розділ статистики, який називається послідовним аналізом. За ним, необхідний обсяг вибірки, визначається в процесі самих випробувань. Ідеї Колмогорова, Ноймана і Вальда в частині малих вибірок розвинені у багатьох роботах, бібліографію яких можна знайти у фундаментальних працях із математичної статистики.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]