- •2.2 Програма роботи
- •2.3 Основні теоретичні положення
- •2.4 Порядок виконання в пакеті spss
- •2.4.1 Генерація вибірки
- •2.4.2 Побудова варіаційного ряду
- •2.4.3 Побудова графіка функції емпіричного розподілу
- •2.4.4 Побудова гістограми частот
- •2.4.5 Визначення вибіркових характеристик
- •2.4.6 Перевірка гіпотези про тип розподілу
- •2.4.7 Опис двовимірних вибірок
- •2.6 Контрольні запитання
2 ПРАКТИЧНЕ ЗАНЯТТЯ № 2.
ВИБІРКИ І ЇХНЄ ПРЕДСТАВЛЕННЯ
2.1 Мета роботи
Метою роботи є ознайомлення з вибірками і найбільш поширеними методами їх, обробки.
2.2 Програма роботи
Під час виконання роботи необхідно:
згенерувати вихідні вибірки;
побудувати варіаційний ряд;
побудувати графіки функцій емпіричних розподілів;
побудувати гістограми вихідних вибірок;
визначити основні вибіркові характеристики;
перевірити гіпотези про тип розподілу;
побудувати діаграму розсіювання та обчислити кореляційну матрицю двовимірної вибірки;
побудувати діаграму розсіювання трьохвимірної вибірки.
2.3 Основні теоретичні положення
Нагадаємо, що таке вибірка, варіаційний ряд, емпіричний розподіл, групування, гістограма, вибіркові характеристики й ін.
Вибіркою х1, ..., хn. обсягу n із сукупності, розподіленої по F(х), називається n незалежних спостережень над випадковою величиною із функцією розподілу F(x).
Варіаційним рядом х(1) х(2) ... х(n) називається вибірка, що записана в порядку зростання її елементів.
Кожному спостереженню з вибірки привласнимо ймовірність, рівну 1/n; одержимо розподіл, що називають емпіричним; йому відповідає функція емпіричного розподілу
=
,
де n(х) - число членів вибірки, менших х.
Важливість цієї функції для статистики визначається тим, що при n
F(x)
(теорема Гливенко).
Вибірки великих обсягів погано оглядаються, тому можна розбити діапазон значень вибірки на рівні інтервали і підрахувати для кожного інтервалу частоту - кількість спостережень, що потрапили в нього; частоти, віднесені до загального числа спостережень n, називають відносними частотами; графічне представлення розподілу частот по інтервалах гістограмою; накопиченою частотою для даного інтервалу називають суму частот даного інтервалу і всіх тих, що розташовані зліва від нього.
Числові характеристики емпіричного розподілу називаються вибірковими характеристиками: вибіркові середнє (математичне очікування), дисперсія:
=
, s2=
вибірковий момент порядку k:
mk
=
;
вибіркові квантілі p порядку р - корені рівняння
F(p)=p,
якими є члени варіаційного ряду
(p)=([np]+1) ,
де [nр] означає цілу частина nр; окремим випадком (p = 0.5) є вибіркова медіана - центральний член варіаційного ряду.
Важливість вибіркових характеристик полягає в тому, що при n вони прямують до справжніх значень розподілу F(х).
2.4 Порядок виконання в пакеті spss
2.4.1 Генерація вибірки
Завантажимо програму SPSS за допомогою ярлика на робочому столі або безпосередньо, заславши на виконання файл C:\Program Files\ SPSS\spsswin. Якщо розташування файлу невідомо, треба спочатку розшукати його за допомогою засобів WINDOWS ( Пуск – Найти – Файли й папки і таке інше). З’явиться вікно SPSS for Windows, у якому на питання What would you like to do (Що ви збираєтесь робити) слід відповісти Type in data (Формувати дані). Відмітимо, що під час підготовки до цього заняття треба відповісти: Run the tutorial (Запустити наставника).
Згенеруємо 2 вибірки із заданими законами розподілу, наприклад, вибірки обсягу n = 50 c нормальним законом розподілу із середнім 5 та стандартним відхиленням 1 і степеневим (експоненційним) законом із середнім 5.
Заготовимо таблицю з 2 стовпцями і n = 50 рядками:
після завантаження SPSS на екрані - таблиця Data Editor (Редактор даних) із порожніми клітками; прокрутимо її до 50-й рядка, виділимо клітку в 2-м стовпці і введемо будь-який символ, наприклад, крапку “.”- Enter. Таблиця 50 2 утворена.
Створимо відповідний файл на диску А:, вставивши в нього власну дискету:
File - New - Data - на питання save ...? відповідаємо - Yes ;
у вікні Save Data As: Папка: Мой компьютер – Диск 3,5 (А:) – Открыть, Имя файла: Pr2. sav, наприклад – ОК .
Привласнимо змінним зручні імена х1 і х2:
виділимо перший стовпець, двічі кликнувши мишею по його заголовку;
у віконці Define Variable...(визначення змінної) введемо Variable Name: x1 - OK.
Аналогічно - другий стовпець.
Згенеруємо вибірку з нормальним розподілом:
Transform (перетворення) - Compute (обчислити) - у поле Target Variable (цільова змінна - стовпець) уведемо ім'я : х1; у списку Functions виділимо NORMAL (stddev) (скорочене standart deviation - стандартне відхилення) і перенесемо в поле Numeric Expression (числовий вираз): NORMAL (1) + 5 – OK; Change...? - OK.
Згенеруємо в стовпчику х2 вибірку з показовим розподілом із середнім 5: дії аналогічні попередніми, але Numeric Expression:
- 5 LN (UNIFORM (1)),
оскільки випадкова величина - a ln,, де R [0, 1], має показниковий розподіл із середнім а; функція UNIFORM (x) генерує рівномірно на [0, x] розподілені випадкові числа.
Збережемо дані у створеному раніше файлі Pr2. sav. Подивимося вибірку графічно:
Graphs - Line - виберемо Simple (простий), у поле Data in Chart Are (дані для графіка) виберемо Values of individual cases (значення окремих спостережень) - Define - у вікні, що з'явилося, Define Simple Line із лівого списку перемістимо стрілкою x1 у поле Line Represent - OK.
Спостерігаємо графік; його можна відредагувати (перехід до редактора діаграм Chart Edit можна здійснити, якщо спочатку виділити діаграму, клацнувши на ній, а потім клацнути ще - подвійно).
Подивимося вибірку х2: дії аналогічні.
Збережемо графіки:
File - Save As - Name: Pr2 - ОК ; створюється файл Pr2.spo, у якому зберігаються результати роботи.
Збережені дані або графіки можна подивитися ще раз: File – Open. У віконці Open File : Папка: Диск 3.5(А:), Имя файла: Pr2, Тип файлов: SPSS(*.sav) або SPSS(*.sро) - OK.
