Статистичний ряд - Мазур
..pdfМІНІСТЕРСТВО ОСВІТИ І НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИ
ОДЕСЬКИЙ НАЦІОНАЛЬНИЙ МОРСЬКИЙ УНІВЕРСИТЕТ
Кафедра „Вища та прикладна математика”
СИСТЕМИ ЛІНІЙНИХ АЛГЕБРАЇЧНИХ РІВНЯНЬ
Методичні вказівки до практичних занять
Одеса – 2012
1
Методичні вказівки розроблені Семіренко Елеонорою Ігорівною –- старшим викладачем кафедри „Вища та прикладна математика” Одеського національного морського університету.
Методичні вказівки схвалено кафедрою „Вища та прикладна математика” ОНМУ 29.03.12 (протокол № 6).
Рецензент: ст. викл. каф. В та ПМ ОНМУ Мазур Н.А.
2
I. Вибірка. Статистичний ряд, полігон частот і гістограма. Функція розподілу.
Математична статистика досліджує висновки про випадкову величину, що вивчається, які можна зробити використовуючи дані випробувань.
Нехай вивчається випадкова величина з функцією розподілу F (x) (яка є невідомою). Набір значень 1, 2, , n випадкової величини ,
одержаних в результаті n випробувань, називається вибіркою об’єму n . Припускається, що випробування проводяться в однакових умовах і незалежно.
Тоді вибірку 1, 2, , n |
можна розглядати як сукупність |
n незалежних |
||||||||||||||
випадкових величин |
i (i 1,2, , n), кожна з яких розглядається також, як |
|||||||||||||||
випадкова величина |
, тобто P( i x) F(x), |
|
i 1,2, ,n. |
|||||||||||||
|
|
Говорять, що вибірка |
1, 2, , n взята з генеральної сукупності |
|||||||||||||
випадкової величини з теоретичною функцією розподілу |
F (x) . Якщо |
|||||||||||||||
вибірка об’єму n має r різних елементів (значень) |
x1, x2, , xr і елемент xi |
|||||||||||||||
зустрічається mi |
разів, то число mi називається частотою елемента xi , а |
|||||||||||||||
відношення w |
mi |
відносною частотою елемента x . |
|
|
|
|||||||||||
|
|
|
|
|
||||||||||||
|
|
|
i |
|
n |
|
|
|
|
|
i |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Очевидно |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
r |
|
|
|
|
r |
|
|
|
|
|
|
|
|
|
|
|
mi |
|
n і |
wi |
1. |
|
|
|
|
|
|
|||
|
|
|
i 1 |
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
Статистичним рядом називається послідовність пар |
|
|
|
|||||||||||
|
|
(xi ,mi ), i 1,2, ,r . Як правило статистичний ряд записують у |
||||||||||||||
|
|
вигляді таблиці, розташовуючи значення xi в порядку зростання. |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi |
|
x1 |
|
|
x2 |
|
x3 |
|
|
|
xr 1 |
|
xr |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
mi |
|
m1 |
|
|
m2 |
|
m3 |
|
|
mr 1 |
|
mr |
|
||
|
|
|
|
|
|
|
|
|
Полігон частот вибірки – це ламана з вершинами в точках (xi , mi ). Полігон частот є графічним зображенням статистичного ряду.
3
Емпіричною функцією розподілу називається функція Fn (x) kn , де
k – число вибіркових значень, менших за x ( тобто Fn (x) є відносною частотою події x ). Функція Fn (x) служить оцінкою невідомої
(теоретичної) функції розподілу Fn (x), тобто Fn (x) ~ F(x).
Наведений запис вибірки у вигляді статистичного ряду і його зображення полігоном частот є зручним, якщо випадкова величина , яка
досліджується є дискретною, а число r різних вибіркових значень не дуже велике. В протилежному випадку таблиця стає не наглядною (трудно обозримой) ??? і використовується інтервальний статистичний ряд. При цьому весь діапазон вибіркових значень розбивають на інтервали (зазвичай однакової ширини) і в першому рядку таблиці вказують ці інтервали, а в другому – відповідні їм частоти, тобто кількість відповідних значень, які попали в ці інтервали. Для подальшої обробки вибіркових даних виявляється зручно завбачити рядок, в якому записуються середні значення інтервалів. Тоді цей рядок буде в таблиці другим, а рядок частот – третім. Якщо позначити кінці
i – того інтервалу відповідно xni і xbi , а середнє значення цього інтервалу
xi , то таблиця, що зображає (представляє? ) інтервальний статистичний ряд, матиме вигляд (кількість інтервалів позначено r ):
|
xn |
; xb |
xn |
; xb |
xn |
; xb |
xn |
; xb |
|
xn |
; xb |
|
xn |
; xb |
|
|
i |
i |
1 |
1 |
2 |
2 |
3 |
3 |
|
r 1 |
r 1 |
|
r |
r |
|
|
xi |
|
x1 |
|
x2 |
|
x3 |
|
|
xr 1 |
|
|
xr |
|
|
|
mi |
|
m1 |
|
m2 |
|
m3 |
|
|
mr 1 |
|
|
mr |
|
|
|
Питання про вибір числа |
i ширини інтервалів вирішується в кожному |
|
||||||||||||
конкретному випадку, об’єм вибірки і т. д. |
Для ориєнтаційної оцінки числа |
|
|||||||||||||
інтервалів r |
для об’єму вибірки n використовується формула Стерджера |
|
r 1 3,32lg n
Якщо число інтервалів вибрано, то ширина кожного з них визначається за формулою
h |
xmax xmin |
, де |
h – ширина інтервала, |
|
r |
||||
|
|
|
4
xmax і xmin - найбільше і найменше вибіркові значення.
Знайдене значення h корегується (округляється) в бік збільшення і встановлюються границі інтервалів так, щоб одержати по можливості «зручні» значення границь і щоб всі вибіркові значення розташувались в межах цих інтервалів. Після цього записується (???????????????) інтервальний статистичний ряд.
Нехай – неперервна випадкова величина з невідомою щільністю
імовірності f (x). Тоді |
f (x) ~ |
mi |
(i 1,2, , r) є оцінкою щільності |
|
nh |
||||
ймовірності в точці xi |
( xi – середина i –того інтервалу, mi – |
частота, |
||
тобто кількість вибіркових значень, які попали в i – тий інтервал, |
h – |
|||
ширина інтервала, n – |
об’єм вибірки). Побудуємо в прямокутній системі |
координат прямокутники, основами яких є відрізки
5