- •Основні поняття математичної статистики
- •Побудова полігонів, гістограм за вибіркою з генеральної сукупності.
- •Побудова кумулятативної кривої. Знаходження числових характеристик вибірки
- •Статистична функція розподілу частот. Кумулятативна крива.
- •2.Числові характеристики вибірки (для дискретної ознаки).
- •Хід роботи
- •Хід роботи
- •Знаходження точкових та інтервальних оцінок параметрів генеральної сукупності за вибіркою (неперервна ознака). Побудова статистичної кривої розподілу.
- •Числові характеристики вибірки (для неперервної ознаки) .
- •Статистичне оцінювання параметрів розподілу (оцінка параметрів генеральної сукупності за вибіркою)
- •Статистичні методи вивчення залежностей між випадковими величинами.
- •Знаходження параметрів вибіркового рівняння прямої лінії регресії.
- •Знаходження статистичного (вибіркового) коефіцієнта кореляції.
- •Статистична перевірка гіпотез
- •1. Статистичні гіпотези та їх різновиди.
- •Приклади статистичних гіпотез
- •2. Похибки перевірки гіпотез.
- •3. Критерії узгодження для перевірки гіпотез.
- •Якщо критичні точки симетричні відносно нуля, то маємо
- •4. Перевірка гіпотези про нормальний закон розподілу. Критерій Пірсона.
- •Хід виконання завдання
- •Звіт до лабораторної роботи (зразок оформлення)
Побудова кумулятативної кривої. Знаходження числових характеристик вибірки
Мета: навчитися знаходити статистичні (емпіричні) функції розподілу частот для дискретних і неперервних ознак, будувати кумулятативні криві; обчислювати числові характеристики дискретної ознаки.
Статистична функція розподілу частот. Кумулятативна крива.
Статистичною(емпіричною)
функцією розподілу
називається
функція
,
яка для кожного значення
визначає
відносну частоту появи події (ознаки)
,
тобто
,
де
–
обсяг у вибірки, а
–
накопичені частоти варіант, які менші
заданої варіанти
.
а)
Нехай для дискретної кількісної ознаки
задана частотна таблиця:
|
|
|
|
... |
|
|
|
|
|
|
... |
|
|
(1)
Згідно
з означенням функції
для дискретної ознаки
маємо
.
Отже, функцію можна записати так:
Графік цієї функції має вигляд:
1
0 х1 х2 х3 хк-1 хк хі
Тут точки розриву графіка функції – варіанти ознаки, а величини стрибків в кожній точці розриву – це відносні частоти варіант.
б) Нехай для неперервної кількісної ознаки задається інтервальна частотна таблиця:
|
|
|
|
|
|
|
|
|
|
В
цьому випадку значення функції
обчислюється в кінцях часткових
інтервалів таким чином:
Побудувавши
на площині точки (
),
і
сполучивши їх ламаною лінією, дістанемо
графік функції
який називається кумулятативною
кривою:
1
0 х1 х2 х3 хк хк+1 хі
2.Числові характеристики вибірки (для дискретної ознаки).
Нехай вибірка для дискретної ознаки задана частотною таблицею (1). Не завжди буває можливим одержати чітке уявлення про ознаку за допомогою великої кількості різних чисел. В цьому випадку виникає потреба користуватися різними середніми величинами (середньою арифметичною, середньою геометричною, середньою гармонійною, середньою кубічною, середньою квадратичною).
За допомогою середніх величин велику кількість чисел можна охарактеризувати одним числом ,не зважаючи на те ,що середня величина абстрактна і може не збігатися з жодним окремим значенням ознаки. Але саме в цій абстракції, у здатності не брати до уваги окремі випадкові значення і відхилення, полягає цінність середніх, як узагальнюючих числових характеристик.
Середня величина відображає те загальне, типове для маси явищ, яке реально існує у реальному світі.
За допомогою середніх можна здійснювати порівняльний аналіз декількох статистичних сукупностей, давати характеристику закономірностям розвитку явищ і процесів.
Самою відомою і широко використовуваною на практиці є середня арифметична (статистична середня або вибіркова середня), що обчислюється за формулою (для згрупованих даних):
(2)
або
(3)
Якщо
=1,
,
то формула (2) матиме вигляд
(4).
Формула (4) може використовуватись і для незгрупованих даних.
Найпростішою числовою характеристикою є мода.
Модою
називається те значення вибірки
(варіанта), яке найчастіше зустрічається
у статистичній сукупності, тобто частота
якого найбільша (позначається
). Отже,
.
У випадку, коли всі значення сукупності зустрічаються однаково часто, моди немає. Можуть бути і такі статистичні сукупності,які мають декілька мод(полімодальні сукупності).
Медіаною
називається таке значення, яке ділить
варіаційний ряд навпіл, так, що варіанти
однієї половини є меншими медіани, а
варіанти другої половини – більшими
медіани (позначається
),тобто
Зауваження.
Числа
,
та
-
це середні значення вибірки , які є і
середніми значеннями дискретної ознаки
.
Середня арифметична, мода і медіана співпадають тільки тоді, коли статистичний розподіл унімодальний (з одним максимумом) і симетричний. Чим більше розподіл відрізняється від симетричного, тим більша різниця між цими числовими характеристиками. Для тих випадків, коли статистичний розподіл сильно асиметричний, середня арифметична втрачає свою практичну цінність, оскільки переважна більшість значень варіанти знаходяться ближче або далі від середньої арифметичної. У цьому випадку медіана є характеристикою центра розподілу.
Для вимірювання розсіювання(коливань) ознаки застосовують такі характеристики: варіаційний розмах, статистична дисперсія, статистичне середнє квадратичне відхилення, коефіцієнт варіації.
Варіаційним розмахом (або шириною розподілу) називається різниця між найбільшою і найменшою варіантом, іншими словами, це довжина відрізка на числовій прямій, в середині якого змінюються варіанти (позначаєть- ся R).
Можна навести багато прикладів розподілів, які різні за будовою, але мають однаковий варіаційний розмах. Цю числову характеристику використовують при статистичному вивченні якості продукції із-за простоти її обчислення.
При обчисленні варіаційного розмаху, так само, як і при обчисленні моди чи медіани, не враховується кожне окреме значення. Тому найчастіше для оцінки міри розсіювання ознаки в теорії та на практиці застосовують інші числові характеристики (дисперсію і середнє квадратичне відхилення).
Статистичною
(вибірковою) дисперсією називається
середнє арифметичне квадратів відхилень
значень вибірки (варіант) від статистичного
середнього
і позначається
.
Отже, за означенням
(5)
або
(6).
На практиці зручною для обчислень є така формула:
(7)
, тобто
.
Це пояснюється тим, що дуже часто обчислюється наближено, що приводить до нагромадження помилок заокруглень при обчисленні за формулою (5). Небезпека значних помилок заокруглень зростає із збільшенням обсягу вибірки.
Оскільки має одиниці вимірювання ознаки , то розглядають ще одну числову характеристику.
Середнім квадратичним відхиленням (або статистичною похибкою) називається корінь квадратичний з статистичної дисперсії.
На
практиці, коли обсяг вибірки n
< 30,
використовують виправлену статистичну
дисперсію
та виправлене середнє квадратичне
відхилення :
і
Формули для обчислення мають вигляд:
а) для згрупованих даних
(8)
або
(9)
б) для незгрупованих даних
,
.
Необхідність таких змін пов’язана з властивостями точкових оцінок для параметрів теоретичного розподілу (див.лаб.роб.3).
Для кількісної оцінки ступеня відхилення експериментальної кривої розподілу від теоретичної кривої розподілу використовують асиметрію і ексцес, що обчислюється за формулами:
Якщо
розподіл симетричний, то
.
Якщо
,то
вершина експериментальної кривої
зміщена вліво якщо
,
то відповідно – вправо.
Якщо
,
то вершина експериментальної кривої
піднята (крива крута), якщо
,
то вершина такої кривої опущена (крива
полога).
При порівнянні між собою ступенів варіації ознак, виражених у різних одиницях вимірювання, виникають певні труднощі. Для того щоб відповісти на запитання яка з ознак варіює сильніше тільки на основі порівняння стандартних відхилень неможливо. Потрібно співставити стандартне відхилення з середньою арифметичною цих ознак. Для цього вводиться коефіцієнт варіації, який визначається за формулою:
Цей
коефіцієнт є відносною мірою розсіювання
ознаки. Він використовується і як
показник однорідності вибіркових
спостережень. Вважається, що якщо
,
то
вибірку можна вважати однорідною, тобто
отриманою з однієї генеральної сукупності.
На практиці
використовують для порівняння вибірок
з однотипних генеральних сукупностей.
Завдання. Знайти статистичні функції розподілу для дискретної ознаки (розмір взуття учня) і неперервної ознаки (зріст учня), використавши частотні таблиці цих ознак, одержані в лаб.роб.№1 (див. крок 3 табл.4 та крок 5 табл.5). Побудувати графіки цих функцій (кумулятативні криві).
