Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Щетініна О.К., павліченко А.А. Формування експе....doc
Скачиваний:
31
Добавлен:
10.11.2018
Размер:
3.89 Mб
Скачать

1. Апроксимація закону розподілу одномірних експериментальних даних

1.1. Задачі апроксимації

Конкретний зміст обробки одномірних ЕД, що представляють собою результат впливу на досліджуваний показник одного фактора, залежить від поставлених цілей дослідження. У найпростішому випадку досить визначити перший момент розподілу (наприклад, середній час обробки запитів). В інших випадках потрібно встановити ймовірнісно-часові характеристики розподілу (наприклад, оцінити ймовірність своєчасної обробки запитів або ймовірність безвідмовної роботи системи протягом заданого періоду часу). Для знаходження таких значень потрібне знання закону розподілу як найбільш повної характеристики відповідної випадкової величини.

У класичній математичній статистиці передбачається відомим вид закону розподілу та провадиться оцінка значень його параметрів за результатами спостережень. Але звичайно заздалегідь вид закону розподілу є невідомим, а теоретичні припущення не дозволяють його однозначно встановити. У будь-якому статистичному розподілі присутні елементи випадковості, і, як наслідок, експериментальні точки звичайно коливаються від спостереження до спостереження близько від невідомої кривої дійсного розподілу. Обробка ЕД також не дозволить точно обчислити дійсний закон розподілу показника. У такому випадку варто казати тільки про апроксимацію реального закону деяким іншим, котрий не суперечить ЕД і в якомусь смислі схожий на цей невідомий дійсний закон.

Відповідно до цих положень постановка задачі апроксимації закону розподілу ЕД формулюється таким чином. Є вибірка спостережень за випадковою величиною . Обсяг вибірки фіксований. Необхідно підібрати закон розподілу (вид і параметри), який би в статистичному смислі відповідав наявним спостереженням.

При цьому слід враховувати наступні обмеження:

  • вибірка є представницькою;

  • її обсяг є достатнім для оцінки параметрів і перевірки узгодженості обраного закону розподілу і ЕД;

  • щільність розподілу є унімодальною.

Розв'язання поставленої задачі апроксимації здійснюється на основі застосування "типових" розподілів, спеціальних рядів або сімейств універсальних розподілів.

Нагадаємо, що узагальненими характеристиками випадкового процесу або явища є величини:

  • середнє ,

  • дисперсія ,

  • середнє квадратичне відхилення .

Головне призначення середніх величин (оцінок початкових моментів і в першу чергу першого моменту розподілу) складається в їхній узагальнюючій функції. Це узагальнення дозволяє замінити множину різних індивідуальних значень показника середньою величиною, що характеризує всю однорідну сукупність. Інакше кажучи, середня величина є типовою характеристикою варіанти в конкретній вибірці.

Ще більш інформативним є обчислення геометрії розподілу спостережуваної ознаки. Воно необхідно для того, щоб уявити собі більш точно характер розподілу. Відомо, що за значенням статистичного моменту можна приблизно судити про геометричний вид розподілу.

Перший момент (або середнє арифметичне) обчислюють за формулою

. (1)

Якщо , то називають початковим моментом, якщо , то – центральний момент.

Перший момент (1) указує на центр тяжіння в геометрії розподілу (див. рис.1).

Рис.1. Характерне положення першого моменту

на графіку розподілу статистичної величини

Другий момент (дисперсія)

(2)

характеризує величину розсіяння експериментальних даних навколо центра тяжіння (див. рис.2).

Рис.2. Характерна зміна виду розподілу

залежно від величини другого моменту

Середнє квадратичне відхилення зв'язане із другим моментом (2) формулою .

Третій момент (скошеність)

(3)

характеризує асиметрію. Визначаючи знак , можна з'ясувати, чи є асиметрія розподілу, і, якщо є , то в який бік (див. рис.3).

На практиці прийнято використовувати не сам третій момент (3), а його нормовану величину .

Рис.3. Характерна зміна виду розподілу

залежно від величини третього моменту

Четвертий момент (див. рис.4) характеризує ексцес (гостровершинність) і обчислюється за формулою

. (4)

Нормований момент визначають на основі відношення (4) .

Рис.4. Характерна зміна виду розподілу

залежно від величини четвертого моменту

Більшою інформативністю, у порівнянні зі статистичними характеристиками, для дослідника має закон розподілу ймовірності ознаки. Представимо, що випадкова величина приймає значення з деякого діапазону. Наприклад, – діаметр деталі, що виточується. Діаметр може відхилятися від запланованого ідеального значення під впливом різних факторів, які не можна врахувати, тому він є випадковою величиною. Але в результаті тривалого спостереження за деталями, що випускаються, можна відзначити, скільки деталей з 1000 мали діаметр (позначимо ), скільки деталей мали діаметр (позначимо ) і так далі. Можна побудувати гістограму частостей діаметрів, відкладаючи для величину , для величину і т.д. (Якщо бути точним, – це число деталей, діаметр яких не просто дорівнює , а знаходиться в діапазоні від до , де ). Важливо, що сума всіх частостей буде дорівнює 1 (сумарна площа гістограми незмінна). Якщо змінюється неперервно, досвідів проведено досить багато, то при гістограма перетворюється в графік розподілу ймовірності випадкової неперервної величини. На рис. 5 показані варіанти гістограм дискретного (рис. 5.а) і неперервного (рис. 5.б) розподілів ознаки.

а) б)

Рис. 5. Дискретний і неперервний закони розподілу ознаки

У нашому прикладі закон розподілу ймовірності ознаки показує наскільки ймовірно те або інше значення діаметра деталей, що випускаються.

Задача апроксимації на основі типових розподілів розв'язується ітераційно і включає виконання трьох основних кроків:

  • попередній вибір виду закону розподілу;

  • визначення оцінок параметрів закону розподілу;

  • оцінка узгодженості закону розподілу і ЕД.

Якщо заданий рівень узгодженості досягнуто, то задача вважається розв'язаною, а, якщо ні, то кроки повторюються знову, починаючи з першого, на якому вибирають інший вид закону, або починаючи із другого – шляхом деякого уточнення параметрів розподілу.

Вибір відповідного закону розподілу для випадкових величин у загальному виді є досить складною проблемою. Якщо виходити з ЕД, то іноді можливо підібрати кілька законів, які будуть більш-менш точно відображати даний розподіл. На практиці вибір виду закону розподілу здійснюється за допомогою аналізу гістограми розподілу, оцінок коефіцієнтів асиметрії та ексцесу. По ступені "подібності" гістограми і графіків щільності розподілу типових законів або по "близькості" значень оцінок коефіцієнтів і діапазонів їхніх теоретичних значень вибираються розподіли–кандидати для наступної оцінки параметрів.

При обробці ЕД вирішують питання про те, як підібрати для вихідного статистичного ряду теоретичну криву розподілу, що виражала б лише істотні риси ЕД, але не випадковості, обумовлені недостатнім об'ємом вибірки ЕД. Під побудовою теоретичної кривої розподілу розуміють таку обробку статистичних даних, коли забезпечується підбор найбільш відповідного теоретичного закону розподілу, що може бути заданий або функцією розподілу , або щільністю розподілу .