Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ma_pi_mv03.doc
Скачиваний:
2
Добавлен:
16.08.2019
Размер:
5.2 Mб
Скачать

Завдання до самостійної роботи № 2.

1. Для масиву даних із Таблиці D2 додатку провести групування та заповнити таблицю “групування-частоти” (таблиця 2.1).

2. Користуючись таблицею 2.1 побудувати гістограму абсолютних частот.

3. Провести порівняння форми побудованої гістограми з можливими формами, наведеними на рис. 2.3.

Контрольні питання до роботи № 2.

  1. Що таке вибірка?

  2. що означає, що вибірка згрупована?

  3. як визначити кількість інтервалів групування та довжину інтервалу групуваня?

  4. Що називається гістограмою?

  5. Для чого будують гістограму?

  6. Які можливі форми гістограми зустрічаються при аналізі даних?

  7. Коли доцільно проводити розшарування даних?

Завдання №3.

СТАТИСТИЧНІ ОЦІНКИ ОСНОВНИХ ЧИСЛОВИХ ПАРАМЕТРІВ ВИПАДКОВОЇ ВЕЛИЧИНИ.

Мета роботи: Навчитися за вибіркою оцінювати основні числові характеристики розміщення, відхилення та форми розподілу.

Теоретичні відомості.

При дослідженні випадкових явищ часто виникає потреба охарактеризувати випадкову величину за допомогою декількох чисел. Зрозуміло, що найбільш цікавими є числа, які задають :

по-перше, центр, навколо якого розсіюється значення випадкової величини;

по-друге, на скільки в середньому відхиляється випадкова величина від центру розсіювання.

Так, наприклад, при вивченні міцності капронового шнура на розрив (зрозуміло, що шнур не буде однорідним і різні його ділянки будуть розриватися при різних зусиллях ) нас повинна цікавити не тільки величина середньої нагрузки до розриву, а і те, наскільки випадкова величина міцності шнура в середньому відхиляється від цього числа. Зрозуміло, що з двох різних шнурів, які мають однакові середні нагрузки до розриву (наприклад, 200 кг ) кожен віддасть перевагу тому, міцність якого в середньому менше відхиляється від числа 200 (уявіть собі, що для першого відповідне число 1 кг, а для другого – 100 кг, і шнури використовуєте для страхування альпіністів).

За центр випадкової величини ξ , який є характеристикою її розміщення , найчастіше приймають одне із наступних чисел:

а) математичне сподівання випадкової величини (Мξ);

б) медіану випадкової величини (med ξ);

в) моду випадкової величини (mоd ξ);

Н агадаємо, що математичне сподівання випадкової величини  це число М  , яке підраховується за однією із формул:

Для абсолютно неперервних випадкових величин, які мають щільність розподілу f(x) ;

д ля дискретних випадкових величин, які приймають значення xi з ймовірністью pi ( і = 1, 2, 3, … ).

Медіаною (med ) неперервної випадкової величини  ми будемо називати найменше з чисел х, для яких

Р (  < х ) = 0,5

Це означає, що число med  ділить числову вісь на інтервали, в які випадкова величина  попадає з однаковою ймовірністью, тобто

P (  < med  ) = P (  > med  ) = 0,5

Модою випадкової величини  ми будемо називати число mod , яке є

А) точкою максимуму щільності розподілу, якщо  абсолютно неперервна випадкова величина

Б) значення, яке випадкова величина  приймає з найбільшою імовірністю якщо випадкова величина дискретна.

Зрозуміло, що для випадкової величини  може бути декілька мод, а числа mod , M та med  не обов`язково рівні між собою. Але якщо числа співпадають, то будемо казати, що вибірка має симетричний розподіл.

Основними параметрами, які характеризують міру відхилення випадкової величини  від центру M, є дисперсія D та середнє квадратичне відхилення σ.

Нагадаємо, що

Одна з важливих задач математичної статистики полягає в знаходженні за вибіркою оптимальних оцінок статистичних характеристик розподілів ймовірностей.

В реальних експериментах основні числові параметри випадкової величини  невідомі. Нехай x1,x2,…,xn вибірка спостережень над випадковою величиною . Наша задача полягає в тому, щоб за результатами наших спостережень, тобто по вибірці x1,x2,…,xn , знайти числа, які б були наближеннями невідомих периметрів величини  .

Під статистичною оцінкою невідомого параметру Q ми будемо розуміти функцію від вибіркових значень Qn*=g(x1,x2,…,xn) ,яка дає наближене значення параметра Q, тобто Q g(x1,x2,…,xn) Це означає, що нам потрібно підібрати функцію g(x1, x2 , …, x_n) ,яку називають статистикою, значення якої на конкретній виборці давало б наближення невідомого параметру. Зрозуміло, що для кожного числового параметру треба підібрати свою функцію g() , більше того для оцінки одного й того самого параметру можна підібрати різні статистичні оцінки.

Оскільки до початку експериментів вибіркові значення невідомі і всі вони можуть вважатись випадковими величинами функцію Qn*=g(x1,x2,…,xn_)можна розглядати, як деяку випадкову величину.

Будемо вважати оцінку доброякісною, якщо вона задовольняє умовам:

  1. Qn* “в середньому” дорівнює Q, тобто MQn* = Q, (така оцінка називається незсуненною);

  2. Qn* прямує до Q при n → ∞ за ймовірністю (така оцінка називається обґрунтованою). Послідовність випадкових величин 1,2,...,n за імовірністю прямує до випадкової величини , якщо для будь-якого додатного числа  виконується рівність .

  3. Qn* має найменше розсіювання (min D(Qn*) серед лінійних незсуненних оцінок (така оцінка називається ефективною);

В математичній статистиці встановлено, що наведені далі оцінки будуть доброякісними. Надамо формули для обчислення статистичних оцінок основних числових параметрів випадкової величини , супроводжуючи їх розрахунками для вибірки (xi), об`єму 9

(xi ) = ( 4, 1, 7, 9, 5, 1, 3, 4, 2 )

Таблиці “значення частоти” та “групування частот” заданої вибірки мають вигляд (див. роб. №2)

Значення

1

2

3

4

5

7

9

Частоти

2

1

1

2

1

1

1

Таблиця 1.

Якщо fi-це абсолютна частота i-того інтервалу групування (тобто кількість вибіркових значень, що лежать у цьому інтервалі), то число

fi=

називається відносною частотою I- того інтервалу, де n-об’єм вибірки.

Кумулятивною (накопичувальною) частотою Fi I-того інтервалу [ai,,ai+1] називається сума всіх частот fk,k=1,2,…,I, тобто

Fi=f1+f2+…+ fn.

В залежності від того розглядається абсолютна чи відносна частота, можна говорити про кумулятивні абсолютні чи відносні частоти.

Таблиця 2.

Номер інтервалу

Ліва границя

Права границя

Середина ітервалу

Абсолютна частота

Кумулятивна відносна частота

i

ai

ai+1

fi

1

0,5

2,5

1,5

3

3/9=0,33

2

2,5

4,5

3,5

3

6/9=0,66

3

4,5

6,6

5,5

1

7/9=0,77

4

6,5

8,5

7,5

1

8/9=0,88

5

3,5

10,5

9,5

1

9/9=1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]