big_doc_LKG
.pdf
|
Формування вихідної інформації для аналізу і дослідження систем |
21 |
||||||
|
|
|
|
|
|
Таблиця 1.1 |
||
|
|
Статистичні дані про обсяги поставок металопрокату |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
№ |
Обсяг |
№ |
Обсяг |
№ |
Обсяг |
|
|
|
поставки |
поставки |
поставки |
|
|
|||
|
поставки |
поставки |
поставки |
|
|
|||
|
, т. |
, т. |
, т. |
|
|
|||
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
11,46 |
19 |
4,76 |
37 |
12,60 |
|
|
|
2 |
6,12 |
20 |
10,58 |
38 |
2,83 |
|
|
|
3 |
24,60 |
21 |
8,71 |
39 |
2,38 |
|
|
|
4 |
3,01 |
22 |
2,65 |
40 |
21,64 |
|
|
|
5 |
5,30 |
23 |
11,49 |
41 |
15,58 |
|
|
|
6 |
10,05 |
24 |
1,60 |
42 |
15,08 |
|
|
|
7 |
1,80 |
25 |
4,88 |
43 |
1,38 |
|
|
|
8 |
16,60 |
26 |
15,35 |
44 |
1,72 |
|
|
|
9 |
0,30 |
27 |
0,06 |
45 |
13,46 |
|
|
|
10 |
4,35 |
28 |
2,76 |
46 |
9,55 |
|
|
|
11 |
10,47 |
29 |
1,42 |
47 |
4,12 |
|
|
|
12 |
0,22 |
30 |
2,20 |
48 |
15,25 |
|
|
|
13 |
16,20 |
31 |
0,50 |
49 |
8,62 |
|
|
|
14 |
0,85 |
32 |
2,00 |
50 |
3,65 |
|
|
|
15 |
2,70 |
33 |
13,60 |
51 |
4,16 |
|
|
|
16 |
6,45 |
34 |
4,26 |
52 |
18,6 |
|
|
|
17 |
2,49 |
35 |
18,00 |
53 |
17,35 |
|
|
|
18 |
3,32 |
36 |
0,34 |
54 |
0,64 |
|
|
Розв’язок.
1. Визначаємо мінімальну кількість інтервалів за формулою (1.16)
.
2. Обчислюємо інтервал групування за формулою (1.17)
.
3. Подальші розрахунки виконуємо у табл. 1.2. За даними табл. 1.2 визначаємо:
– середнє вибіркове |
; |
– вибіркову дисперсію |
. |
22 |
Розділ 1 |
Таблиця 1.2
Розрахунок характеристик статистичного розподілу
Інтервали |
Середина |
Абсолютна |
Відносна |
|
|
|
|
випадкової |
частота |
|
|
|
|
||
інтервалу |
частота |
|
|
|
|
||
величини |
|
|
(частість) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,06–3,5 |
1,78 |
22 |
0,407 |
0,72 |
–5,72 |
32,72 |
13,32 |
3,5–7,0 |
5,25 |
10 |
0,185 |
0,97 |
–2,25 |
5,06 |
0,94 |
7,0–10,5 |
8,75 |
5 |
0,093 |
0,81 |
1,25 |
1,56 |
0,15 |
10,5–13,5 |
12,25 |
5 |
0,093 |
1,14 |
4,75 |
22,56 |
2,10 |
13,5–17,0 |
15,25 |
7 |
0,130 |
1,98 |
7,75 |
60,06 |
7,81 |
17,0–20,5 |
18,75 |
3 |
0,056 |
1,05 |
11,25 |
126,56 |
7,09 |
20,5–24,6 |
22,25 |
2 |
0,037 |
0,82 |
14,75 |
217,56 |
8,05 |
|
|
|
|
|
|
|
|
|
|
54 |
1,00 |
7,50 |
|
|
39,44 |
Вибіркове стандартне відхилення дорівнює , а коефіцієнт варіації (1.10) .
1.2.3. Розрахунок характеристик вибірки на ПЕОМ. Обчислення ви-
конується у модулі BASIC STATISTICS/TABLES – ОСНОВНІ СТАТИСТИКИ/
ТАБЛИЦІ інтерфейсу STATISTICA у інтерактивному режимі.
Для обчислення описових статистик необхідно виконати такі дії:
1)відкрити файл даних у модулі BASIC STATISTICS/TABLES;
2)викликати діалогове вікно процедур модуля за допомогою пункту головного меню ANALYSIS/RESUME ANALYSIS – АНАЛІЗ/ПРОДОВЖИТИ АНАЛІЗ чи за допомогою комбінації клавіш CTRL+R. На екрані відкри-
ється діалогове вікно вибору статистичної процедури (рис. 1.1);
Рис. 1.1. Вікно вибору статистичної процедури
Формування вихідної інформації для аналізу і дослідження систем |
23 |
3) активізувати рядок DESCRIPTIVE STATISTICS – ОПИСОВІ СТАТИСТИКИ та натиснути кнопку ОК (можна також двічі натиснути на цьому рядку кнопку миші). На екрані з’являється діалогове вікно
DESCRIPTIVE STATISTICS (рис. 1.2);
Рис. 1.2. Вікно описових статистик
4) у цьому діалоговому вікні, натиснувши на кнопку , ви-
кликати діалогове вікно SELECT THE VARIABLES FOR THE ANALYSIS –
ВИБІР ЗМІННОЇ ДЛЯ АНАЛІЗУ (рис. 1.3).
Рис. 1.3. Вибір змінних для аналізу
24 |
Розділ 1 |
Змінну для аналізу можна вибрати декількома способами:
а) перелічити їх номери через пробіл у полі SELECT VARIABLES (для вибору діапазону змінних слід використовувати тире) чи вибирати змінні зі списку за допомогою миші (одне натиснення) утримуючи на клавіатурі натисненою клавішу CTRL. Діапазон змінних можна вибрати, утримуючи на клавіатурі натисненою клавішу SHIFT;
б) натиснувши кнопку можна вибрати всі змінні зі списку;
5) натиснувши на кнопку активізувати діалогове вікно STATISTICS – СТАТИСТИКИ (рис. 1.4). У цьому вікні встановити прапорці-перемикачі навпроти тих статистик, які необхідно обчислити. Кнопка вибирає стандартний напе-
ред визначений набір описових статистик, кнопка вибирає для обчислення всі можливі статистики. Відповідність назв описових статистик англійською та українською мовами наведені у табл. 1.3;
6) натиснути кнопку (детальні описові статистики) для запуску процедури обчислення обраних описових статистик. Результат розрахунку виводиться у електронну таблицю, зовнішній вигляд якої показаний на рис. 1.5. У першому стовпчику таблиці зазначені всі обрані для аналізу змінні, а подальші стовпчики відповідають обраним описовим статистикам.
Рис. 1.5. Результати обчислення описових статистик
|
Формування вихідної інформації для аналізу і дослідження систем |
25 |
||
|
|
Таблиця 1.3 |
||
|
Відповідність назв описових статистик |
|
|
|
|
|
|
|
|
|
Назва описової статистики мовами |
|
|
|
|
англійською |
українською |
|
|
|
|
|
|
|
|
VALID N |
Об’єм вибірки |
|
|
|
MEAN |
Вибіркове середнє (математичне очіку- |
||
|
вання) |
|
|
|
|
|
|
|
|
|
SUM |
Сума значень |
|
|
|
MEDIAN |
Медіана |
|
|
|
STANDARD DEVIATION |
Стандартне відхилення |
|
|
|
VARIANCE |
Дисперсія |
|
|
|
STANDARD ERROR OF MEAN |
Стандартна похибка середнього |
|
|
|
95% CONF. LIMITS OF MEAN |
95% довірчий інтервал для середнього |
|
|
|
MINIMUM & MAXIMUM |
Максимум та мінімум |
|
|
|
LOWER & UPPER QUARTILES |
Нижня та верхня та квантиль |
|
|
|
RANGE |
Розмах |
|
|
|
QUARTILE RANGE |
Розмах квантилі |
|
|
|
SKEWNESS |
Асиметрія |
|
|
|
KURTOSIS |
Ексцес |
|
|
1.3.Перевірка гіпотези нормальності розподілу
Впрактичних задачах опрацьовування експериментальних даних найбільш поширеним є нормальний закон розподілу ймовірностей. Більшість прикладних методів математичної статистики виходять із припущення нормальності розподілу ймовірностей досліджуваних випадкових величин. Тому перевірка нормальності розподілу є основним етапом попереднього опрацювання результатів спостережень. Перевірка здійснюється за допомогою спеціально розроблених критеріїв згоди емпіричних розподілів з нормальним.
Для практичного використання при дослідженні транспортних процесів і систем в залежності від обсягу статистичних даних можна рекомендувати критерії перевірки нормальності розподілу випадкової величини, що наведені у табл. 1.4.
26 |
Розділ 1 |
Таблиця 1.4
Критерії нормальності розподілу
|
Назва критерію |
Обсяг вибірки |
|
|
|
1. Модифіковані загальні |
|
|
критерії згоди |
|
|
1.1. |
Критерій |
|
1.2. |
Колмогорова-Смірнова |
|
1.3. |
Критерій |
|
1.4 |
Фроціні |
|
2. Спеціальні критерії
2.1. Шапіро-Уілка 2.2. Середнього абсолютного
відхилення 2.3. Розмаху варіювання 2.4. -критерій 2.5. Саркаді
3.Для сукупності незалежних вибірок невеликого обсягу
3.1. Шапіро-Уілка 3.2. Саркаді 3.3. Смірнова
1.3.1. Модифіковані загальні критерії згоди
1.3.1.1. Критерій . Після оцінки статистичних характеристик розподілу сукупність вибіркових даних розбивається на рівноімовірнісних інтервалів () і статистика критерію розраховується за формулою
, |
(1.19) |
де – обсяг вибірки;
– спостережувана частота попадання випадкової величини до -го інтервалу.
|
|
Формування вихідної інформації для аналізу і дослідження систем |
27 |
|
||||||||
|
Межі інтервалу визначаються за формулою |
( |
|
), |
|
|||||||
де |
|
|
та |
|
|
|
. Значення коефіцієнтів |
|||||
наведені у табл. 1.4. |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
Таблиця 1.4 |
|||
|
|
|
Значення коефіцієнтів |
модифікованого |
|
|
||||||
|
|
|
|
-критерію нормальності для |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
–0,4307 |
|
|
|
|
|
|
|
|
|
|
4 |
–0,6745 |
|
0 |
|
|
|
|
|
|
|
|
|
5 |
–0,8416 |
–0,2533 |
|
|
|
|
|
|
|
|
||
6 |
–0,9674 |
–0,4307 |
0 |
|
|
|
|
|
|
|
||
7 |
–1,0676 |
–0,5659 |
–0,1800 |
|
|
|
|
|
|
|
||
8 |
–1,1503 |
–0,6745 |
–0,3186 |
|
0 |
|
|
|
|
|
||
9 |
–1,2206 |
–0,7647 |
–0,4307 |
–0,1397 |
|
|
|
|
|
|||
10 |
–1,2816 |
–0,8416 |
–0,5244 |
–0,2533 |
0 |
|
|
|
|
|||
11 |
–1,3352 |
–0,9085 |
–0,6046 |
–0,3488 |
–0,1142 |
|
|
|
|
|||
12 |
–1,3830 |
–0,9674 |
–0,6745 |
–0,4307 |
–0,2194 |
0 |
|
|
|
|||
13 |
–1,4261 |
–1,0201 |
–0,7363 |
–0,5024 |
–0,2934 |
–0,0966 |
|
|
|
|||
14 |
–1,4652 |
–1,0676 |
–0,7916 |
–0,5660 |
–0,3661 |
–0,1800 |
|
0 |
|
|||
15 |
–1,5011 |
–1,1108 |
–0,8416 |
–0,6229 |
–0,4307 |
–0,2533 |
–0,0837 |
Слід зауважити, що і . Так як значення є симетричними відносно нуля, то відсутні значення можна знайти зі співвідношень:
для непарних ;
для парних .
Отримана статистика порівнюється з критичним значенням статистики критерію на прийнятому рівні значимості (табл.. 1.5).
28 |
Розділ 1 |
|
|
|
|
|
Таблиця 1.5 |
|
|
Критичні значення |
при |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
3,248 |
8 |
11,543 |
13 |
|
19,589 |
4 |
5,107 |
9 |
13,007 |
14 |
|
19,937 |
5 |
6,844 |
10 |
14,438 |
15 |
|
21,270 |
6 |
8,479 |
11 |
15,843 |
|
|
|
7 |
10,038 |
12 |
17,226 |
|
|
|
Якщо , то гіпотеза про нормальність розподілу випадкової величини відхиляється.
Приклад 2. За даними прикладу 1 перевірити гіпотезу нормальності розподілу на рівні значимості .
Розв’язок. |
|
|
|
|
Для наших умов маємо: |
|
|
; |
. |
Приймаємо інтервалів і у табл. 1.4 знаходимо коефіцієнти розподілу |
||||
; |
; |
; |
; |
. |
Визначаємо межі інтервалів і складові формули (1.12). Результати розрахунків наведені у наступній таблиці. Обчислюємо за формулою (1.12) статистику критерію
|
Межі |
|
|
|
. |
|
інтервалів |
|
|
|
|
|
|
|
З табл. 1.5 для |
знаходимо крити- |
|
1 |
|
7 |
49 |
||
2 |
|
20 |
400 |
чне значення |
. Так як |
3 |
|
5 |
25 |
|
|
4 |
|
4 |
16 |
|
, |
5 |
|
7 |
49 |
|
|
|
|
|
|||
6 |
|
11 |
121 |
то гіпотезу про нормальність розподілу ви- |
|
|
|
|
|
||
|
|
54 |
660 |
падкової величини відхиляється. |
1.3.1.2. Критерій типу Колмогорова-Смірнова. У випадку, коли обидва значення параметрів нормального закону розподілу оцінюють за даними негрупованої вибірки, модифікована статистика критерію розраховується за формулою
Формування вихідної інформації для аналізу і дослідження систем |
29 |
. (1.20)
Величина вибирається із умови
; |
; |
, (1.21)
де – значення теоретичної функції нормального розподілу, визначене до самих параметрів.
Величина розраховується за формулою
. (1.22)
Значення функції табульовані і наведені у додатку Д1. Для від’ємних значень функція .
Якщо статистика не перевищує критичного значення , то гіпотеза нормальності розподілу випадкової величини підтверджується. Для рівня значимості значення критерію Кол-
могорова-Смірнова дорівнює .
Приклад 3. Статистичні дані величини партії вантажів (в тоннах), що були видані замовникам з вантажного терміналу протягом робочої зміни представлені ранжованою вибіркою
: 4, 7, 8, 9, 12, 18, 19, 21, 25, 30.
Перевірити гіпотезу нормальності розподілу даної випадкової величини. Зауважимо, що приклад є демонстраційним, оскільки на практиці кількість спостережень повинна бути .
Розв’язок. Обчислюємо ;
. Маємо .
30 |
Розділ 1 |
Всі подальші розрахунки за формулами (1.21) з використанням додатку Д1 наведені у таблиці.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
4 |
–1,386 |
0,0823 |
0,1 |
0,0 |
0,0179 |
0,0823 |
2 |
7 |
–1,018 |
0,1535 |
0,2 |
0,1 |
0,0465 |
0,0535 |
3 |
8 |
–0,896 |
0,1841 |
0,3 |
0,2 |
0,1159 |
–0,0159 |
4 |
9 |
–0,773 |
0,2207 |
0,4 |
0,3 |
0,1793 |
–0,0793 |
5 |
12 |
–0,405 |
0,3446 |
0,5 |
0,4 |
0,1554 |
–0,0554 |
6 |
18 |
0,331 |
0,6293 |
0,6 |
0,5 |
–0,0293 |
0,1293 |
7 |
19 |
0,454 |
0,6753 |
0,7 |
0,6 |
0,0247 |
0,0753 |
8 |
21 |
0,699 |
0,7580 |
0,8 |
0,7 |
0,0420 |
0,0580 |
9 |
25 |
1,190 |
0,8830 |
0,9 |
0,8 |
0,0170 |
0,0830 |
10 |
30 |
1,804 |
0,9640 |
1,0 |
0,9 |
0,0360 |
0,0640 |
З таблиці випливає, що |
|
; |
; |
. |
|
Обчислюємо статистику |
. |
Так як , то гіпотеза нормальності розподілу підт-
верджується.
1.3.1.3. Критерій . Цей критерій побудований на негрупованих значеннях випадкових величин, що входять до вибірки. За міру розбіжності емпіричного і теоретичного розподілів прийнята величина
, (1.23)
де – емпірична функція розподілу;
– теоретична функція розподілу.
Цю формулу можна перетворити у таке співвідношення
. (1.24)