Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальная металлургическая академия Украины

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Книга1 МОНД.doc

Скачиваний:

Добавлен:

15.11.2019

Размер:

4.64 Mб

Скачать

☆

<<< < Предыдущая 7 8 9 10 11 12 13 14 15 16 17 1819 / 4319 20 21 22 23 24 25 26 27 28 29 30 31 > Следующая >>>

4.2. Співвідношення аналізу і експерименту

Аналітик і експериментатор, які можуть поєднуватися в одній особі, для досягнення цілей досліджень повинні тісно координувати роботу.

Експериментатор визначає умови, в яких повинен виконуватися дослід, і ті дані, які підлягають визначенню. Аналітик вибирає або створює план експерименту, який дозволяє отримати ці дані з мінімальними витратами і з достатньою точністю. Експериментатор має безпосереднє відношення до об’єкту досліджень і намагається запобігти грубих помилок в дослідах. Аналітик застосовує відповідні математичні методи для отримання максимуму відомостей, які містять дослідні дані. Нарешті, експериментатор інтерпретує отримані відомості щодо відповідності їх фундаментальним положенням даної галузі науки.

Математична обробка не виключає, а, навпаки, потребує старанного виконання експерименту. Багато висновків можуть виявитися некорисними або помилковими, якщо вони отримані в результаті обробки неохайно отриманих дослідних даних. Неможливо приготувати смачну страву з неякісних продуктів, навіть якщо її буде готувати дуже досвідчений кулінар. В той же час, якщо план дослідів має значні недоліки, то відомості, які отримані навіть з численних і сумлінно виконаних дослідів, не виправдовують витраченого на них часу і коштів. Тільки при одночасній наявності належного плану експерименту, вмілому проведенні його і використанні ефективного методу обробки дослідних даних може бути забезпечена надійність результатів та висновків.

4.3. Оцінки характеристик змінних об’єкту

Оцінки математичного сподівання та дисперсії для дискретної випадкової величини визначаються за формулами:

; .

Знаменник вибіркової дисперсії дорівнює різниці між об’ємом вибірки N та числом зв’язків, які накладені на цю вибірку (кількість середніх величин). Цю різницю f називають числом ступенів свободи вибірки.

Для визначення точності оцінки величини а_N користуються довірчими інтервалами а_N ± ε, а для визначення надійності – довірчою надійністю Р_ε = Р(а_N – ε < а < а_N + ε), тобто невідоме значення параметру а з імовірністю Р_ε знаходиться в довірчому інтервалі а_N ± ε. В технічних розрахунках звичайно приймають Р_ε = 0,95 (95%).

Оцінка центральних моментів асиметрії та ексцесу розраховується за формулами:

; ;

; .

Розрахунок інтервальних оцінок для математичного сподівання та дисперсії змінної Х виконується за формулами:

; ,

де S_х – середньоквадратичне відхилення;

t_q – значення критерію Стьюдента (псевдонім англійського математика В. С. Госета), який знаходять з таблиць для f = N – 1 і рівня значимості q при певній довірчий імовірності Р; оскільки звичайно Р = 0,95, тому q = 0,05 (5%), якщо це не обговорено спеціально для конкретних досліджень;

- значення χ² – розподілу Пірсона для рівня значимості відповідно.

Приклад. В результаті 8 – міразового контролю складу продуктів згоряння на виході з агрегату отримано, що вміст оксидів азоту в них становить: 76,48; 76,43; 77,20; 76,45; 76,25; 76,48; 76,48; 76,60 . Визначити інтервальні оцінки дисперсії та математичного сподівання.

Рішення. Оцінки математичного сподівання та дисперсії:

; .

З таблиці розподілу Стьюдента для f = 8 – 1 = 7; q = 5% знаходимо t_q = 2,36; тоді інтервальна оцінка математичного сподівання:

; .

Для f = 7 з таблиці розподілу Пірсона знаходимо ; ; тоді інтервальна оцінка дисперсії:

; .

Перевірку гіпотези щодо відмінності середнього обчисленого від стандартного виконують за співвідношенням:

Різниця між стандартним значенням х₀ і середнім вибірковим є суттєвим при виконанні цього співвідношення.

Приклад. Температура в агрегаті, яку вимірювали еталонним термометром, складає х₀ = 1000⁰С. При вимірах її за допомогою інших термометрів отримані значення: 986; 1005; 991; 994; 983; 1002; 996; 998; 1002; 983⁰С. Чи суттєво відрізняється середнє значення вимірів цими термометрами від еталонного?

Рішення. Розрахуємо оцінки математичного сподівання, дисперсії та середньоквадратичного відхилення:

; ; .

Критерій Стьюдента для числа ступенів свободи f = 10 –1 = 9 і рівня значимості q = 5% знаходимо з таблиць: t_q = 2,23. Тоді маємо:

> .

Тобто, середнє значення вимірів суттєво відрізняється від стандартного.

Різні серії дослідів можуть бути виконані з різною якістю, тому виконують перевірку відмінності дисперсій в цих серіях. Припустимо, що маємо дві вибірки об’ємом N₁ та N₂, для яких визначені оцінки дисперсій S₁² та S₂². Ці дисперсії є однаковими, якщо виконується умова:

де S₁² > S₂² ;

F – критерій Фішера для числа ступенів свободи f₁ i f₂ та заданого рівня значимості q_задане.

Приклад. Порівняти точність аналізів вмісту кисню в продуктах згоряння, які виконані двома лаборантами. Лаборант А виконав 20 аналізів з результатами: 4,40; 4,56; 4,42; 4,59; 4,55; 4,45; 4,55; 4,39; 4,75; 4,72; 4,53; 4,66; 4,90; 4,50; 4,45; 4,66; 4,80; 4,36; 4,75; 4,22. Результати 13 аналізів лаборанта В: 4,42; 4,47; 4,70; 4,72; 4,53; 4,55; 4,60; 4,64; 4,29; 4,52; 4,57; 4,56; 4,66. Різницю точності аналізів визначити для 5% - ного рівня значимості.

Рішення. Розраховуємо оцінки математичного сподівання та дисперсії для кожної серії дослідів. Лаборант А:

; .

Лаборант В:

; ;

S₁² = 0,0295 > S₂² = 0,0139

Середні значення аналізів у обох лаборантів приблизно рівні, однак розсіювання результатів біля середніх значень є різним. Табличне значення критерію Фішера для f₁ = 20 – 1 = 19; f₂ = 13 – 1 = 12; q = 5% складає F = 2,50. Оскільки , то з імовірністю Р_ε = 95% можна стверджувати, що різниця в точності аналізів лаборантів А і В є несуттєвою.

В об’ємі вибірки можуть зустрічатися різко відмінні значення, які ще називають аномальними. Виявлення та виключення аномальних значень з вибірки здійснюється за наступною процедурою.

Спочатку знаходять максимальне відхилення від середнього:

Δ_max = x_max(min) - ,

де x_max(min) – аномальне значення в виборці.

Потім виконується оцінка:

│Δ_max │ > сS_x ,

де с – величина, яку знаходять зі співвідношення шляхом ітерацій.

Значення x_max(min) відкидається, якщо виконується наведена нерівність. Оцінка може проводитися багаторазово, середньоквадратичне відхилення S_х розраховують кожен раз за даними залишку вибірки.

Приклад. За даними аналізу продуктів згоряння отриманий вміст СО₂ в них: х₁ = 23,2; х₂ = 23,4; х₃ = 23,5; х₄ = 24,1; х₅ = 25,5%. Чи є значення х₅ аномальним і чи слід виключити його з вибірки?

Рішення. Обчислюємо оцінку математичного сподівання і максимальне відхилення у виборці:

; Δ_max =│25,5 – 23,55│ = 1,95%.

Оцінка дисперсії по залишку вибірки ( по чотирьом вимірам):

S_x² = ; S_x = 0,67.

Табличне значення t – критерію для q = 5%; N = 5; f = 5 – 1 = 4 складає t_q = 2,776. Зі співвідношення: методом ітерацій отримуємо: с = 1,67. Тоді припустиме відхилення:

СS_x = 1,67*0,67 = 1,12%.

Оскільки Δ_max > сS_x , то значення х₅ повинно бути виключено з вибірки.

Важливим практичним питанням, яке вирішується на стадії попереднього експерименту, є визначення необхідної повторності дослідів. Мінімально потрібна кількість паралельних дослідів визначається за наступною процедурою.

Для масиву дослідних даних попередніх N вимірів визначають середнє значення та середньоквадратичне відхилення:

; .

Потім знаходять гранично припустиме відхилення параметру від середнього для заданого рівня значимості q = 0,05:

Δ_гр = q .

Критерій Стьюдента t_0,05 для числа ступенів свободи f = N – 1 та рівня значимості q = 0,05 знаходять за допомогою таблиць і визначають різницю між стандартним середнім та обчисленим за вибіркою для даної кількості вимірів N:

δ =

Якщо δ < δ_гр , зменшують N, знаходять для нового N значення t_0,05 з таблиць і знову розраховують δ, поки δ не стане більшим за δ_гр . Найменше значення N, коли забезпечується умова δ < δ_гр , приймають за потрібну кількість паралельних вимірів (дослідів).

Приклад. Попередні N = 12 вимірів показали, відрив факелу при стабільних інших параметрах спостерігався при витраті палива на пальник х_u, : 105; 100; 100; 100; 102,5; 100; 97,5; 97,5; 102,5; 105; 102,5. Визначити необхідну повторність дослідів при дослідженні процесу стабілізації полум’я.

Рішення. Середня витрата палива та середньоквадратичне відхилення за результатами N = 12 дослідів:

= 101,25 ; S_x = 2,5 .

Гранично припустиме відхилення параметру від середнього при q = 0,05:

δ_гр = q = 101,25*0,05 = 5,063

Табличне значення t – критерію для f = N –1 = 12 – 1 = 11 і довірчої імовірності Р_ε = 95% з таблиць t_0,05 = 2,2.

Різниця між стандартним середнім та обчисленим за вибіркою:

δ = .

Отримане значення δ значно менш, ніж δ_гр, тому розрахуємо δ для менших значень N.

Для N = 6 значення t – критерію t_0,05 = 2,57 і δ = 2,623; для N = 4 t_0,05 = 3,38 і δ = 3,975; для N = 3 t_0,05 = 4,30 і δ = 6,207, що більш, ніж δ_гр. Відповідно, приймаємо чотириразову повторність вимірів.

Ще однією задачею попереднього експерименту є визначення закону розподілу випадкової величини. Звичайно перевіряють його нормальність, оскільки цей розподіл є домінуючим. Для цього будують гістограму. На вісі абсцис відкладають інтервали, які відповідають групам сукупності випадкової величини, і на кожному з них, як на основі, будують прямокутник. Височина його дорівнює частоті даної групи , де n_g – кількість вимірів в групі; N – загальна кількість вимірів, тобто об’єм вибірки.

Кількість груп вибирають таким чином, щоб результати вимірів були добре оглядові і утримували велику кількість відомостей. Алгоритм побудови гістограми наступний.

1. Діапазон зміни випадкової величини у виборці х_min x_max ділять на ε інтервалів; ε вибирають за емпіричною формулою:

ε = 1 + 3,2ln N .

Довжину інтервалів приймають однаковою:

Δg = .

2. Визначають число n_g (g = 1, 2, …, ε) елементів вибірки, які знаходяться в кожному інтервалі Δg , і відносну частоту попадання випадкової величини у відповідний інтервал:

Р_g = .

3. Отриманий варіаційний ряд записують в таблицю, причому елементам вибірки, які потрапили в g – тий інтервал, приписують середнє значення:

і будують гістограму Р_g → х_g-1 x_g.

Після побудови гістограми виконують перевірку нормальності закону розподілу вибірки за допомогою критеріїв згоди, які оцінюють розбіжності між теоретичними та емпіричними розподілами.

Критерій згоди Пірсона для варіаційного ряду розраховують за формулою:

де - імовірність попадання в g – тий інтервал, яка обчислюється за допомогою теоретичного розподілу:

;

Z_g – ліва границя g – того інтервалу відносно х в одиницях S_x:

Z_g = ;

Ф(Z) = – функція Лапласа, значення якої наведені в таблицях.

Найменше значення Z_g = Z_min замінюють на (- ∞), найбільше значення Z_g = Z_mах - на (+ ∞). Якщо , то розподіл є нормальним. Табличне значення визначають з таблиць для числа ступенів свободи f = ε – l –1, де l = 2 для нормального розподілу.

Приклад. Виконано 200 вимірів температури х в агрегаті. Відхилення температури від номінальної Х = 950⁰С складають х_min = - 20⁰C; х_mах = + 30⁰C. Діапазон відхилень розбитий на g = 10 інтервалів, які наведені в табл. 4.1. Точність вимірів складає ± 1⁰С. Визначити нормальність розподілу масиву.

Таблиця 4.1

Вихідні та розрахункові дані для визначення нормальності розподілу масиву

g	Х_g x_g+1	n_g	х_g^*	Р_g	g^*	Z_g	Ф₀(Z_g)
1	-20 -15	7	-17,5	0,035	1	- ∞	- 0,5	0,0239	4,78	1,04
2	-15 -10	11	-12,5	0,055	2	-1,99	-0,4761	0,0469	9,38	0,28
3	-10 - 5	15	- 7,5	0,075	3	-1,47	-0,4292	0,0977	19,54	1,05
4	- 5 0	24	- 2,5	0,120	4	-0,96	-0,3315	0,1615	32,30	2,13
5	0 5	49	2,5	0,245	5	-0,44	-0,1700	0,1979	39,58	2,24
6	5 10	41	7,5	0,205	6	0,07	0,0279	0,1945	38,90	0,11
7	10 15	26	12,5	0,130	7	0,59	0,2224	0,1419	28,38	0,20
8	15 20	17	17,5	0,085	8	1,10	0,3643	0,0831	16,62	0,01
9	20 25	7	22,5	0,035	9	1,62	0,4474	0,0526	10,52	0,03
10	25 30	3	27,5	0,015	10	2,13	0,4834
					11	+ ∞	0,5

Рішення. Спочатку за вихідними даними визначаємо середнє значення в інтервалі х_g^* і відносну частоту Р_g, потім оцінку математичного сподівання, дисперсії та середньоквадратичного відхилення:

= 4,30⁰С; S_x² = 94,2(⁰C)²; S_x = 9,71⁰C.

Після цього розраховуємо нормовані значення випадкової величини Z_g і з таблиць знаходимо Ф₀(Z_g) з урахуванням того, що при Z_g < 0 Ф₀(Z_g) = - Ф₀(|Z_g|) . Після отримання та знаходимо значення критерію Пірсона = 7,09. Інтервали g = 10 та g = 9 можна об^/єднати з огляду на їх малу чисельність.

Кількість ступенів свободи вибірки складає f = 9 –2 = 6, табличний критерій Пірсона для f = 6; q = 0,05 складає χ_т² = 12,59. Оскільки χ_р² < χ_т² , то розглянута вибірка є нормальною.

За Р. Фішером треба розглядати два основних види відхилень від нормального закону розподілу. При одному з них розподіл даних за своєю формою є асиметричним або скошеним; у ньому середня і медіана не співпадають одна з одною (медіана – це серединне спостереження в ранжованому ряду даних). Другий вид відхилення характеризується деяким надлишком або недоліком спостережень, сконцентрованих в центрі ряду. Це ознака крутизни розподілу – гостро – або плосковершинність його.

Приклад. Виконувалися N = 11 вимірів концентрації оксидів азоту у продуктах спалювання палива на виході пальника Х, , результати яких наведені в табл. 4.2. Виконати перевірку масиву даних на скошеність.

Рішення. Розрахунок виконуємо в наступному порядку. Обчислюємо середнє значення змінної , її відхилення від середнього х, суми квадратів та кубів відхилень S₁ i S₂, а також середній квадрат та куб відхилень:

К₂ = ; К₃ = .

Таблиця 4.2

Вихідні та розрахункові дані для перевірки масиву на скошеність

№№ вимірів і	Х,	х = Х -	х²	х³
1	148	- 24	576	- 13824
2	154	- 18	324	- 5832
3	158	- 14	196	- 2744
4	160	- 12	144	- 1728
5	161	- 11	121	- 1331
6	162	- 10	100	- 1000
7	166	- 6	36	- 216
8	170	- 2	4	- 8
9	182	10	100	1000
10	195	23	529	12167
11	236	64	4096	262144
N = 11	= = 172	S₁ = = 0	S₂ = ²= 6226	S₃ = ³ = 248628

Мірою скошеності є величина:

g₁=

Оскільки g₁ > 0, то це означає, що спостерігається надлишок даних в області менших від середнього значень. Якщо g₁ приймає негативне значення, то, навпаки, має місце надлишок даних в області більших від середнього значень. В разі g₁= 0 вибірка є симетричною.

Для перевірки значимості отриманої коефіцієнту g₁ знаходимо його дисперсію, середньоквадратичне відхилення (стандартну помилку) та розрахункове значення критерію Стьюдента:

S_g1² = ; S_g1 = 0,661;

t_р =

Табличне значення t – критерію вибирають для числа ступенів свободи f → ∞ та заданого рівня значимості q. Приймемо для даного прикладу q = 0,01 і з таблиць знаходимо t_т = 2,576. Оскільки t_т < t_р = 2,96, то можна казати про скошеність представленої вибірки, тобто про її асиметрію, з імовірністю 99%.

Крутизна розподілу вимірюється показником g₂ , заснованим на сумі четвертих ступенів відхилень від середнього S₄ :

К₄ = ; g₂ = .

Якщо g₂ дорівнює нулю, то відхилення від нормального розподілу немає. Позитивне g₂ вказує на надлишок спостережень біля середньої; негативне g₂ виникає при плосковершинності кривої розподілу.

Величину стандартної помилки та розрахунковий критерій Стьюдента розраховують за формулами:

S_g2 = ; t_p = .

Табличне значення t – критерію t_т приймають для числа ступенів свободи f → ∞ та заданого рівня значимості q. При перевищенні табличного значення t – критерію над розрахунковим (t_p < t_т) відхилення крутизни розподілу у виборці від нормального є несуттєвим.

<<< < Предыдущая 7 8 9 10 11 12 13 14 15 16 17 1819 / 4319 20 21 22 23 24 25 26 27 28 29 30 31 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.02.20161.04 Mб22Класифікація забруднень.doc
#
04.09.20192.97 Mб2Клин ди@гностик@.doc
#
19.11.2019340.48 Кб4КН 11 часть 2.doc
#
10.11.2019723.97 Кб10КН-11. часть 1.doc
#
12.02.20164.25 Mб31Книга Фин. рынок.doc
#
15.11.20194.64 Mб13Книга1 МОНД.doc
#
12.02.20169.79 Mб17Кокс и химия, № 1 2010.doc
#
12.02.20169.99 Mб14Кокс и химия, № 10 2010.doc
#
12.02.20169.44 Mб15Кокс и химия, № 12 2010.doc
#
12.02.20169.48 Mб14Кокс и химия, № 4 2010.doc
#
12.02.20169.41 Mб24Кокс и химия, № 8 2010.doc