
- •Змістовий модуль 1 первинна математико-статистична обробка експериметальних даних
- •Вимірювання величин. Точність вимірювання
- •1.2. Випадкові величини та їх статистична характеристика
- •1.3. Експериментальні дослідження, їх статистична характеристика
- •1.4. Вибірковий метод дослідження
- •2.1. Основні етапи первинної обробки експериментальних даних
- •2. 2. Обчислення основних числових статистичних характеристик вибірки та їх суттєва інтерпретація
- •2.3. Перевірка статистичних гіпотез
- •2.3.1. Відсів грубих похибок
- •Перевірка однорідності декількох вибірок початкових даних
- •2.3.3. Перевірка гіпотези про значущість різниць двох середніх
- •2.3.4. Перевірка гіпотези нормальності розподілу експериментальних даних
- •Змістовий модуль 2 математико-статистичні методи аналізу парних залежностей дослідних даних
- •3.1. Види залежностей величин
- •3.2. Загальні поняття про статистичні методи аналізу парних залежностей
- •4.1 Загальні поняття
- •4.2. Статистична оцінка кореляційного зв'язку між показниками, які контролюються
- •5.1. Загальні поняття
- •5.2. Загальна схема регресійного аналізу
- •5.3. Вибір загального вигляду функції регресії
- •5.4. Метод найменших квадратів
- •5.5. Обчислення оцінок невідомих параметрів лінійної функції регресії
- •5.6. Обчислення оцінок невідомих параметрів квадратичної функції регресії
- •5.7. Обчислення оцінок невідомих параметрів кубічної функції регресії
- •5.8. Статистична оцінка адекватності рівняння регресії
- •Змістовий модуль 3 багаточинникові експерименти
- •7.1. Загальні поняття
- •7.2. Планування порівняльних експериментів
- •7.3. Планування екстремальних експериментів
- •7.4. Статистична обробка та інтерпретація результатів екстремального експерименту
- •7.4.1. Обчислення дисперсії експерименту
- •7.4.2. Обчислення значень коефіцієнтів функції відгуку параметра оптимізації
- •7.4.3. Перевірка адекватності функції відгуку параметра оптимізації
- •7.4.4. Перевірка значущості коефіцієнтів множинної функції регресії
- •7.4.5. Інтерпретація результатів експерименту
- •Література
3.2. Загальні поняття про статистичні методи аналізу парних залежностей
Методи статистичного дослідження залежностей складають зміст окремих частин багатомірного статистичного аналізу, який можна визначити як розділ математичної статистики, збору, систематизації даних, націлених в першу чергу на виявлення характеру та структури взаємозв'язків між компонентами багатомірної ознаки (х, у), що досліджується, та призначених для одержання наукових та практичних висновків.
Розділи багатомірного статистичного аналізу, які складають математичний апарат статистичного дослідження залежностей, формувались та розвивались з урахуванням специфіки моделей, що аналізуються, зумовленою в першу чергу природою змінних величин, які досліджуються.
Так, математичний апарат, призначений для статистичного дослідження залежності типу В, являє зміст регресійного аналізу, математичний апарат, призначений для дослідження залежностей типу С, являє зміст кореляційного аналізу, математичний апарат, за допомогою якого досліджується залежність типу Д, утворює зміст дисперсійного аналізу; математичний апарат, за допомогою якого досліджується залежність типу Е, виділений у розділ коваріаційного аналізу, для дослідження залежностей в умовах активного експерименту служить теорія оптимального планування експериментів.
Якщо під час збору вибіркових даних, які складають двомірну систему спостережень, проводиться по декілька спостережень при кожному фіксованому значенні аргументу, то вводиться поняття умовних середніх залежної змінної величини - середні значення результуючої ознаки при кожному фіксованому значенні аргументу. Якщо діапазон значень аргументу розбивається на інтервали групування, та в якості фіксованого значення аргументу приймається середнє значення інтервалів групування, за яких також визначаються умовні середні значення результуючої ознаки.
За допомогою регресійного аналізу можна відповісти на питання:
як по розміщенню експериментальних точок, що відображають закономірність у поведінці умовних середніх в залежності від величини х найбільш точно провести пряму усер.(х) = Θ0 + Θ1×х (лінію усер.(х) = f(х) ) ?;
як оцінити ступінь точності побудування даної залежності ?;
чи можна будувати математично обґрунтовані зони (певні інтервали та межі) навколо прямої, яка досліджується, попадання в які емпіричних значень результуючої ознаки характеризувалось би з раніше заданою ймовірністю?
Сукупність методів, які дозволяють вирішувати коло питань, пов'язаних з дослідженням тісноти зв'язку між результуючими та пояснюючими змінними величинами, які, як правило, флюктурують випадковим чином навколо встановлених номіналів, являє собою розділ статистичного аналізу, названий кореляційним. Найчастіше за допомогою кореляційного аналізу описують залежності, які виявлені в ході технологічних процесів. Саме в ході технологічного процесу має місце коливання реальних значень параметрів процесу (наприклад, температури, тиску, концентрації речовин, лінійних розмірів продуктів, які обробляються, тривалості та т.п.), отже, і взаємозалежних результуючих показників, на які впливають і інші чинники, що не контролюються в технологічному процесі.
Дисперсійним аналізом називається метод організації (планування), статистичного аналізу та інтерпретації результатів експериментів, в яких вивчається залежність кількісної змінної величини від сполучення градацій якісних змінних величин. Дисперсійний аналіз найбільш ефективний саме тоді, коли дослідник активно втручається в організацію збору даних (бере участь у плануванні експерименту). Прикладом дисперсійного аналізу може служити, наприклад, залежність виходу готових кулінарних м'ясних виробів від виду теплової обробки (варка, смаження, тушкування, НВЧ-нагрів та ін.), виду м'яса (яловичина, свинина, птиця та т. п.), кулінарної частини (товстий край, верхня, нижня частина тазостегнового відрубу, лопатка та т.п.), характеру нарізання (великий шматок, скибки, порційний шматок, брусочки, подрібнення на м'ясорубці та ін. ). У цьому випадку за допомогою методів дисперсійного аналізу одержують лінійні математичні моделі з постійними та випадковими чинниками типу
y = т + аі + bj + ск + ε , (3.1)
де т, аі, bj , ск - константи, що відображають відповідно: середній процент виходу готових кулінарних виробів, вплив на вихід виду обробки, виду м'яса, виду кулінарної частини;
ε - "залишкова" випадкова величина, яка являє собою відхилення виходу, який спостерігається, від модельних припущень.
Коваріаційним аналізом називається сукупність методів організації (планування), статистичного аналізу та інтерпретації результатів експериментів, чи спостережень, в яких вивчається залежність кількісної змінної величини від набору (сукупності) якісних та кількісних чинників (змінних величин). Наприклад, якщо необхідно проаналізувати дані виходу кулінарно готових м'ясних виробів від виду теплової обробки, яка характеризується кількісними змінними величинами (температура теплопідводячого середовища, щільність теплового потоку, який підводиться до виробу, що обробляється, та т. п.), від виду нарізання, яке можна оцінити максимальними чи інтервальними лінійними розмірами шматків, що обробляються, та т. п.
Вміння правильно класифікувати кожну конкретну багатомірну систему спостережень грає вирішальну роль під час вибору відповідних математико-статистичних методів пошуку залежності, що вивчається, та при її неформальній, фізично змістовній інтерпретації.
Увесь процес статистичного дослідження залежностей, які нас цікавлять, зручно представити у вигляді схеми, яка містить в собі шість основних етапів (рисунок 3.1)
Схема 3.1
Слід відмітити, що, являючись вузловим, у визначеній мірі вирішальною ланкою в усьому процесі статистичного дослідження залежностей, четвертий етап - етап визначення класу функцій, в рамках якого буде проводитись подальший пошук конкретного виду залежності, що цікавить дослідника (тобто структури шуканого зв'язку між у та х), у той же час він знаходиться в найменш вигідному становищі в порівнянні з рештою етапів (з позицій наявності суворих та закінчених математичних рекомендацій по його реалізації). На жаль, не існує стандартних прийомів та методів, які створили б сувору теоретичну базу для вирішення задачі правильного визначення загальної структури математичної моделі.
Відмітимо, що частину статистичного дослідження, що поєднує етапи 4, 5 і 6, прийнято називати регресійним аналізом.
Використання методів статистичного дослідження залежностей у задачах оптимального регулювання ходу технологічного процесу та побудування відповідних автоматизованих систем управління технологічним процесом (АСУТП) можна віднести до прикладів грамотних і відносно поширених актуальних додатків математичного апарату.
*
* *
Стислий та описувальний характер даного розділу не може служити підставою експериментатору відноситись до його без відповідної уваги.
Коректність одержаних результатів та висновків за встановленими в дослідженнях взаємозалежностями в більшій мірі залежать від чіткого розуміння експериментатором характеру даних, які одержуються в експерименті, оскільки це впливає на правильність вибору методів, за допомогою яких у подальшому буде проводитись статистичний аналіз залежностей.
Розділ 4. Кореляційний аналіз