
- •Содержание
- •1.8. Проверка однородности нескольких дисперсий, 23
- •1. Первичная обработка результатов мониторинга
- •1.1. Общие сведения
- •1.2. Статистические оценки результатов наблюдений
- •1.3. Расчет доверительного интервала для математического ожидания
- •1.4. Определение необходимого объема выборки
- •1.5. Отбрасывание сомнительных наблюдений
- •1.6. Проверка гипотезы об однородности двух дисперсий
- •1.7. Проверка однородности нескольких дисперсий, найденных по выборкам одинакового объема
- •1.8. Проверка однородности нескольких дисперсий, найденных по выборкам различного объема
- •1.9. Проверка однородности средних
- •1.10. Проверка нормальности распределения
- •1.11. Коэффициент корреляции
- •1.12. Ранговая корреляция
- •1.13. Обработка экспертных оценок при ранжировании
- •2.2. Дисперсионный анализ данных
- •2.3. Корреляционный анализ данных
- •3.2. Основные задачи планирования эксперимента
- •4.2. Метод наименьших квадратов для моделей с одной переменной
- •4.3. Метод наименьших квадратов для многофакторных экспериментов
- •4.3.1.Случай линейной регрессионной модели с k варьируемыми факторами. Регрессионная модель здесь имеет вид (4.2). Значения факторов, принимаемые в каждом опыте, можно свести в табл. 4.3.
- •4.5. Статистический анализ уравнения регрессии
- •4.5.4.Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта.
- •4.6. Пример обработки результатов экспериментальных исследований
- •5. Построение многофакторной линейной регрессионной модели в excel
- •6. Культура представления числовых значений измерений и вычислений
- •7. Контрольное задание
- •Методические рекомендации при оценке состояния загрязнения атмосферы населенных мест
- •Статистические характеристики загрязнения атмосферы (за)
- •Индексы загрязнения атмосферы
- •Список использованной литературы
4.5.4.Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта.
Выбор варьируемых и стабилизируемых факторов, а также выходных величин эксперимента.
Выбор регрессионной модели.
Определение диапазона варьируемых факторов.
Выбор плана эксперимента.
Составление методики проведения эксперимента.
Постановка разведывательных опытов. Проверка нормальности распределения выходной величины. Определение числа дублированных опытов.
Проведение основного эксперимента.
Отбрасывание грубых наблюдений. Проверка однородности дисперсий опытов. Расчет дисперсии воспроизводимости (при отсутствии дублированных опытов дисперсия воспроизводимости определяется по результатам отдельной серии опытов).
Расчет коэффициентов регрессии математической модели.
Оценка значимости коэффициентов регрессии. Отбрасывание незначимых членов и повторный расчет коэффициентов регрессии (последнее – для неортогональных планов).
Проверка адекватности и эффективности регрессионной модели.
Интерпретация результатов.
Приведенный перечень этапов только приблизительно отражает реальную последовательность действий экспериментатора, поскольку многие этапы оказываются взаимосвязанными. Таковы, например, выбор математической модели и определение диапазона варьирования факторов. При выборе диапазона варьирования факторов существенны, прежде всего, соображения экспериментатора, связанные с возможностью применения полученных им результатов и рекомендаций в исследуемой сфере. Поэтому диапазоны варьирования факторов в эксперименте обычно соответствуют реально-возможным условиям. Кроме того, необходимо отметить, что диапазоны варьирования факторов следует выбирать тем больше, чем ниже точность фиксирования факторов и чем меньше диапазон изменения выходной величины [7].
4.6. Пример обработки результатов экспериментальных исследований
Проиллюстрируем методику обработки экспериментальных данных на примере исследования влияния низкоинтенсивного высокочастотного излучения 9–10 ГГц и влажности на прорастание семян ржи. Были выбраны следующие диапазоны варьирования факторов: интенсивности излучения в зоне размещения семян 0< I <10 мкВт/см2; изменение влажности 35 < W < 55 %. По технологическим причинам были выбраны пять уровней варьирования для каждого из факторов и рассматривались всевозможные их комбинации. Один исследуемый образец представлялся 50 семенами ржи. В качестве функции отклика принимались значения размера корешка, проращиваемых семян ржи y.
Матрица плана данного эксперимента в натуральных обозначениях факторов приведена во втором и третьем столбцах табл. 4.10.
Таблица 4.10
Результаты эксперимента
Номер опыта j |
Влажность семян W, % |
Интенсивность потока I, мкВт/см2 |
Средний размер корешка проростка семени,
|
Дисперсия
|
Значение,
полученные по уравнению регрессии
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
50 40 50 40 50 40 50 40 55 35 55 35 45 45 45 45 50 40 55 35 45 |
7,5 7,5 2,5 2,5 10 10 0 0 7,5 2,5 10 0 7,5 2,5 10 0 5 5 5 5 5 |
475 364 498 389 475 365 501 393 534 371 516 383 417 417 409 441 479 384 535 359 418 |
290 475 300 320 527 234 327 399 334 337 632 332 217 385 309 370 254 296 235 367 431 |
468 375 485,5 392,5 459 366,3 494 401 534,8 366,2 526 374,9 414,8 432,3 406 441,9 476,8 383,7 543,6 357,5 423,5 |
В пятый столбец таблицы вписаны значения дисперсий опытов, вычисленные по формуле (4.24). По G-критерию Кохрена проверена гипотеза об однородности этих дисперсий.
Gрасч=
.
Из таблиц G-критерия (см. приложение 3) при уровне значимости q = 0,05 для числа степеней свободы каждой выборки f = n – 1 = 50 – 1 = 49 и для числа выборок m = 21 получим Gтабл = 0,09. Это соотношение Gрасч < Gтабл позволяет принять гипотезу об однородности дисперсий опытов.
Далее определяем дисперсию воспроизводимости опытов (эксперимента)
с числом степеней свободы
f = N(n – 1) = 21(50 – 1).
Расчет коэффициентов регрессии проводился для математической модели в нормализованных обозначениях факторов. Значения нормализованных факторов вычисляются из выражений:
Для расчета коэффициентов регрессии необходимо построить матрицу базисных функций в нормализованных обозначениях факторов. Уравнение регрессии выбрано второго порядка, вида:
для которого матрица базисных функций этой модели должна содержать столбцы:
Матрица базисных функций в нормализованных обозначениях факторов приведена в табл. 4.11.
Коэффициенты регрессионной модели рассчитываются по формуле (4.20). Полученные значения коэффициентов представлены в табл. 4.12.
Таблица 4.11
Матрица базисных функций
в нормализованных обозначениях факторов
Номер опыта |
х0 |
х1 |
х2 |
|
|
х1х2 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 |
0,5 –0,5 0,5 –0,5 0,5 –0,5 0,5 –0,5 1 –1 1 –1 0 0 0 0 0,5 –0,5 1 –1 0 |
0,5 0,5 –0,5 –0,5 1 1 –1 –1 0,5 –0,5 1 –1 0,5 –0,5 1 –1 0 0 0 0 0 |
0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 1 1 1 1 0 0 0 0 0,25 0,25 1 1 0 |
0,25 0,25 0,25 0,25 1 1 1 1 0,25 0,25 1 1 0,25 0,25 1 1 0 0 0 0 0 |
0,25 –0,25 –0,25 0,25 0,5 –0,5 –0,5 0,5 0,5 0,5 1 1 0 0 0 0 0 0 0 0 0 |
Таблица 3.12
Коэффициенты регрессионной модели
Индекс коэффициента |
|
|
|
Tтаблs{bi} |
|
0 1 2 11 22 12 |
421,5 93,05 – 17,46 27,94 3,8 –0,99 |
0,194 0,132 0,112 0,483 0,304 0,486 |
8,24 6,80 6,30 13,02 10,32 13,05 |
16,10 13,30 12,25 25,52 20,22 25,60 |
423,5 93,05 –17,46 27,04 - - |
Для оценки значимости найденных коэффициентов регрессии проверяем выполнение неравенства (4.32). Предварительно необходимо вычислить элементы Cii матрицы (ХТХ)-1, где Х – матрица базисных функций. Для выбранного уровня значимости q = 0,05 и числа степеней свободы f = N(n – 1) = 21(50 – 1), связанного с дисперсией воспроизводимости, из таблицы 1 найдем значение tтабл = =1,96. Тогда значения дисперсии коэффициентов вычисляется по формуле
Сопоставляя
элементы второго и пятого столбцов
табл. 4.12, проверяем выполнение неравенства
(4.32). Как видно, незначимыми оказались
коэффициенты регрессии b22
и b12.
Как отмечалось, после отбрасывания
незначимых коэффициентов величины
остальные коэффициенты регрессии
изменяются. Это заставляет вторично
проводить расчет оставшихся коэффициентов
регрессии. Матрица базисных функций в
данном случае содержит уже только
столбцы х0,
х1,
х2,
.
Вновь рассчитанные коэффициенты регрессии приведены в шестом столбце табл. 4.12. Таким образом, окончательно, регрессионная модель будет иметь вид
Проверим адекватность полученной модели согласно методике, изложенной в п. 3.5. Вначале определяют значения отклика ŷj, по полученной модели для каждого j опыта. С этой целью в уравнение регрессии подставляют значения факторов x1 и x2, соответствующие каждому из опытов плана. Результаты расчетов значений функции отклика приведены в шестом столбце табл. 4.10. Далее по формуле (4.35) вычисляем сумму квадратов, характеризующую адекватность модели
Затем рассчитываем: число степеней свободы fад = N – p = 17 (где p – количество коэффициентов уравнения регрессии); дисперсию адекватности по формуле
Расчетное значение критерия Фишера
Fрасч=
.
Зададимся уровнем значимости q = 0,01. Из таблицы значений критерия Фишера для значений fад = 17 и fy = 168 Fрасч равно 1,95. Полученное соотношение Fрасч<Fтаб позволяет принять гипотезу об адекватности регрессионной модели.