Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metod_ukazania_Malozatratnye_tekhnologii_servis...doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.72 Mб
Скачать

3.2 Основные положения процесса статистического моделирования

Чаще всего, как независимые, так и зависимые величины представляют собой наборы случайных наблюдений, связанных статистическими отношениями, то есть такими, при которых одному значению переменной соответствует некоторое множество значений другой [26]. В таких случаях для построения и анализа зависимостей, описывающих тот или иной процесс (математических моделей процессов) используют методы корреляционного и регрессионного анализа.

В результате анализа статистических данных или проведенного эксперимента регистрируются различные значения случайных величин входных факторов - Xij и выходной - Yi в каждом из опытов, (где i,j принимает значения натуральных чисел, i - в пределах от =1 до m, j пределах от 1 до n,) имеющие некоторую взаимосвязь между последовательностями значений наблюдаемых величин. Совокупность точек на плоскости создает общую картину регрессии и позволяет построить некоторую усредненную кривую взаимосвязи параметров.

Корреляционной связью между случайными переменными величинами называется функциональная связь между средним арифметическим значений наблюдений за выходной переменной, соответствующих данному значению входной [26]. Характер и выраженность такой связи устанавливают с помощью коэффициента корреляции, предложенного в 1846 году О. Браве. Наиболее простой вариант корреляционной связи, описывается коэффициентом парной корреляции, предложенным Пирсоном:

, (1),

где xi, yi – значения наблюдаемых входного и выходного параметров в i-том наблюдении;

x, y - средние значения параметров x и y наблюдений;

n - общее число наблюдений;

δx, δy - среднеквадратичные отклонения параметров x, y.

Среднеквадратичное отклонение параметра x определяется по известной формуле [26]

(2).

Аналогичная формула используется для расчета для δy.

Величина коэффициента корреляции всегда заключена в пределах . Если rxy< 0, то с увеличением в вариационном ряду наблюдаемых величин x, соответствующее им значение второго вариационного ряда в среднем уменьшается. Если rxy > 0, то зависимость у(х) возрастающая; если rxy= 0, то исследуемые параметры x и y не связаны линейной зависимостью; если rxy = 1, то между ними существует прямо пропорциональная функциональная зависимость и любому из значений наблюдения x соответствует определенное единственное значение y. Чем больше по своей величине rxy, тем сильнее проявляется связь между x и y.

В случае, если входная переменная не одна, а их несколько, то взаимосвязь между переменными устанавливается с помощью совокупного коэффициента корреляции, который выражает меру зависимости выходного параметра от всех входных. Если же необходимо оценить степень влияния каждого из входных факторов на выходную величину, рассчитывается коэффициент частной корреляции. Так как коэффициент корреляции есть совокупная характеристика связи между переменными, отражающая как тесноту так и линейность этой связи, то нельзя однозначно судить о связи переменных [26]. Так при равных коэффициентах корреляции зависимости между параметрами могут быть различными. Кроме того, равенство rxy= 0 не свидетельствует об отсутствии связи между x и y, -она может быть нелинейной. На практике коэффициент корреляции рассчитывается на основе выборочных наблюдений, а изменение состава наблюдений ведет к изменение значений r. Следовательно, такой коэффициент является случайной величиной.

Когда выбрана гипотеза о виде зависимости между случайными величинами, то есть вид уравнения, которым описывается модель статистической связи, появляется необходимость нахождения параметров этого уравнения (свободного члена и коэффициентов). Эта задача решается с помощью регрессионного анализа. В общем случае из условия максимального приближения предполагаемой линии регрессии к точкам, отражающим опытные данные получается система нормальных уравнений. Для случая, когда все наблюдаемые значения за переменными x и y лежат точно на прямой линии, выполняется равенство [26], имеющее следующий вид:

yi – a0 – ai* xi = 0, (3)

На практике это равенство нарушается и для отдельных наблюдений появляется ошибка δi, определяемая разностью между измеренной и вычисляется по уравнению регрессии значениями переменной y в i – ом опыте. Возникает задача нахождения коэффициентов уравнения, обеспечивающих минимальную ошибку δi.

Теория вероятностей показывает, что лучшим приближением при ряде условий будет такая линия, для которой сумма квадратов расстояний от точек до кривой будет минимальной. Этот метод называется методом наименьших квадратов [26]. Он разработан Гауссом и иногда называется принципом выравнивания; критерий выравнивания

(4)

Если погрешности δi подчиняются нормальному закону распределения, минимум можно найти, приняв к нулю частные производные по всем неизвестным:

Q/ a0 = …= Q/ am = 0 (5)

После преобразования получается система нормальных уравнений. Решение этой системы позволяет найти искомые коэффициенты (a0, a1,…,am) регрессии.

Имеется ряд условий применения метода наименьших квадратов [26].

  1. Входные факторы должны быть измерены с более высокой точностью в сравнении с ошибкой измерения выходной величины.

  2. Некоррелированность входных факторов.

  3. Измерения выходной переменной y должны представлять собой независимые друг от друга, нормально распределенные случайные величины с D(δ) = Const.

  4. Вид зависимости должен быть известен.

После получения регрессионной зависимости возникает вопрос о качестве полученной модели. Появляется необходимость в проверке значимости коэффициентов уравнения, так как некоторые из них могут отличаться от нуля только из-за воздействия случайных возмущений в то время, как их истинные значения равны нулю. Это особенно важно для оценки качества прогнозирующих моделей [26].

При проверке гипотезы о равенстве коэффициента регрессии ai нулю используется статистика [26] имеющая t – распределение с R = N – m – 1 степенями свободы, где N – число наблюдений, m – число входных факторов, учитываемых в модели. Значимость исследуемого коэффициента регрессии определяют при сравнении полученных величин статистики t со значениями распределения Стьюдента.

Мерой степени соответствия аппроксимирующей регрессии имеющимся значениям yi является коэффициент множественной корреляции (или детерминации) [26], рассчитывается по формуле:

(6)

где - расчетное значение по уравнению регрессии.

Коэффициент R2 изменяется в пределах 0…1; чем больше его значение, тем выше качество модели.

При выборе структуры уравнения регрессии (набора входящих в него входных факторов) появляются две противоположные тенденции. С одной стороны, включение в модель большего числа факторов точнее отражает реальный процесс. С другой стороны, возможно нарушение условий применения этого метода и, к тому же, возрастают затраты на получение информации о факторах. Следовательно, существует необходимость определения лучшего набора входящих в уравнение регрессии факторов.

Коэффициент множественной корреляции R2 c увеличением числа включаемых в модель факторов уменьшается, как правило, не может, поэтому с его помощью сложно выбирать модель оптимальной сложности. В работе [27] для практических задач моделирования предлагается несколько критериев для оценки качества структуры уравнения регрессии. Для решения поставленной задачи применяется скорректированный коэффициент множественной корреляции R2m и статистика Jm.

Скорректированный коэффициент множественной корреляции [2]:

(7)

где N – общее число наблюдений;

m – число входных факторов, учитываемых в уравнении.

Чем выше значения R2m , тем качество модели выше.

Статистика Jm [26] определяется по формуле:

(8)

Качество полученной модели характеризуют минимальные значения Jm .

Используя зависимости (7, 8), лучшая структура модели с различными наборами факторов определяется при постепенном ее усложнении, пока увеличение (уменьшение) критериев не станет пренебрежимо малым по сравнению с предшествующим изменением.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]