- •Математическое моделирование в машиностроении
- •Предисловие
- •Конспект лекции
- •Раздел 1. Задачи и объекты математического моделирования в машиностроительном производстве
- •1.1 Задачи моделирования. Виды моделей
- •1.2 Классификация математических моделей
- •1.3 Требования к математическим моделям
- •4. Наглядность, т.Е. Удобное визуальное восприятие модели.
- •Раздел 2. Моделирование дискретных объектов и процессов
- •2.1. Использование множеств для моделирования технических систем
- •2.2 Операции над множествами.
- •Пример. Сборочная единица представляет собой объединение некоторого множества т-систем « деталь»
- •Раздел 3. Графы. Использование графов для моделирования технических систем
- •3.1. Элементы теории графов.
- •Раздел 4. Моделирование с использованием элементов теории вероятностей
- •4.1 Статистические исследования в задачах оценки точности
- •4.2 Теория вероятности при оценке надежности технических систем
- •4.3. Планирование эксперимента
- •Раздел 5. Моделирования процесса принятия решений
- •5.1.Логические модели представления знаний
- •Основные свойства логических операций
- •1 Ассоциативность:
- •5.2. Исчисление предикатов
- •5.3 Элементы теории принятия решений. Таблицы соответствий. Алгоритмы поиска решений
- •Раздел 6. Моделирование экономических процессов
- •6.1 Линейная и нелинейная регрессия
- •Множественная линейная корреляционная зависимость
- •Нелинейная регрессия
- •6.2 Прогнозирование экономических процессов
- •Временные ряды
- •Применение моделей кривых роста в экономическом прогнозировании
- •Заключение
- •Библиографический список
- •Раздел 2. Моделирование дискретных объектов и процессов 21
- •2.1. Использование множеств для моделирования технических систем 21
- •191186, Санкт-Петербург, ул. Миллионная, 5
Раздел 6. Моделирование экономических процессов
6.1 Линейная и нелинейная регрессия
Множественная регрессия представляет собой регрессию результативного признака с двумя или большим числом независимых переменных вида
У = ƒ(х1, х2, ..., хк).
В уравнении регрессии случайная величина у зависит не только от значений независимых переменных х1 х2, ..., хк, но и от ряда других факторов, влияющих на у, которые не могут быть проконтролированы. В связи с этим будем использовать запись вида
У = ƒ(х1 х2, ..., хк)+ е,
где е — случайная величина, характеризующая отклонения результативного признака от теоретического, найденного по уравнению регрессии. Статистический анализ случайной ошибки является одной из основных задач эконометрики.
При исследовании зависимости результативного признака у от ряда факторов х1 х2, ..., хк, необходимо решать такие же задачи, что и при парной связи двух переменных х и у:
определение вида регрессии;
оценка параметров;
определение тесноты связи, если переменные х и у — случайные величины.
Однако наряду с этими задачами необходимо рассматривать и ряд задач, характерных лишь для множественной регрессии и корреляции. К таким задачам относится отбор факторов х1, х2, ..., хк, существенно влияющих на фактор у, при наличии возможностей внутренней взаимосвязи между переменными х1, х2,..., хк. Такой отбор требует, прежде всего, глубокого теоретического и практического знания качественной стороны рассматриваемых экономических явлений.
Отбор факторов осуществляется обычно в нескольких этапов. Сначала отбираются факторы, связанные с изучаемым явлением на основе данных теоретического исследования (экономическая теория, заключения специалиста и т. д.). При этом для построения множественной регрессии и корреляции отбираются факторы, которые могут быть количественно измеримы.
Далее отобранные факторы подвергаются проверке существенности их влияния на изучаемый показатель с использованием методов математической статистики. Такая проверка, как правило, включает анализ матрицы парных корреляций, частных корреляций, проверку существенности (значимости) коэффициентов регрессии на основе t-критерия, анализ остатков (отклонений) и т. д.
Особенностью множественной регрессии и корреляции является необходимость различать случаи корреляционной множественной связи, когда переменные х1, х2, ..., хk, являются случайными величинами; регрессионной, если переменные х1, х2,..., хk ─ неслучайными величинами, а также смешанный случай, когда некоторые из переменных — случайные величины, другие — неслучайные. В случае корреляционной зависимости следует вычислять и интерпретировать коэффициенты корреляции, при регрессионной зависимости это не имеет смысла, а при наличии как случайных, так и неслучайных переменных коэффициенты корреляции следует вычислять только между случайными переменными.
Множественная линейная корреляционная зависимость
Рассмотрим отбор факторов для построения множественной линейной зависимости, когда переменные у, х1, х2 ..., хp являются случайными величинами (обычно предполагается, что их совместное распределение нормальное).
Наиболее простой формой зависимости, достаточно строго обоснованной для случая совместного нормального распределения, является линейная зависимость, т.е. зависимость вида
У = а0 + а1х1 + а2х2 +... + аpхр. (6.1)
Такая зависимость во многих случаях довольно хорошо отражает сложившиеся экономические взаимосвязи. Исходная информация для построения зависимости (6.1) обычно задается в виде некоторой таблицы.
№ |
Факторы, для которых получены данные |
|||||
x1 |
x2 |
x3 |
… |
xk |
y |
|
1 |
x11 |
x21 |
x31 |
… |
xk1 |
y1 |
2 |
x12 |
x22 |
x32 |
… |
xk2 |
y2 |
3 |
x13 |
x23 |
x33 |
… |
xk3 |
y3 |
… |
… |
… |
… |
… |
… |
… |
N |
x1n |
x2n |
x3n |
… |
xkn |
yn |
Следует определить, все ли переменные следует включать в уравнение (5.1) или есть переменные, которые существенно не влияют на величину у и их нецелесообразно включать в (6.1). В первом случае р = k, во втором р < k.
Для решения этого вопроса часто используется таблица, составленная из коэффициентов парной корреляции. Элементами такой таблицы являются коэффициенты парной корреляции для всех k факторов.
Таблица имеет вид
|
y
|
x1
|
x2
|
x3
|
…
|
xk
|
y
|
1
|
ryx1
|
ryx2
|
ryx3
|
…
|
ryxx
|
x1
|
rx1y
|
1
|
rx1 x2
|
rx1x3
|
…
|
r x1xk
|
x2
|
rx2y
|
rx2 x1
|
1
|
|
…
|
r x2xk
|
x3
|
rx3y
|
rx3 x4
|
rx3 x2
|
1
|
…
|
r x3xk
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
xk
|
rxky
|
rxk x1
|
rxk x2
|
…
|
…
|
1
|
В клетках таблицы записаны парные коэффициенты корреляции, например, r31 — парный коэффициент корреляции между переменными х3 и х1 и др. Коэффициенты rij и rji;, а также rxiy и ryxi совпадают, так как теснота связи между переменными у и хi такая же, как между хi и у, аналогично, для хi и хj Поэтому таблицу записывают в упрощенной симметричной форме (треугольная форма).
|
y
|
x1
|
x2
|
x3
|
…
|
xk
|
y
|
1
|
ryx1
|
ryx2
|
ryx3
|
…
|
ryxx
|
x1
|
-
|
1
|
ryx2
|
rx1x3
|
…
|
r x1xk
|
x2
|
-
|
-
|
1
|
rx2x3
|
…
|
r x2xk
|
x3
|
-
|
-
|
-
|
1
|
…
|
r x3xk
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
xk
|
-
|
-
|
-
|
-
|
…
|
1
|
По данным такой таблицы можно примерно оценить, какие факторы существенно влияют на переменную у, а какие — несущественно, а также выявить взаимосвязь между факторами.
Пример 1.
Пусть получена таблица
|
y |
— x1 |
x2 |
x3 |
y |
1 |
0,6 |
0,5 |
0,7 |
x1 |
- |
1 |
0,04 |
0,03 |
x2 |
- |
- |
1 |
0,1 |
x3 |
- |
- |
- |
1 |
На основании указанных в таблице парных коэффициентов корреляции можно сделать вывод, что связь факторов х1, х2, х3 с фактором у существенная (коэффициенты корреляции, соответственно, 0,6; 0,5; 0,7). Теснота связи между факторами х1, х2, х3 незначительная (коэффициенты корреляции 0,04, 0,03, 0,1).
Такая информация наиболее благоприятна для построения уравнения (6.1).
Если факторы-аргументы не являются случайными величинами, то коэффициенты корреляции не могут быть использованы при построении уравнения регрессии, так как они не могут быть интерпретированы как показатели тесноты связи.
Существенность вводимых факторов в случае линейной множественной регрессии может быть проверена одновременно с существенностью коэффициентов регрессии. Для проверки существенности вычисляется отношение
t
i=аi/σi
, і=1,n, (6.2)
где аi- — коэффициент множественной регрессии; σi — среднее квадратическое отклонение этого коэффициента.
Если ti< tта6л, взятого по таблицам t-распределения Стьюдента, то с заданной вероятностью не отвергается гипотеза, что соответствующий коэффициент регрессии аi- в генеральной совокупности (который не известен и который нужно оценить по данным выборки) равняется нулю. При этом i-й фактор в таком случае признается несущественным для построенного уравнения регрессии.
При проведении исследования может оказаться, что вычисленные значения t для нескольких факторов не превышают tтабл В этом случае несущественные факторы из уравнения регрессии исключаются поочередно, начиная с наименьшего по абсолютной величине t. Фактор, соответствующий минимальному значению t, из уравнения регрессии исключается, и заново решается система нормальных уравнений. Затем вновь вычисляются значения t для всех оставшихся в уравнении коэффициентов, определяется минимальное значение t, которое сопоставляется с tтабл. Если окажется, что tmin.< tтабл ,то фактор, имеющий tmin исключается.
Процесс исключения коэффициентов повторяется до тех пор, пока не будет выполняться соотношение tmin.≥ tтабл. В этом случае все оставшиеся в уравнении факторы существенны.
Проводить исключение из уравнения регрессии одновременно несколько факторов, имеющих t < tтабл. нецелесообразно, так как после исключения одного несущественного фактора коэффициенты регрессии других факторов меняются и несущественные факторы после пересчета могут оказаться существенными.
Аналогичный подход осуществляется и при наличии корреляционной зависимости, но на последней стадии отбора существенных факторов. Проверка значимости уравнения регрессии осуществляется по критерию Фишера
F =σ2y / σ2ост
с числом степеней свободы υ1= п – 1 и υ 2 = п -р -1,
где
σ2y
=Σ(yi
–y)2/(n-1).
σ2ост. =Σ(yi –ŷi)2/(n- p-1).
ŷi — значения у, полученные по данным наблюдений; уi — расчетные значения у, полученные для соответствующих значений х1, х2, ..., хр.
Полученное значение F сравнивается с Fта6л при выбранном уровне значимости. Если окажется F> Fта6л, то гипотеза о том, что х1, х2, ..., хр не имеют существенного влияния на у, отвергается.
Если F>Fта6л, , то следует ввести некоторые другие факторы, влияющие на показатель у, или перейти к построению нелинейной множественной регрессии.
