- •Введение
- •Задание
- •О понятии «малозатратные технологии» как о новациях в различных областях человеческой деятельности и производственных процессах
- •Общие рекомендации перед выполнением исследовательской учебной работы
- •Выбор темы исследования
- •1 Обоснование актуальности тематики работы
- •1.1 Библиографический анализ опубликованных научных и исследовательских работ
- •1.2 Установление значимости тематики проводимых исследований при помощи оценки предполагаемого эффекта
- •1.3 Установление признаков тематики исследования
- •1.4 Классификация тематики выполняемой работы
- •2 Описание и анализ выбранного объекта исследования. Цель и задачи
- •2.1 Качественная и количественная характеристика объекта
- •2.2 Конкретизация условий деятельности объекта
- •2.3 Анализ связей с общей технологией перевозочного процесса
- •5.4 Цель и задачи исследования
- •3 Основные математические положения, применяемые для проектирования статистической модели. Программное обеспечение расчетов
- •3.1 О способах и методах, применяемых при проектировании моделей
- •3.2 Основные положения процесса статистического моделирования
- •3.3 Методы, принципы и алгоритмы формирования математической модели
- •6.4 Математическое обеспечение решения задачи
- •1.5 Программное обеспечение для расчетов
- •4 Проектирование статистической модели
- •4.1 Общие требования, предъявляемые к формулированию и описанию факторов для математической модели
- •4.2 Формулирование факторов, характеризующих надежность технических средств и обеспечивающих безопасность движения
- •4.3 Формулирование нового или интегрального фактора
- •4.4 Экспертная характеристика факторов
- •4.5 Сбор (или выбор) статистических данных
- •4.6 Применение программного обеспечения «model 3» для расчета параметров математической модели
- •После заполнения всех полей обязательно нужно нажать кнопку «сохранить данные в файл».
- •4.7 Анализ статистических моделей и оценка полученного результата
- •5 Заключение к выполненной работе
- •6 Пример проектирования малозатратной технологии. Установление рациональной длины грузовых поездов для станции Батайск
- •Литература
- •Приложение а
4.5 Сбор (или выбор) статистических данных
Следующей задачей проведения исследований является целенаправленный сбор (или выбор) статистических данных для установленного количества входных (в рассматриваемом примере четырех) и одного выходного факторов. Такая задача может выполняться путем организации специальных опытов, в ходе которых фиксируются измерения искомых величин (например, хронометраж деятельности человека при выполнении технологического процесса) либо специальным анализом, собранных предварительно или выбранных из источников информации, данных о работе линейных предприятий железной дороги (отчетов).
Каждый из способов имеет как свои достоинства, так и недостатки и должен применяться в зависимости от поставленных перед исследователем цели и задач. Это важнейший этап в исследовании и от него во многом зависит корректность и адекватность проектируемой модели, он требует тщательной специальной подготовки проведения эксперимента экспертом-исследователем с точки зрения организационных, финансовых и технических средств.
Работа по сбору данных может начинаться во время прохождения летней производственной практики на линейных предприятиях железной дороги в конце четвертого курса обучения студентов. В этом случае у студента появляется возможность организовать специальные опыты по хронометрированию величин основных параметров исследуемого технологического процесса, предусмотренные программой практики на станции, отделении дороги. Такой подход обеспечивает получение адекватной и практически применимой математической модели, формируемой на реальных данных, для использования в существующих эксплуатационных условиях работы железнодорожного предприятия, но для этого необходимо заранее выполнить необходимые разделы данной работы и подготовить регистрационные формы и осуществить другие необходимые подготовительные операции.
В этом случае выбор статистических данных для учебной работы осуществляется на основе информации, собранной из отчетов или полученной в ходе поставленных экспериментов (не менее нескольких десятков), в виде вариационных рядов с данными входных и выходного параметров. Полученные данные группируются по признаку среднего отклонения величин в n-ое количество интервалов, которые в последствии становятся n-ми наблюдениями с изменяющимися величинами выходного параметра в зависимости от входных значений.
При другом подходе – когда работа выполняется во время учебного семестра, студент на основании ниже приведенных рекомендаций самостоятельно формирует корреляционное поле для расчета статистической модели. В этом случае могут достигаться только учебные цели (процесса анализа, проектирование модели, оценка результата), а вероятность получения прикладного результата – минимальна.
И в первом и во втором случаях студентом самостоятельно задается гипотеза значений вариационного ряда для каждого из входных, а также выходного факторов в виде случайной выборки данных из исследуемой области значений, установленной в ходе экспертизы, с учетом взаимосвязей и тенденцией к изменению характеристик объекта.
Для регистрации данных рекомендуется использовать форму-шаблон (см. таблицу 5). Таблица имеет структуру, соответствующую матрице исходных данных, которая будет использоваться (в дальнейшем) в процессе моделирования регрессионного уравнения программными средствами. Она составляется на основании экспертной характеристики (см. таблицу 4) взаимосвязей выходного фактора-функции с установленными входными факторами-аргументами.
Предварительный процесс предполагает подготовку регистрационной документа, составленного в виде таблице по форме-шаблону, с таким количеством колонок, которое обеспечивает внесение необходимой информации по избранным входным факторам (Xji), прошедших экспертную оценку и включаемых в модель. Количество колонок может рассчитываться по формуле: «количество входных факторов (М) плюс еще две единицы (одна из них это номер п/п, а вторая графа - для выходного фактора)».
Количество строк в таблице (они обязательно нумеруются) должно соответствовать количеству проведенных опытов, экспериментов (i) по измерению исследуемых факторов. В учебной работе для уменьшения времени на ввод информации достаточно сформировать вариационный ряд из 10…15 значений.
В заголовок каждой графы таблицы вносится информация о трех аспектах соответствующего фактора: буквенное обозначение, символьное обозначение характера влияния на выходной фактор (для выходного фактора указывается тенденция представления значений), а также область изменения значений в зависимости от установленной взаимосвязи (от min до max или наоборот).
Таблица 5 − Форма-шаблон таблицы исходных данных для расчета статистической модели
№ |
Yi, ↑, |
X1i, ↑↓, |
X2i, ↑↑, |
X3i, ↑↓, |
X4i, ↑↓, |
… |
XMi, ↑↑, |
п/п |
(ymin - ymax) |
(x1max -x1min) |
(x2min-x2max) |
(x3max -x3min) |
(x4min-x4max) |
… |
(xMmin-xMmax) |
1 |
2 |
3 |
4 |
5 |
6 |
… |
… |
|
|
ymin |
x1max |
x2min |
x3max |
x4max |
... |
xMmin |
|
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
15 |
ymax |
x1min |
x2max |
x3min |
x4min |
... |
xMmax |
В каждой строке таблицы вносится информация о значениях величин, зафиксированных в одном опыте исследуемой функцией (Yi) под воздействием аргументов – значений входных факторов (Xji). Величины, принимаемые факторами, располагаются каждый в своей графе.
Для обоснования принципов формулирования гипотезы значений вариационного ряда, были использованы некоторые элементы аналитической алгебры и геометрии, а также проведенные автором исследования о расчетном шаге между случайными величинами ряда. Этот параметр вариационного ряда может характеризировать уровень знания исследователя о каждом из факторов - изученность свойства и характеристик поведения, установление нелинейности взаимосвязей между факторами.
Предположения о том, что свойства входных факторов могут характеризоваться изменяющимся шагом между рядом стоящими значениями, могут быть подтверждены ниже приведенными рассуждениями и продемонстрированы графиками для простых видов нелинейной функции, а также анализом расчетных значений, представленных в таблице 6. В исследовании данного механизма используется метод «от известного результата к неизвестному аргументу».
Д
ля
анализа указанной взаимосвязи используются
три монотонно возрастающие функции
f(x1)
– линейная, f(x2),
f(x3)
– нелинейные выпуклая и вогнутая
соответственно (см. рисунок 6 а). Для
упрощения расчетов допускается, что
значения каждой из функции равны при
различных значениях аргументов,
изменяющихся в пределах от 0 до 5. То есть
для таких функций всегда найдутся
аргументы, удовлетворяющие условию
одного единственного решения. Так, к
примеру, для
аргументов при x1=1,
x2=0,45,
x3=2,
их функции
равны между
собой
у = f(x1)
= f(x2)
= f(x3)=1.
Аналогичным образом может быть установлено
указанное соответствие для любого
другого значения функции. Это подтверждается
данными, представленными в каждой строке
таблицы 6, а также графиками на рисунке
6.
Рисунок 6 – Формирование гипотезы исходных значений входных
Для подтверждение гипотезы взаимосвязи вида нелинейных функций с расчетными величинами шага между входными значениями ∆х1,= x(i+1), xi, как дополнительной характеристики состояния аргументов,
Расчет величины шага для любой пары чисел непрерывного возрастающего ряда выполняется по формуле:
∆х1,j = x1,(J+1) x1,J (22).
Если дискретный вариационный ряд данного входного фактора с возрастающей зависимостью имеет более трех значений, то расчетная величина шага между любой парой значений всегда будет находиться в пределах между максимальным и минимальным значениями аргументов и характеризуется следующим неравенством:
хmax,j > ∆хi,j > хmin,j (23).
Расчет средней величины шага с ∆хi,j,= Const линейной возрастающей функции выполняется по формуле:
(24)
где i – это количество опытов, проведенных экспертом.
С использованием формул (22-24), выполняется расчет показателей и анализ разницы дискретных значений для каждого из рассматриваемых факторов x1, x2, x3, имеющих различные функциональные зависимости.
Первая функция f(x1) выступает в роли эталонной, она линейна и поэтому для значений указанных в графе 3 (таблицы 6) имеет одинаковую разницу (или расчетный шаг) между всеми расположенными рядом парами чисел, рассчитанную по формуле (22) и равную единице. Тогда ∆х1,1 = ∆х1,2 = ∆х1,3= ∆х1,4 = ∆х1,5=1. Для любого значения функции f(x1) для исследуемого подмножества области определения от 0 до 5 расчетный шаг имеет постоянное значение, равное среднему значению шага, а его отображение представлено на рисунке 6 (б).
Для нелинейной возрастающей выпуклой функции f(x2), величины расчетного шага для исследуемого подмножества области определения от 0 до 5, рассчитанные по формуле (22) имеют тенденцию к возрастанию (к тому же нелинейную), а для нелинейной возрастающей вогнутой функции f(x3), наблюдается тенденция к убыванию значений в зависимости от возрастания функции. Это наглядно демонстрируется данными таблицы 6 (графа 6) и графическим отображением ∆х2 и ∆х3 на рисунке 6 б.
Таблица 6 – Исследование расчетных шага значений аргументов
№ |
у=f(xi) |
х1, ↑↑ |
∆х1→ |
х2, ↑↑∩ |
∆х2,↑ |
х3,↑↑U |
∆х3,↓ |
(0 -5) |
(0 - 5) |
Const |
(0-5) |
(0,45-2) |
(0-5) |
(2-0,5) |
|
|
|
0 |
0 |
- |
0 |
- |
0 |
- |
|
|
1 |
1 |
1 |
0,45 |
0,45 |
2 |
2 |
|
|
2 |
2 |
1 |
1 |
0,55 |
3,2 |
1,2 |
|
|
3 |
3 |
1 |
1,8 |
0,8 |
3,94 |
0,74 |
|
|
4 |
4 |
1 |
3 |
1,2 |
4,5 |
0,56 |
|
|
5 |
5 |
1 |
5 |
2 |
5 |
0,5 |
В результате проведенных исследований можно сделать вывод о том, если простая нелинейная монотонная (или дискретная) возрастающая функция имеет выпуклый вид на отрезке изменения величин исследуемой области, то расчетный шаг может принимать величины от минимальных к максимальным значениям, и является одной из объективных характеристик исследуемой функции. Если же возрастающая нелинейная функция имеет вогнутый вид (это может отражаться символами «U↑»), то шаг между значениями аргументов в начале ряда может иметь наоборот большую величину и уменьшаться к концу исследуемой области до минимальной величины.
К указанному, следует добавить, что установлена также взаимосвязь крутизны исследуемой функции и соотношения величин максимального и минимального расчетного шага: чем выше соотношение расчетного шага краевых аргументов исследуемой области, тем выпуклость функции имеет большие величины.
Аналогичным или иным способами студентом могут быть проведены собственные исследования применительно и к анализу других элементарных функциональных убывающих или возрастающих зависимостей (параболы, гиперболы и т.д.), что позволит еще расширить знания эксперта. А полученный результат может быть положен в основу дальнейших рассуждений при выборе и анализе статистических данных из подмножества области определения для входных факторов регрессионного уравнения.
Для практической реализации проведенных исследований и выполнения задачи по формированию статистического ряда данных разработаны различные специальные процедуры, которые могут использоваться студентом, для установления гипотезы данных для выходного и входных факторов с последующим внесение их в заранее заготовленную таблицу.
Входной фактор (вторая графа таблицы).
Колонка заполняется величинами вариационного ряда из исследуемого диапазона от ymin.до.ymax, которые принимает выходной фактор (Yi). В первой строке вписывается минимальное значение (ymin), а в последней – максимальное значение (ymax). В промежуточные строки (между первой и последней строкой) вносятся данные из вариационного ряда, который формируется цикловым расчетом значений, располагаемых между собой с некоторым не строго выдерживаемым средним шагом (∆), но с тенденцией увеличения значений ряда.
Расчет средней величины шага с ∆yср = Const линейной возрастающей функции выполняется по формуле аналогичной формуле (22):
≈
≈
≈…≈
(25)
где i – это количество опытов, проведенных экспертом.
Формула
(22) показывает, что средний шаг (
)
равноизменяющегося вариационного ряда
примерно равен значению шага (
или
…)
между рядом находящимися членами в
любой части этого ряда.
Для получения реальной модели исследуемого процесса, которая может получить прикладное значения, необходима организация специальных опытов, что целесообразно или необходимо осуществлять для дипломной или хоздоговорной работы.
В рамках учебной для формирования гипотезы вариационного ряда детерминированных значений выходного и входных факторов студенту достаточно воспользоваться excel-программой «Гипотеза ряда и модификация данных (n значений).xlsm», разработанной автором (она находится в компьютерном классе Г210).
В программе используются прикладной «Пакет анализа», используемый пользователями для выполнения инженерных исследований, объединенные в один программный комплекс макросами с автоматизированным набором выполняемых команд и интерфейсом ввода и анализа информации.
Работа программы на персональном компьютере обеспечивается выполнением пользователем следующих условий:
Система безопасности компьютера должна получить команду на запуск макроса.
В среде Microsoft Office 2007-10 это операция выполняется нажатием кнопки «Включить содержание» при первом запуске программы.
В противном случае появится сообщение –«Не удается выполнить макрос...». Если такое сообщение не появилось, то необходимо настроить систему безопасности.
- В среде Microsoft Office 2003 это операция выполняется нажатием
Установленная на ПК и функционирующая надстройка «Пакет анализа» с инструментом «Генерация случайных чисел».
Настройка макросов и функционирование надстройки «Пакет анализа» осуществляется пользователем в пункте «Параметры» вкладки «Файл». Более подробная информация находится в «Справке: Excel» (функциональная клавиша F1).
Программа обеспечивает ввод, обработку, корректировку и представление необходимой информации о входном и выходных факторах для использования в дальнейшем процессе проектирования статистической модели.
Порядок работы с программой «Гипотеза ряда и модификация данных (n значений).xlsm».
Выбор программы для работы с заданным преподавателем n-значений (15, 17 и 20 значений).
Входные факторы (с третьей до последней колонки).
Колонки таблицы заполняются для каждого из входных факторов с учетом характеристики принимаемых значений и в порядке их расположения (значимости). Для расчета студент также может воспользоваться excel-программой.
Если значения для установленной области изменения данного входного фактора имеют характеристику дискретного распределения с целочисленными значениями, то для этого применяется специально разработанная процедура расчета, которая расположена на листе «Дискретное (X)» программы «Гипотеза ряда модели.xls».
В
соответствие с инструкцией, располагаемой
левой части экрана ПК, пользователем
вводятся минимальное
(x1min)
и максимальное (x1max)
целочисленные значения из установленной
области для данного фактора в
соответствующие поля, отмеченные синим
цветом (см. пункт 1 Инструкции
на рисунке 6). Далее (согласно пункту 2)
нажатием кнопки «Расчет»
программой выполняется генерация 20
случайных чисел для указанной области.
В результате, в центральной части экрана
выводятся отсортированные значения
возрастающего вариационного ряда; они
представляются в табличной и графической
формах. Кроме этого выполняется расчет
средней величины шага(
),
а также текущего шага для парных значений
расчетного ряда.
Рисунок 6 − Выбор значений возрастающего вариационного ряда (дискретное распределение).
Пример.
Для
первого входного фактора модели (X1i),
вносятся натуральные значения минимальное
(x1min=
55)
и максимальное (x1max=
120)
(см. рисунок 6). Нажимается кнопка «Расчет»,
а результат 20-и значений вариационного
ряда выводится в табличной форме в
центральной области (желтого цвета)
экрана. Рядом со значениями входного
фактора располагаются величины шага
=
0,
=
1 и т.д., среднее значение ∆Хср=3,25.
Справа от табличного ряда располагается
легко
визуально анализируемое графическое
изображение полученного результата.
Ломаной линией темно-синего цвета (с
«Δ»
в местах пересечения с основной сеткой)
обозначается график анализируемого
входного фактора (X1i),
другой ломаной линией сиреневого цвета
(с «□»
в местах пересечения с основной сеткой)
обозначается график данных расчетного
шага (∆Хi).
Полученные таким образом 20 значений возрастающего вариационного ряда вносятся студентом в соответствующую колонку, заготовленной заранее таблицы (см. таблицу 5), данного входного фактора, для которого экспертом была установлена прямая взаимосвязь, выраженная символами «↑↑».
Процесс установления значений для убывающего вариационного ряда входного фактора, с установленной экспертом и выраженной символами «↑↓» обратной взаимосвязью, будет соответствовать приведенному выше примеру, за исключением момента внесения полученной информации в таблицу. Значения вносится в обратном порядке: для первого опыта максимальное значение, а затем следующие по порядку величины ряда к минимальному значению для последнего опыта.
Если значения для установленной области изменения входного фактора имеют характеристику равномерного распределения с дробными значениями, то в этом случае применяется другая процедура расчета, которая размещается на листе «Равномерное (Х)» программы «Гипотеза ряда модели.xlsm».
Порядок работы с этим разделом программы в целом соответствует порядку работы с «дискретным распределением», но имеет ряд дополнений и отличий, что указано в инструкции для пользователя. Дополнительно предусматривается предварительная оценка полученного расчетного ряда значений с учетом выполнения условия равенства последнего значения в ряду (Х15) с максимальным значением фактора (Хmax) корректировкой двух параметров. Один из них это поправочный коэффициент (kΔ) расчетного увеличивающегося шага (∆Хi), а второй параметр это количество десятичных разрядов, до которого необходимо округлить полученное число ηХ. Область значений kΔ находится в пределах [1,8…2], а ηХ может принимать только натуральные значения [1, 2, 3].
Таким образом, для каждого из факторов вводятся и рассчитываются величины статистического ряда и заполняются колонки таблицы - 5.
Если таблица по форме-шаблону заполнена, то студенту необходимо выполнить ее анализ и при необходимости модификацию данных, таким образом, чтобы величины полученных данных выходного и входных факторов должны быть соотносимо-значимыми. Это обеспечит удобство представления, а так же повысит возможность качества проведения последующей оценки результатов моделирования.
Модификация данных осуществляется путем выполнения двух условий: первое соотношение величины выходного фактора к средней величине каждого входного должно быть примерно равно - 10:1, а второе соотношение между величинами входных факторов должно примерно соответствовать - 1:1.
Эти условия обеспечиваются перенормированием исходных значений в таблице «Исходные данные для расчета статистической модели», применяя умножение на степенные коэффициенты - 10n, где n – показатель степени «модификации» исходных данных. Запись о модификации параметра осуществляется в заголовке новой (обязательно) таблицы под названием «Модифицированные исходные данные»
В результате такого действия величины вариационного ряда данных выходного показателя могут иметь, например, порядок десятков, а входных факторов порядок единиц.
Таблица − Исходные данные для расчета статистической модели
№ |
|
|
|
|
|
|
п/п |
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
