Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metod_ukazania_Malozatratnye_tekhnologii_servis...doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
1.72 Mб
Скачать

4.5 Сбор (или выбор) статистических данных

Следующей задачей проведения исследований является целенаправленный сбор (или выбор) статистических данных для установленного количества входных (в рассматриваемом примере четырех) и одного выходного факторов. Такая задача может выполняться путем организации специальных опытов, в ходе которых фиксируются измерения искомых величин (например, хронометраж деятельности человека при выполнении технологического процесса) либо специальным анализом, собранных предварительно или выбранных из источников информации, данных о работе линейных предприятий железной дороги (отчетов).

Каждый из способов имеет как свои достоинства, так и недостатки и должен применяться в зависимости от поставленных перед исследователем цели и задач. Это важнейший этап в исследовании и от него во многом зависит корректность и адекватность проектируемой модели, он требует тщательной специальной подготовки проведения эксперимента экспертом-исследователем с точки зрения организационных, финансовых и технических средств.

Работа по сбору данных может начинаться во время прохождения летней производственной практики на линейных предприятиях железной дороги в конце четвертого курса обучения студентов. В этом случае у студента появляется возможность организовать специальные опыты по хронометрированию величин основных параметров исследуемого технологического процесса, предусмотренные программой практики на станции, отделении дороги. Такой подход обеспечивает получение адекватной и практически применимой математической модели, формируемой на реальных данных, для использования в существующих эксплуатационных условиях работы железнодорожного предприятия, но для этого необходимо заранее выполнить необходимые разделы данной работы и подготовить регистрационные формы и осуществить другие необходимые подготовительные операции.

В этом случае выбор статистических данных для учебной работы осуществляется на основе информации, собранной из отчетов или полученной в ходе поставленных экспериментов (не менее нескольких десятков), в виде вариационных рядов с данными входных и выходного параметров. Полученные данные группируются по признаку среднего отклонения величин в n-ое количество интервалов, которые в последствии становятся n-ми наблюдениями с изменяющимися величинами выходного параметра в зависимости от входных значений.

При другом подходе – когда работа выполняется во время учебного семестра, студент на основании ниже приведенных рекомендаций самостоятельно формирует корреляционное поле для расчета статистической модели. В этом случае могут достигаться только учебные цели (процесса анализа, проектирование модели, оценка результата), а вероятность получения прикладного результата – минимальна.

И в первом и во втором случаях студентом самостоятельно задается гипотеза значений вариационного ряда для каждого из входных, а также выходного факторов в виде случайной выборки данных из исследуемой области значений, установленной в ходе экспертизы, с учетом взаимосвязей и тенденцией к изменению характеристик объекта.

Для регистрации данных рекомендуется использовать форму-шаблон (см. таблицу 5). Таблица имеет структуру, соответствующую матрице исходных данных, которая будет использоваться (в дальнейшем) в процессе моделирования регрессионного уравнения программными средствами. Она составляется на основании экспертной характеристики (см. таблицу 4) взаимосвязей выходного фактора-функции с установленными входными факторами-аргументами.

Предварительный процесс предполагает подготовку регистрационной документа, составленного в виде таблице по форме-шаблону, с таким количеством колонок, которое обеспечивает внесение необходимой информации по избранным входным факторам (Xji), прошедших экспертную оценку и включаемых в модель. Количество колонок может рассчитываться по формуле: «количество входных факторов (М) плюс еще две единицы (одна из них это номер п/п, а вторая графа - для выходного фактора)».

Количество строк в таблице (они обязательно нумеруются) должно соответствовать количеству проведенных опытов, экспериментов (i) по измерению исследуемых факторов. В учебной работе для уменьшения времени на ввод информации достаточно сформировать вариационный ряд из 10…15 значений.

В заголовок каждой графы таблицы вносится информация о трех аспектах соответствующего фактора: буквенное обозначение, символьное обозначение характера влияния на выходной фактор (для выходного фактора указывается тенденция представления значений), а также область изменения значений в зависимости от установленной взаимосвязи (от min до max или наоборот).

Таблица 5 − Форма-шаблон таблицы исходных данных для расчета статистической модели

Yi, ↑,

X1i, ↑↓,

X2i, ↑↑,

X3i, ↑↓,

X4i, ↑↓,

XMi, ↑↑,

п/п

(ymin - ymax)

(x1max -x1min)

(x2min-x2max)

(x3max -x3min)

(x4min-x4max)

(xMmin-xMmax)

1

2

3

4

5

6

ymin

x1max

x2min

x3max

x4max

...

xMmin

  1. 1

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

15

ymax

x1min

x2max

x3min

x4min

...

xMmax

В каждой строке таблицы вносится информация о значениях величин, зафиксированных в одном опыте исследуемой функцией (Yi) под воздействием аргументов – значений входных факторов (Xji). Величины, принимаемые факторами, располагаются каждый в своей графе.

Для обоснования принципов формулирования гипотезы значений вариационного ряда, были использованы некоторые элементы аналитической алгебры и геометрии, а также проведенные автором исследования о расчетном шаге между случайными величинами ряда. Этот параметр вариационного ряда может характеризировать уровень знания исследователя о каждом из факторов - изученность свойства и характеристик поведения, установление нелинейности взаимосвязей между факторами.

Предположения о том, что свойства входных факторов могут характеризоваться изменяющимся шагом между рядом стоящими значениями, могут быть подтверждены ниже приведенными рассуждениями и продемонстрированы графиками для простых видов нелинейной функции, а также анализом расчетных значений, представленных в таблице 6. В исследовании данного механизма используется метод «от известного результата к неизвестному аргументу».

ДGroup 657 ля анализа указанной взаимосвязи используются три монотонно возрастающие функции f(x1) – линейная, f(x2), f(x3) – нелинейные выпуклая и вогнутая соответственно (см. рисунок 6 а). Для упрощения расчетов допускается, что значения каждой из функции равны при различных значениях аргументов, изменяющихся в пределах от 0 до 5. То есть для таких функций всегда найдутся аргументы, удовлетворяющие условию одного единственного решения. Так, к примеру, для аргументов при x1=1, x2=0,45, x3=2, их функции равны между собой у = f(x1) = f(x2) = f(x3)=1. Аналогичным образом может быть установлено указанное соответствие для любого другого значения функции. Это подтверждается данными, представленными в каждой строке таблицы 6, а также графиками на рисунке 6.

Рисунок 6 – Формирование гипотезы исходных значений входных

Для подтверждение гипотезы взаимосвязи вида нелинейных функций с расчетными величинами шага между входными значениями х1,= x(i+1), xi, как дополнительной характеристики состояния аргументов,

Расчет величины шага для любой пары чисел непрерывного возрастающего ряда выполняется по формуле:

х1,j = x1,(J+1) x1,J (22).

Если дискретный вариационный ряд данного входного фактора с возрастающей зависимостью имеет более трех значений, то расчетная величина шага между любой парой значений всегда будет находиться в пределах между максимальным и минимальным значениями аргументов и характеризуется следующим неравенством:

хmax,j > ∆хi,j > хmin,j (23).

Расчет средней величины шага с ∆хi,j,= Const линейной возрастающей функции выполняется по формуле:

(24)

где i – это количество опытов, проведенных экспертом.

С использованием формул (22-24), выполняется расчет показателей и анализ разницы дискретных значений для каждого из рассматриваемых факторов  x1, x2, x3, имеющих различные функциональные зависимости.

Первая функция f(x1) выступает в роли эталонной, она линейна и поэтому для значений указанных в графе 3 (таблицы 6) имеет одинаковую разницу (или расчетный шаг) между всеми расположенными рядом парами чисел, рассчитанную по формуле (22) и равную единице. Тогда ∆х1,1 = ∆х1,2 = ∆х1,3= ∆х1,4 = ∆х1,5=1. Для любого значения функции f(x1) для исследуемого подмножества области определения от 0 до 5 расчетный шаг имеет постоянное значение, равное среднему значению шага, а его отображение представлено на рисунке 6 (б).

Для нелинейной возрастающей выпуклой функции f(x2), величины расчетного шага для исследуемого подмножества области определения от 0 до 5, рассчитанные по формуле (22) имеют тенденцию к возрастанию (к тому же нелинейную), а для нелинейной возрастающей вогнутой функции f(x3), наблюдается тенденция к убыванию значений в зависимости от возрастания функции. Это наглядно демонстрируется данными таблицы 6 (графа 6) и графическим отображением ∆х2 и ∆х3 на рисунке 6 б.

Таблица 6 – Исследование расчетных шага значений аргументов

у=f(xi)

х1, ↑↑

х1

х2, ↑↑∩

х2,↑

х3,↑↑U

х3,↓

(0 -5)

(0 - 5)

Const

(0-5)

(0,45-2)

(0-5)

(2-0,5)

0

0

-

0

-

0

-

1

1

1

0,45

0,45

2

2

2

2

1

1

0,55

3,2

1,2

3

3

1

1,8

0,8

3,94

0,74

4

4

1

3

1,2

4,5

0,56

5

5

1

5

2

5

0,5


В результате проведенных исследований можно сделать вывод о том, если простая нелинейная монотонная (или дискретная) возрастающая функция имеет выпуклый вид на отрезке изменения величин исследуемой области, то расчетный шаг может принимать величины от минимальных к максимальным значениям, и является одной из объективных характеристик исследуемой функции. Если же возрастающая нелинейная функция имеет вогнутый вид (это может отражаться символами «U↑»), то шаг между значениями аргументов в начале ряда может иметь наоборот большую величину и уменьшаться к концу исследуемой области до минимальной величины.

К указанному, следует добавить, что установлена также взаимосвязь крутизны исследуемой функции и соотношения величин максимального и минимального расчетного шага: чем выше соотношение расчетного шага краевых аргументов исследуемой области, тем выпуклость функции имеет большие величины.

Аналогичным или иным способами студентом могут быть проведены собственные исследования применительно и к анализу других элементарных функциональных убывающих или возрастающих зависимостей (параболы, гиперболы и т.д.), что позволит еще расширить знания эксперта. А полученный результат может быть положен в основу дальнейших рассуждений при выборе и анализе статистических данных из подмножества области определения для входных факторов регрессионного уравнения.

Для практической реализации проведенных исследований и выполнения задачи по формированию статистического ряда данных разработаны различные специальные процедуры, которые могут использоваться студентом, для установления гипотезы данных для выходного и входных факторов с последующим внесение их в заранее заготовленную таблицу.

Входной фактор (вторая графа таблицы).

Колонка заполняется величинами вариационного ряда из исследуемого диапазона от ymin.до.ymax, которые принимает выходной фактор (Yi). В первой строке вписывается минимальное значение (ymin), а в последней – максимальное значение (ymax). В промежуточные строки (между первой и последней строкой) вносятся данные из вариационного ряда, который формируется цикловым расчетом значений, располагаемых между собой с некоторым не строго выдерживаемым средним шагом (∆), но с тенденцией увеличения значений ряда.

Расчет средней величины шага с yср = Const линейной возрастающей функции выполняется по формуле аналогичной формуле (22):

≈…≈ (25)

где i – это количество опытов, проведенных экспертом.

Формула (22) показывает, что средний шаг ( ) равноизменяющегося вариационного ряда примерно равен значению шага ( или …) между рядом находящимися членами в любой части этого ряда.

Для получения реальной модели исследуемого процесса, которая может получить прикладное значения, необходима организация специальных опытов, что целесообразно или необходимо осуществлять для дипломной или хоздоговорной работы.

В рамках учебной для формирования гипотезы вариационного ряда детерминированных значений выходного и входных факторов студенту достаточно воспользоваться excel-программой «Гипотеза ряда и модификация данных (n значений).xlsm», разработанной автором (она находится в компьютерном классе Г210).

В программе используются прикладной «Пакет анализа», используемый пользователями для выполнения инженерных исследований, объединенные в один программный комплекс макросами с автоматизированным набором выполняемых команд и интерфейсом ввода и анализа информации.

Работа программы на персональном компьютере обеспечивается выполнением пользователем следующих условий:

  1. Система безопасности компьютера должна получить команду на запуск макроса.

  • В среде Microsoft Office 2007-10 это операция выполняется нажатием кнопки «Включить содержание» при первом запуске программы.

В противном случае появится сообщение –«Не удается выполнить макрос...». Если такое сообщение не появилось, то необходимо настроить систему безопасности.

- В среде Microsoft Office 2003 это операция выполняется нажатием

  1. Установленная на ПК и функционирующая надстройка «Пакет анализа» с инструментом «Генерация случайных чисел».

Настройка макросов и функционирование надстройки «Пакет анализа» осуществляется пользователем в пункте «Параметры» вкладки «Файл». Более подробная информация находится в «Справке: Excel» (функциональная клавиша F1).

Программа обеспечивает ввод, обработку, корректировку и представление необходимой информации о входном и выходных факторах для использования в дальнейшем процессе проектирования статистической модели.

Порядок работы с программой «Гипотеза ряда и модификация данных (n значений).xlsm».

  1. Выбор программы для работы с заданным преподавателем n-значений (15, 17 и 20 значений).

Входные факторы (с третьей до последней колонки).

Колонки таблицы заполняются для каждого из входных факторов с учетом характеристики принимаемых значений и в порядке их расположения (значимости). Для расчета студент также может воспользоваться excel-программой.

Если значения для установленной области изменения данного входного фактора имеют характеристику дискретного распределения с целочисленными значениями, то для этого применяется специально разработанная процедура расчета, которая расположена на листе «Дискретное (X)» программы «Гипотеза ряда модели.xls».

В соответствие с инструкцией, располагаемой левой части экрана ПК, пользователем вводятся минимальное (x1min) и максимальное (x1max) целочисленные значения из установленной области для данного фактора в соответствующие поля, отмеченные синим цветом (см. пункт 1 Инструкции на рисунке 6). Далее (согласно пункту 2) нажатием кнопки «Расчет» программой выполняется генерация 20 случайных чисел для указанной области. В результате, в центральной части экрана выводятся отсортированные значения возрастающего вариационного ряда; они представляются в табличной и графической формах. Кроме этого выполняется расчет средней величины шага( ), а также текущего шага для парных значений расчетного ряда.

Рисунок 6 − Выбор значений возрастающего вариационного ряда (дискретное распределение).

Пример.

Для первого входного фактора модели (X1i), вносятся натуральные значения минимальное (x1min= 55) и максимальное (x1max= 120) (см. рисунок 6). Нажимается кнопка «Расчет», а результат 20-и значений вариационного ряда выводится в табличной форме в центральной области (желтого цвета) экрана. Рядом со значениями входного фактора располагаются величины шага = 0, = 1 и т.д., среднее значение Хср=3,25. Справа от табличного ряда располагается легко визуально анализируемое графическое изображение полученного результата. Ломаной линией темно-синего цвета (с «Δ» в местах пересечения с основной сеткой) обозначается график анализируемого входного фактора (X1i), другой ломаной линией сиреневого цвета (с «» в местах пересечения с основной сеткой) обозначается график данных расчетного шага (Хi).

Полученные таким образом 20 значений возрастающего вариационного ряда вносятся студентом в соответствующую колонку, заготовленной заранее таблицы (см. таблицу 5), данного входного фактора, для которого экспертом была установлена прямая взаимосвязь, выраженная символами «↑↑».

Процесс установления значений для убывающего вариационного ряда входного фактора, с установленной экспертом и выраженной символами «↑↓» обратной взаимосвязью, будет соответствовать приведенному выше примеру, за исключением момента внесения полученной информации в таблицу. Значения вносится в обратном порядке: для первого опыта  максимальное значение, а затем следующие по порядку величины ряда к минимальному значению  для последнего опыта.

Если значения для установленной области изменения входного фактора имеют характеристику равномерного распределения с дробными значениями, то в этом случае применяется другая процедура расчета, которая размещается на листе «Равномерное (Х)» программы «Гипотеза ряда модели.xlsm».

Порядок работы с этим разделом программы в целом соответствует порядку работы с «дискретным распределением», но имеет ряд дополнений и отличий, что указано в инструкции для пользователя. Дополнительно предусматривается предварительная оценка полученного расчетного ряда значений с учетом выполнения условия равенства последнего значения в ряду (Х15) с максимальным значением фактора (Хmax) корректировкой двух параметров. Один из них  это поправочный коэффициент (kΔ) расчетного увеличивающегося шага (Хi), а второй параметр  это количество десятичных разрядов, до которого необходимо округлить полученное число  ηХ. Область значений kΔ находится в пределах [1,8…2], а ηХ может принимать только натуральные значения [1, 2, 3].

Таким образом, для каждого из факторов вводятся и рассчитываются величины статистического ряда и заполняются колонки таблицы - 5.

Если таблица по форме-шаблону заполнена, то студенту необходимо выполнить ее анализ и при необходимости модификацию данных, таким образом, чтобы величины полученных данных выходного и входных факторов должны быть соотносимо-значимыми. Это обеспечит удобство представления, а так же повысит возможность качества проведения последующей оценки результатов моделирования.

Модификация данных осуществляется путем выполнения двух условий: первое  соотношение величины выходного фактора к средней величине каждого входного должно быть примерно равно - 10:1, а второе  соотношение между величинами входных факторов должно примерно соответствовать - 1:1.

Эти условия обеспечиваются перенормированием исходных значений в таблице «Исходные данные для расчета статистической модели», применяя умножение на степенные коэффициенты - 10n, где n – показатель степени «модификации» исходных данных. Запись о модификации параметра осуществляется в заголовке новой (обязательно) таблицы под названием «Модифицированные исходные данные»

В результате такого действия величины вариационного ряда данных выходного показателя могут иметь, например, порядок десятков, а входных факторов порядок единиц.

Таблица − Исходные данные для расчета статистической модели

п/п

1

2

3

4

5

6

7

  1. 1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]