
- •4. Определение и выбор модели системы с учетом влияния различных факторов. (расчетно-графическая работа)
- •4.1. Теоретические основы работы. Постановка задачи
- •4.2. Линейная многофакторная модель
- •4.3. Корреляционный анализ многофакторных линейных и нелинейных моделей
- •4.4. Однофакторная нелинейная модель
- •4.5. Методика расчета коэффициентов уравнения с использованием параболы второй степени
- •4.6. Оценка тесноты связи между показателями
- •4.7. Выбор вида модели
- •4.7.1. Сравнение величины значений функции s для линейной и параболической регрессий
- •Проверка гипотезы об адекватности линейного уравнения реальной статистики по критерию Фишера
- •4.8 Корреляции измеряемых параметров
- •4.3. Содержание отчета по работе.
4. Определение и выбор модели системы с учетом влияния различных факторов. (расчетно-графическая работа)
4.1. Теоретические основы работы. Постановка задачи
Целью работы является определение аналитических зависимостей основного функционала системы F от различных факторов (показателей, параметров), влияющих на значение этой функции.
Основой для выполнения работы являются либо статистические, либо эксплуатационные (эмпирические) данные при функционировании конкретной системы.
Различают:
вероятностную,
функциональную,
регрессионную,
корреляционную зависимости F от различных параметров.
Множество корреляционных полей. Распределения значений (x, y) с соответствующими коэффициентами корреляций для каждого из них. Коэффициент корреляции отражает «зашумлённость» линейной зависимости (верхняя строка), но не описывает наклон линейной зависимости (средняя строка), и совсем не подходит для описания сложных, нелинейных зависимостей (нижняя строка). Для распределения, показанного в центре рисунка, коэффициент корреляции не определен, так как дисперсия y равна нулю.
Применение возможно при наличии достаточного количества наблюдений для изучения. На практике считается, что число наблюдений должно быть не менее, чем в 5-6 раз превышать число факторов (также встречается рекомендация использовать пропорцию не менее, чем в 10 раз превышающую количество факторов).
В случае, если число наблюдений превышает количество факторов в десятки раз, в действие вступает закон больших чисел, который обеспечивает взаимопогашение случайных колебаний.[13]
Необходимо, чтобы совокупность значений всех факторных и результативного признаков подчинялась многомерному нормальному распределению. В случае, если объём совокупности недостаточен для проведения формального тестирования на нормальность распределения, то закон распределения определяется визуально на основе корреляционного поля.
Если в расположении точек на этом поле наблюдается линейная тенденция, то можно предположить, что совокупность исходных данных подчиняется нормальному закону распределения.[14].
Исходная совокупность значений должна быть качественно однородной.[13]
Сам по себе факт корреляционной зависимости не даёт основания утверждать, что одна из переменных предшествует или является причиной изменений, или то, что переменные вообще причинно связаны между собой, а не наблюдается действие третьего фактора.
Область применения
Данный метод обработки статистических данных весьма популярен в экономике и социальных науках (в частности в психологии и социологии), хотя сфера применения коэффициентов корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия, гидробиология, биометрия и прочие. В различных прикладных отраслях приняты разные границы интервалов для оценки тесноты и значимости связи.
Популярность метода обусловлена двумя моментами:
- коэффициенты корреляции относительно просты в подсчете;
- их применение не требует специальной математической подготовки.
В сочетании с простотой интерпретации, простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных.
Регрессио́нный
(линейный)
анализ —
статистический
метод
исследования влияния одной или нескольких
независимых
переменных
на зависимую
переменную
.
Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные — критериальными.
Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения.
Очевидно, что если статистические данные более представительны, то на их изменение в меньшей степени влияют случайные факторы.
При выборе аналитического выражения связи показателей и критерия эффективности системы, отборе наиболее значимых факторов следует быть готовым к различным компромиссам.
Стремление к упрощению расчетов побуждает к использованию простейших линейных однофакторных зависимостей (зависящих от одной переменной), но это может привести к снижению обоснованности последующих расчетов.
Кроме этого, часто затруднена физическая, технологическая, экономическая интерпретация полученных коэффициентов регрессии.
Связь между факторами целесообразно проверять с помощью коэффициента парной корреляции. Если для двух факторов значение коэффициента превышает 0,75, то один из них в уравнение регрессии можно не включать.
Для сравнительной оценки различных уравнений целесообразно использовать, в качестве критерия выбора, корреляционное отношение.
Выполнение работы
Для выполнения данной расчетно-графической работы каждому студенту (слушателю) предлагаются индивидуальные исходные данные, которые включают 10 наблюдений искомой функции F для 28 вариантов при условии, что известны значения двух факторов (показателей, переменных) Х1 - и Х2, одинаковых для всех вариантов, представленных в таблице исходных данных.
42