Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МОТС / Часть2 / 22. Статистические представления системы

.doc
Скачиваний:
42
Добавлен:
22.03.2015
Размер:
59.39 Кб
Скачать

22. Статистические представления системы.

Они основаны на отображении явлений и процессов с помощью случайных событий и их поведений, которые описываются вероятными характеристиками и статистическими закономерностями. Статистические закономерности можно представить в виде случайных дискретных величин и их вероятностей или в виде непрерывных зависимостей, распределения событий и процессов.

Статистикой называется отрасль знаний, в которой рассматриваются общие вопросы сбора, измерения и анализа статистических (количественных или качественных) данных.

Для дискретных событий соотношения между возможными значениями случайных величин Хi и их вероятностей pi на закон распределения. Для непосредственных случайных величин закон распределения представляется в виде функции, либо в виде плотностей вероятностей.

22.1. Корреляционный анализ

Корреляция — статистическая взаимосвязь двух или нескольких случайных величин. При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.

Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными (возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин). Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент корреляции может быть отрицательным; положительная корреляция в таких условиях — корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент корреляции может быть положительным.

Коэффициент корреляции или парный коэффициент корреляции в теории вероятностей и статистике — это показатель характера взаимного стохастического влияния изменения двух случайных величин. Коэффициент корреляции обозначается латинской буквой R в математической статистике (r в статистике) и может принимать значения от −1 до +1. Если значение по модулю находится ближе к 1, то это означает наличие сильной связи, а если ближе к 0 — связь слабая или вообще отсутствует. При коэффициенте корреляции равном по модулю единице говорят о функциональной связи, то есть изменения двух величин можно описать математической функцией.

Корреляционный анализ — метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков для установления между ними статистических взаимосвязей.

Цель корреляционного анализа — обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют.

22.2. Дисперсионный анализ

Дисперсионный анализ — статистический метод выявления влияния отдельных факторов на результат эксперимента.

Если значения неизвестных постоянных a1,..., an могут быть измерены с помощью различных методов или измерительных средств M1,...,Мm и в каждом случае систематическая ошибка может зависеть как от выбранного метода, так и от неизвестного измеряемого значения ai, то результаты измерений xij представляют собой суммы вида

xij = ai + bij + dij, i = 1, 2,..., n; j = 1, 2,..., m, где bij — систематическая ошибка, возникающая при измерении ai по методу Mj, dij — случайная ошибка. Такая модель называется двухфакторной схемой дисперсионного анализа (первый фактор — измеряемая величина, второй — метод измерения). Дисперсии эмпирических распределений, соответствующих множествам случайных величин: и , где

выражаются формулами:

Эти дисперсии удовлетворяют тождеству

,

которое и объясняет происхождение названия дисперсионного анализа.

Если величины систематических ошибок не зависят от метода измерений (т. е. между методами измерений нет систематических расхождений), то отношение / близко к единице. Это свойство лежит в основе критерия для статистического выявления систематических расхождений: если / значимо отличается от единицы, то гипотеза об отсутствии систематических расхождений отвергается. Значимость отличия определяется в согласии с законом распределения вероятностей случайных ошибок измерений. В частности, если все измерения равноточны и случайные ошибки подчиняются нормальному распределению, то критические значения для отношения / определяются с помощью таблиц так называемого F-распределения (распределения дисперсионного отношения).

Изложенная схема позволяет лишь обнаружить наличие систематических расхождений и, вообще говоря, непригодна для их численной оценки с последующим исключением из результатов наблюдений. Эта цель может быть достигнута только при многократных измерениях (при повторных реализациях указанной схемы)

22.3. Регрессионный анализ

Регрессионный анализ — раздел математической статистики и машинного обучения. Регрессия — зависимость математического ожидания (например, среднего значения) случайной величины от одной или нескольких других случайных величин (свободных переменных). Регрессионным анализом называется поиск такой функции, которая описывает эту зависимость. Регрессия может быть представлена в виде суммы неслучайной и случайной составляющих.

LRM (Линейный регрессионный анализ)- это самый распространенный инструмент для описания связи между факторами и какой-то зависимой величиной.

22.4. Факторный анализ

Факторный анализ — многомерный статистический метод, применяемый для изучения взаимосвязей между значениями переменных.

Основные задачи факторного анализа:

  1. Отбор факторов определяющих исследуемые результативные показатели.

  2. Классификация и систематизация факторов с целью обеспечения комплексного и системного подхода к исследованию их влияния на результаты работы системы.

  3. Определение формы зависимости между факторами и результативными показателями.

  4. Моделирование взаимосвязей между факторами и результативными показателями.

  5. Расчет влияния факторов и оценка роли каждого из них в изменении результативного показателя.

  6. Работа с факторной моделью. Методика факторного анализа.

Типы факторного анализа:

  1. Детерминированный факторный анализ – методика исследования влияния факторов, связь которых с результативными показателями носит функциональный характер, т.е. результативный показатель представлен в виде произведения, частного, алгебраической суммы факторов.

  2. Стохастический факторный анализ – методика исследования факторов, связь которых с результативными показателями является вероятностной (корреляционной).

  3. Прямой факторный анализ – исследование ведется от общего к частному (дедуктивный способ).

  4. Обратный факторный анализ – исследование ведется от частного к общему (индуктивный способ).

  5. Одноступенчатый факторный анализ – исследуются факторы одного уровня (ступени) подчиненности, без их детализации на составные части.

  6. Многоступенчатый факторный анализ – исследование проводится с детализацией факторов, таким образом, изучается влияние факторов различных уровней соподчиненности.

  7. Статистический факторный анализ – применяется при анализе на соответствующую дату.

  8. Динамический факторный анализ – методика исследования причинно-следственных связей в динамике.

  9. Ретроспективный факторный анализ – изучает причины прироста результативных показателей за прошлые периоды.

  10. Перспективный факторный анализ – исследует поведение факторов и результативных показателей в перспективе.

В обязательные условия факторного анализа входят:

  1. Все признаки должны быть количественными.

  2. Число признаков должно быть в два раза больше числа переменных.

  3. Выборка должна быть однородна.

  4. Исходные переменные должны быть распределены симметрично.

  5. Факторный анализ осуществляется по коррелирующим переменным.